AI安全评估

  • CyberGym:从实验室游戏到实战检验——AI安全评估的范式革命

    在人工智能技术加速渗透软件安全领域的当下,一个根本性挑战日益凸显:如何科学评估AI智能体在真实复杂网络环境中的安全防御能力?传统评估框架往往陷入“纸上谈兵”的困境,难以反映工业级代码库中漏洞的隐蔽性与复杂性。近日,加州大学伯克利分校研究团队发布的CyberGym框架,基于188个开源项目的1507个真实漏洞构建了首个大规模实战化评估平台,标志着AI安全评估从…

    2025年6月20日
    200