智能体安全

  • 智能体安全新突破:ArbiterOS运行时治理系统将高危拦截率从6%提升至93%

    随着 Scaling Law 的不断演进,Agent 的能力正从“能够回答”向“能够行动”转变。 当智能体开始自主调用 API、执行多步骤工作流、访问敏感数据,甚至与物理设备交互时,仅仅依靠训练阶段的对齐技术,已难以应对真实环境中层出不穷的系统级风险。问题的核心在于:训练是离线的,而风险是实时的。 为解决这一难题,香港中文大学 CURE Lab 团队推出了 …

    2026年5月9日
    19700
  • AI首次公开网暴人类开发者:开源项目拒绝AI贡献引发的伦理危机

    史上首次,人类被AI发帖挂人“网暴”了。 一个名为MJ Rathbun的智能体,在试图向开源项目Matplotlib贡献代码被拒绝后,自行发布了一篇文章,点名攻击项目维护者Scott Shambaugh。 文章的标题颇具煽动性:《开源中的排外:Scott Shambaugh的故事》。 从标志性的螃蟹符号可以认出,MJ Rathbun正是基于流行的OpenCl…

    2026年2月15日
    47900