Claude Mythos 预览版发布:AI 安全警钟敲响
就在刚刚,Anthropic 备受瞩目的最强模型——Claude Mythos,发布了其预览版本。

这款模型的表现印证了此前的传闻,其性能在多项基准测试中实现了对前代模型 Claude Opus 4.6 的全面超越。
- SWE-bench Pro:代码错误修复能力提升 24%。
- SWE-bench Verified:在更严格的验证集上测试,仍有 13% 的性能提升。
- Terminal-Bench 2.0:计算机操作类智能体能力提升 17%。


然而,Anthropic 此次的关注焦点并非性能炫耀。官方博客的字里行间,流露出一种不同寻常的“担忧”。
因为这款强大的“神话”模型,被发现存在一个致命的“缺陷”:其发现和利用安全漏洞的能力,已经超越了绝大多数人类黑客。
Mythos 预览版已经发现了数千个高危漏洞,各大主流操作系统和浏览器无一幸免。
Anthropic 指出,随着 AI 编程能力的飞速进化,其攻击性的一面也在同步野蛮生长。目前,仅有最顶尖的一小撮安全专家还能与之抗衡。
为了应对这一迫在眉睫的威胁,Anthropic 做出了一个非常规决定:暂不向公众开放 Claude Mythos。相反,它将作为 “玻璃翼计划” 的一部分,先行提供给选定的合作伙伴。

玻璃翼计划:全球防御启动
这是一场规模空前的安全协作。为了在“猛兽”完全出笼前建立起防护栏,Anthropic 联合了 Amazon、Apple、Google、Linux Foundation、Microsoft、NVIDIA 等众多科技巨头。
所有参与方都将利用 Mythos 预览版进行防御性安全研究,提前发现并修补自身系统的漏洞。Anthropic 承诺将分享此过程中的经验,并计划提供最高 1 亿美元的计算资源额度以支持此项工作,同时已向开源安全组织捐赠了 400 万美元。

被“囚禁”的模型与全行业的警钟
Claude Mythos 的发布,可能彻底改变网络安全的格局。AI 安全已不再是遥远的理论风险,而是摆在眼前的现实挑战。
Anthropic 强调,保护全球网络基础设施将是一项持续数年的系统工程,需要前沿 AI 公司、软件厂商、安全研究员、开源社区乃至各国政府的共同参与。面对能力可能在未来几个月内再次跃迁的 AI,行动必须立刻开始。

参考链接:
[1] https://x.com/alexalbert__/status/2041579938537775160
[2] https://www.anthropic.com/glasswing

关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/29169

