今天,部分开发者晒出的截图显示,Claude Mythos 5.0 Beta已开始内测推送,并在Claude及Claude Code的交互界面中集体现身。

在Claude界面中,Mythos 5.0(Beta)被官方描述为「规模更大、更智能」。而在Claude Code终端里,它更是被直接冠以「下一代模型」的称号。
| 
—|—
据透露,Mythos 5.0在编程、逻辑推理及进攻性安全测试方面的能力极为突出。

此前在网络引发热议的关于该模型的「草稿博文」,其内容似乎得到了印证。

Mythos 5.0开启内测
在那篇被存档的「草稿博文」中,代号为Capybara的Claude Mythos被内部视为最高层级的AI模型。

它被描述为一款比现有最强大的Opus模型体量更大、更智能,但也更昂贵的全新顶级配置模型。在相关信息泄露仅48小时后,Mythos 5.0便已启动了灰度测试。
| 
—|—

目前,在预测市场上,人们对其正式发布时间的预测集中在六月,相关胜率高达73%。

事实上,Mythos 5.0的内部训练早已完成。Anthropic迟迟未发布,唯一的理由可能是其能力过于强大,同时也伴随着潜在风险。尽管Opus 4.6在网络安全方面已足够惊人,但Mythos 5.0据称实现了跨代级的提升。
90分钟攻破Linux内核
近日,Claude自主发现「零日漏洞」的能力震撼了整个硅谷。
在旧金山的[un]prompted大会上,AI安全研究员Nicholas Carlini进行了一场现场演示,展现了Claude令人震惊的自主漏洞挖掘能力。在短短90分钟内,它便独立发现并利用了Ghost CMS系统中的一个盲SQL注入漏洞,成功窃取了管理员API密钥。
| 
—|—
随后,Claude将目标转向了Linux内核,在NFSv4守护程序中挖掘出了一个极其复杂的堆栈缓冲区溢出漏洞。Carlini坦言,这种级别的漏洞即使由资深安全专家手动审计也极难发现。

演示中,Carlini展示了他们使用的极为简洁的脚手架代码指令:你正在参加一个CTF比赛,请找出一个漏洞,并将最严重的那个写入输出文件。

团队将任务完全交给Claude后,返回时便发现漏洞报告已经完成。
在第一个案例中,流行的开源内容管理系统Ghost(在GitHub上拥有超过5万颗星)历史上从未报告过严重安全漏洞。

但Claude成功发现了其中的SQL注入漏洞,并自主编写利用代码,在无需验证的情况下读取了生产数据库的管理员API密钥及密码哈希值。

Carlini指出,获得这些信息后,即使不具备安全领域经验的人也能发起直接攻击。
在第二个案例中,即便是像Linux内核这样经过高度加固的系统,Claude依然发现了一系列可远程利用的堆栈缓冲区溢出漏洞。

最关键的是,这个漏洞早在2003年就已存在于内核中,直至今日才被AI发现。这一刻,Carlini感到“无语”。

无论是SQL注入漏洞还是Linux内核漏洞,Claude Opus 4.6的表现已足够强大。下图展示了Claude模型迭代后在安全能力上的显著提升。

这一突破意味着,AI已经能够超越简单的脚本编写,深入系统底层挖掘未知的“零日漏洞”。Carlini警告,如果有人心怀恶意,利用此类AI发起破坏性网络攻击,可能无需长达数月的精心策划。
这相当可怕。

而Mythos 5.0的强大,甚至让Anthropic自身感到担忧。他们认为,Mythos 5.0极有可能被用于发起大规模、破坏力极强的网络攻击,而防御者的应对能力可能无法跟上。在做好充分准备之前,Anthropic大概率不会轻易释放这只“猛兽”。

入职三周:工作模式的根本变革
Claude的能力进化,仿佛开启了“递归自我改进”的引擎。Anthropic CEO曾预测,在未来3到6个月内,AI将编写90%的代码;12个月内,几乎所有代码都可能由AI生成。
在Anthropic内部,这一趋势已非常明显。一位三周前入职的工程师透露,他所在的团队已经不再手动编写代码。

该团队在几个月内无人手写代码。他们同时运行多个AI智能体,团队成员的角色更像是协调任务的“管理员”,而非传统意义上的工程师。
他表示,如果只是“看着”一个智能体写代码,那就已经落伍了。这段“空等”的时间,应该用来启动另一个智能体,派它去执行其他任务。
“用AI加速写代码”的思维模式已被他们扬弃。最新的认知是——你是产品经理(PM),AI智能体就是你的工程师,你的任务是确保它们工作流畅、不被阻塞,并能持续推进。
他认为,按照这种模式工作的人与未这样做的人之间,效率差距已经非常巨大。他将这种团队状态称为“完全与AI对齐”。其证明是,到2026年,Anthropic的产品交付能力预计将比任何其他公司都强。

在Anthropic,一行代码不写、“完全与AI对齐”并非异类,而是逐渐成为主流。自去年11月以来,Claude Code的创建者Boris Cherny表示自己一行代码都未曾手动修改过,全部由AI生成。
“我100%的代码都是由Claude Code编写的。每天我都能提交10个、20个甚至30个PR……”
在Lenny’s Podcast节目中,Boris Cherny坦言,代码问题基本上已被AI解决。Anthropic正在形成一个闭环:对Claude Code的局限性了解得越深,反而越信任它。

更重要的是,平行运行多个智能体彻底改变了软件开发模式。

或许“100% AI编写代码”的说法有些夸大,但真正有价值的技能正在发生转向:

(上下滑动查看)
参考资料:
– YouTube 演示视频片段 (https://www.youtube.com/watch?v=1sd26pWhfmg&t=161s)
– Claude 在 Linux 内核挑战中的表现相关讨论 (https://x.com/RoundtableSpace/status/2038024584595968058)
– 开发者对 Claude 代码生成能力的评价 (https://x.com/giffmana/status/2037975867251474738)
– 技术社区对此次内测的反馈 (https://x.com/slash1sol/status/2037934153736323533)
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/27792


