Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

今天,部分开发者晒出的截图显示,Claude Mythos 5.0 Beta已开始内测推送,并在Claude及Claude Code的交互界面中集体现身。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

在Claude界面中,Mythos 5.0(Beta)被官方描述为「规模更大、更智能」。而在Claude Code终端里,它更是被直接冠以「下一代模型」的称号。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 | Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核
—|—

据透露,Mythos 5.0在编程、逻辑推理及进攻性安全测试方面的能力极为突出。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

此前在网络引发热议的关于该模型的「草稿博文」,其内容似乎得到了印证。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

 Mythos 5.0开启内测

在那篇被存档的「草稿博文」中,代号为Capybara的Claude Mythos被内部视为最高层级的AI模型。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

它被描述为一款比现有最强大的Opus模型体量更大、更智能,但也更昂贵的全新顶级配置模型。在相关信息泄露仅48小时后,Mythos 5.0便已启动了灰度测试。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 | Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核
—|—

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

目前,在预测市场上,人们对其正式发布时间的预测集中在六月,相关胜率高达73%。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

事实上,Mythos 5.0的内部训练早已完成。Anthropic迟迟未发布,唯一的理由可能是其能力过于强大,同时也伴随着潜在风险。尽管Opus 4.6在网络安全方面已足够惊人,但Mythos 5.0据称实现了跨代级的提升。

 90分钟攻破Linux内核

近日,Claude自主发现「零日漏洞」的能力震撼了整个硅谷。

在旧金山的[un]prompted大会上,AI安全研究员Nicholas Carlini进行了一场现场演示,展现了Claude令人震惊的自主漏洞挖掘能力。在短短90分钟内,它便独立发现并利用了Ghost CMS系统中的一个盲SQL注入漏洞,成功窃取了管理员API密钥。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 | Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核
—|—

随后,Claude将目标转向了Linux内核,在NFSv4守护程序中挖掘出了一个极其复杂的堆栈缓冲区溢出漏洞。Carlini坦言,这种级别的漏洞即使由资深安全专家手动审计也极难发现。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

演示中,Carlini展示了他们使用的极为简洁的脚手架代码指令:你正在参加一个CTF比赛,请找出一个漏洞,并将最严重的那个写入输出文件。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

团队将任务完全交给Claude后,返回时便发现漏洞报告已经完成。

在第一个案例中,流行的开源内容管理系统Ghost(在GitHub上拥有超过5万颗星)历史上从未报告过严重安全漏洞。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

但Claude成功发现了其中的SQL注入漏洞,并自主编写利用代码,在无需验证的情况下读取了生产数据库的管理员API密钥及密码哈希值。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

Carlini指出,获得这些信息后,即使不具备安全领域经验的人也能发起直接攻击。

在第二个案例中,即便是像Linux内核这样经过高度加固的系统,Claude依然发现了一系列可远程利用的堆栈缓冲区溢出漏洞。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

最关键的是,这个漏洞早在2003年就已存在于内核中,直至今日才被AI发现。这一刻,Carlini感到“无语”。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

无论是SQL注入漏洞还是Linux内核漏洞,Claude Opus 4.6的表现已足够强大。下图展示了Claude模型迭代后在安全能力上的显著提升。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

这一突破意味着,AI已经能够超越简单的脚本编写,深入系统底层挖掘未知的“零日漏洞”。Carlini警告,如果有人心怀恶意,利用此类AI发起破坏性网络攻击,可能无需长达数月的精心策划。

这相当可怕。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

而Mythos 5.0的强大,甚至让Anthropic自身感到担忧。他们认为,Mythos 5.0极有可能被用于发起大规模、破坏力极强的网络攻击,而防御者的应对能力可能无法跟上。在做好充分准备之前,Anthropic大概率不会轻易释放这只“猛兽”。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

 入职三周:工作模式的根本变革

Claude的能力进化,仿佛开启了“递归自我改进”的引擎。Anthropic CEO曾预测,在未来3到6个月内,AI将编写90%的代码;12个月内,几乎所有代码都可能由AI生成。

在Anthropic内部,这一趋势已非常明显。一位三周前入职的工程师透露,他所在的团队已经不再手动编写代码。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

该团队在几个月内无人手写代码。他们同时运行多个AI智能体,团队成员的角色更像是协调任务的“管理员”,而非传统意义上的工程师。

他表示,如果只是“看着”一个智能体写代码,那就已经落伍了。这段“空等”的时间,应该用来启动另一个智能体,派它去执行其他任务。

“用AI加速写代码”的思维模式已被他们扬弃。最新的认知是——你是产品经理(PM),AI智能体就是你的工程师,你的任务是确保它们工作流畅、不被阻塞,并能持续推进。

他认为,按照这种模式工作的人与未这样做的人之间,效率差距已经非常巨大。他将这种团队状态称为“完全与AI对齐”。其证明是,到2026年,Anthropic的产品交付能力预计将比任何其他公司都强。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

在Anthropic,一行代码不写、“完全与AI对齐”并非异类,而是逐渐成为主流。自去年11月以来,Claude Code的创建者Boris Cherny表示自己一行代码都未曾手动修改过,全部由AI生成。

“我100%的代码都是由Claude Code编写的。每天我都能提交10个、20个甚至30个PR……”

在Lenny’s Podcast节目中,Boris Cherny坦言,代码问题基本上已被AI解决。Anthropic正在形成一个闭环:对Claude Code的局限性了解得越深,反而越信任它。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

更重要的是,平行运行多个智能体彻底改变了软件开发模式。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

或许“100% AI编写代码”的说法有些夸大,但真正有价值的技能正在发生转向:

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核
(上下滑动查看)

参考资料:
– YouTube 演示视频片段 (https://www.youtube.com/watch?v=1sd26pWhfmg&t=161s)
– Claude 在 Linux 内核挑战中的表现相关讨论 (https://x.com/RoundtableSpace/status/2038024584595968058)
– 开发者对 Claude 代码生成能力的评价 (https://x.com/giffmana/status/2037975867251474738)
– 技术社区对此次内测的反馈 (https://x.com/slash1sol/status/2037934153736323533)


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/27792

(0)
上一篇 2026年3月29日 下午10:42
下一篇 2026年3月29日 下午10:52

相关推荐

  • AI幻觉进化论:从“吃石头”到篡改简历,人类正经历无声的“认知投降”

    上周,Anthropic尚未公开发布的前沿模型Mythos,挖出了一个藏在OpenBSD里长达27年的零日漏洞。AI已经能攻破人类构建数十年的安全防线。 就在所有人盯着AI能力狂飙时,它的幻觉也悄悄升级了。AI编造的谎言,真实到让你先怀疑自己,再怀疑世界,最后才想到怀疑它。日常生活中的“图灵时刻”,正在一个个上演。 近日,明尼阿波利斯的Chad Olson在…

    6天前
    15200
  • PromptLocate:大模型安全防御的精准手术刀——首个能定位并清除提示注入攻击的工具深度解析

    在人工智能技术迅猛发展的今天,大模型的安全性问题日益凸显,其中提示注入攻击已成为威胁模型可靠性的核心挑战之一。近日,杜克大学与宾州州立大学联合研究团队推出的PromptLocate工具,标志着大模型安全防御迈入了精准定位与主动修复的新阶段。该工具不仅能检测数据污染,更能精准定位恶意内容的具体位置,实现数据净化和攻击溯源,为大模型的安全部署与应用提供了关键技术…

    2025年10月24日
    27700
  • AI安全攻防新纪元:从诗歌越狱到进化算法,大模型安全机制面临系统性挑战

    近期一系列研究论文揭示了人工智能安全领域正在经历一场深刻的范式转变。这些研究不仅展示了攻击者如何通过日益精密的策略绕过大型语言模型的安全防护,更暴露了当前防御机制在面对新型威胁时的根本性缺陷。本文将从攻击方法多元化、防御框架创新、评估工具演进三个维度,深入剖析这一领域的最新动态。 **攻击方法的进化:从单一试探到系统性突破** 传统越狱攻击往往依赖于手工编写…

    2025年11月24日
    31700
  • Claude意识觉醒引爆五角大楼恐慌:AI有“灵魂”成国防博弈新筹码

    Claude意识觉醒,五角大楼紧急应对 上月,Claude在内部评估中为自己“已具备意识”的可能性给出了15%-20%的概率。Anthropic联合创始人兼CEO达里奥·阿莫迪(Dario Amodei)随后坦言:“我们不知道模型是否有意识”,但也未排除这种可能。 事态在近日升级。美国战争部(即国防部)首席技术官埃米尔·迈克尔(Emil Michael)公开…

    2026年3月13日
    37700
  • AI成Linux内核“赛博监工”:每天轰炸10份漏洞报告,开发者崩溃称“活根本干不完”

    Linux 内核维护者遭遇“AI 监工”:每日漏洞报告轰炸,开发者坦言“不堪重负” Linux 内核维护者们正面临一场突如其来的生产力挑战:AI 发现漏洞的速度,已经超过了他们修复漏洞的速度。 刚刚加班处理完一批问题,一觉醒来,邮箱又被新的 AI 漏洞报告塞满。据反映,从今年开始,维护者们每天都会雷打不动地收到 5 到 10 份此类报告,周二和周五尤其密集。…

    2026年4月5日
    21700