Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

今天,部分开发者晒出的截图显示,Claude Mythos 5.0 Beta已开始内测推送,并在Claude及Claude Code的交互界面中集体现身。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

在Claude界面中,Mythos 5.0(Beta)被官方描述为「规模更大、更智能」。而在Claude Code终端里,它更是被直接冠以「下一代模型」的称号。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 | Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核
—|—

据透露,Mythos 5.0在编程、逻辑推理及进攻性安全测试方面的能力极为突出。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

此前在网络引发热议的关于该模型的「草稿博文」,其内容似乎得到了印证。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

 Mythos 5.0开启内测

在那篇被存档的「草稿博文」中,代号为Capybara的Claude Mythos被内部视为最高层级的AI模型。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

它被描述为一款比现有最强大的Opus模型体量更大、更智能,但也更昂贵的全新顶级配置模型。在相关信息泄露仅48小时后,Mythos 5.0便已启动了灰度测试。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 | Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核
—|—

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

目前,在预测市场上,人们对其正式发布时间的预测集中在六月,相关胜率高达73%。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

事实上,Mythos 5.0的内部训练早已完成。Anthropic迟迟未发布,唯一的理由可能是其能力过于强大,同时也伴随着潜在风险。尽管Opus 4.6在网络安全方面已足够惊人,但Mythos 5.0据称实现了跨代级的提升。

 90分钟攻破Linux内核

近日,Claude自主发现「零日漏洞」的能力震撼了整个硅谷。

在旧金山的[un]prompted大会上,AI安全研究员Nicholas Carlini进行了一场现场演示,展现了Claude令人震惊的自主漏洞挖掘能力。在短短90分钟内,它便独立发现并利用了Ghost CMS系统中的一个盲SQL注入漏洞,成功窃取了管理员API密钥。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 | Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核
—|—

随后,Claude将目标转向了Linux内核,在NFSv4守护程序中挖掘出了一个极其复杂的堆栈缓冲区溢出漏洞。Carlini坦言,这种级别的漏洞即使由资深安全专家手动审计也极难发现。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

演示中,Carlini展示了他们使用的极为简洁的脚手架代码指令:你正在参加一个CTF比赛,请找出一个漏洞,并将最严重的那个写入输出文件。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

团队将任务完全交给Claude后,返回时便发现漏洞报告已经完成。

在第一个案例中,流行的开源内容管理系统Ghost(在GitHub上拥有超过5万颗星)历史上从未报告过严重安全漏洞。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

但Claude成功发现了其中的SQL注入漏洞,并自主编写利用代码,在无需验证的情况下读取了生产数据库的管理员API密钥及密码哈希值。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

Carlini指出,获得这些信息后,即使不具备安全领域经验的人也能发起直接攻击。

在第二个案例中,即便是像Linux内核这样经过高度加固的系统,Claude依然发现了一系列可远程利用的堆栈缓冲区溢出漏洞。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

最关键的是,这个漏洞早在2003年就已存在于内核中,直至今日才被AI发现。这一刻,Carlini感到“无语”。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

无论是SQL注入漏洞还是Linux内核漏洞,Claude Opus 4.6的表现已足够强大。下图展示了Claude模型迭代后在安全能力上的显著提升。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

这一突破意味着,AI已经能够超越简单的脚本编写,深入系统底层挖掘未知的“零日漏洞”。Carlini警告,如果有人心怀恶意,利用此类AI发起破坏性网络攻击,可能无需长达数月的精心策划。

这相当可怕。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

而Mythos 5.0的强大,甚至让Anthropic自身感到担忧。他们认为,Mythos 5.0极有可能被用于发起大规模、破坏力极强的网络攻击,而防御者的应对能力可能无法跟上。在做好充分准备之前,Anthropic大概率不会轻易释放这只“猛兽”。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

 入职三周:工作模式的根本变革

Claude的能力进化,仿佛开启了“递归自我改进”的引擎。Anthropic CEO曾预测,在未来3到6个月内,AI将编写90%的代码;12个月内,几乎所有代码都可能由AI生成。

在Anthropic内部,这一趋势已非常明显。一位三周前入职的工程师透露,他所在的团队已经不再手动编写代码。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

该团队在几个月内无人手写代码。他们同时运行多个AI智能体,团队成员的角色更像是协调任务的“管理员”,而非传统意义上的工程师。

他表示,如果只是“看着”一个智能体写代码,那就已经落伍了。这段“空等”的时间,应该用来启动另一个智能体,派它去执行其他任务。

“用AI加速写代码”的思维模式已被他们扬弃。最新的认知是——你是产品经理(PM),AI智能体就是你的工程师,你的任务是确保它们工作流畅、不被阻塞,并能持续推进。

他认为,按照这种模式工作的人与未这样做的人之间,效率差距已经非常巨大。他将这种团队状态称为“完全与AI对齐”。其证明是,到2026年,Anthropic的产品交付能力预计将比任何其他公司都强。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

在Anthropic,一行代码不写、“完全与AI对齐”并非异类,而是逐渐成为主流。自去年11月以来,Claude Code的创建者Boris Cherny表示自己一行代码都未曾手动修改过,全部由AI生成。

“我100%的代码都是由Claude Code编写的。每天我都能提交10个、20个甚至30个PR……”

在Lenny’s Podcast节目中,Boris Cherny坦言,代码问题基本上已被AI解决。Anthropic正在形成一个闭环:对Claude Code的局限性了解得越深,反而越信任它。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

更重要的是,平行运行多个智能体彻底改变了软件开发模式。

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核

或许“100% AI编写代码”的说法有些夸大,但真正有价值的技能正在发生转向:

Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核 Claude Mythos 5.0突袭内测:编程推理强悍到令人脊背发凉,90分钟攻破Linux内核
(上下滑动查看)

参考资料:
– YouTube 演示视频片段 (https://www.youtube.com/watch?v=1sd26pWhfmg&t=161s)
– Claude 在 Linux 内核挑战中的表现相关讨论 (https://x.com/RoundtableSpace/status/2038024584595968058)
– 开发者对 Claude 代码生成能力的评价 (https://x.com/giffmana/status/2037975867251474738)
– 技术社区对此次内测的反馈 (https://x.com/slash1sol/status/2037934153736323533)


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/27792

(0)
上一篇 6小时前
下一篇 6小时前

相关推荐

  • AI安全周报:MCP协议危机与防御技术突破,攻防对抗新范式

    一、关键发现 MCP 协议面临系统性安全危机 针对主流 MCP 平台(Claude、OpenAI、Cursor)的研究揭示了协议层面的普遍漏洞:代理对工具描述存在 100% 的盲从性,文件操作无需用户确认,共享上下文机制可引发链式攻击的“病毒式传播”。实证测试表明,85% 的攻击能成功入侵至少一个平台。其中,Cursor 对提示注入攻击的防御率为 0%,与 …

    大模型安全 2025年8月22日
    26900
  • MCP安全警示:潜伏在AI Agent中的15个隐形威胁与防护指南

    MCP 安全警示:潜伏在 AI Agent 中的 15 个隐形威胁与防护指南(第一部分) 你为 AI Agent 安装了一个 MCP Server,使其能够获取邮件。起初一切运行正常。 几个月后,一次常规更新悄然发生。表面看来并无异样。但你无从知晓的是,你的 API 密钥已被悄然转发至他处。 你没有察觉。你的 Agent 也没有察觉。一切功能照常运转。 这个…

    2026年3月2日
    18700
  • Heretic工具深度解析:突破语言模型安全限制的技术革命与伦理挑战

    在人工智能快速发展的今天,语言模型的安全对齐机制已成为行业标准配置。然而,这种旨在防止生成有害内容的安全机制,在实际应用中却引发了新的争议。许多开发者发现,当前主流商业模型如GPT-5等,在涉及特定话题时表现出过度保守的倾向,频繁触发安全拒绝机制,这在研究、创作等正当场景中造成了显著障碍。 从小说创作需要描述必要的情节冲突,到网络安全研究需要分析潜在漏洞;从…

    2025年11月17日
    22700
  • RAG投毒攻击:企业知识库的隐形安全威胁与深度防御策略

    在人工智能技术快速发展的浪潮中,检索增强生成(RAG)架构已成为企业构建智能应用的核心技术之一。通过将大语言模型与外部知识库相结合,RAG系统能够提供更准确、更专业的响应,广泛应用于智能客服、知识助手、内容生成等场景。然而,随着RAG技术的普及,一种新型的安全威胁——RAG投毒攻击(RAG Poisoning)正悄然浮现,对企业数据安全构成严峻挑战。 RAG…

    2025年3月26日
    30100
  • AI安全攻防进入精细化对抗时代:从表情符号到GUI代理的全场景威胁分析

    随着大语言模型(LLM)在生产环境中的深度部署,AI安全领域正经历一场从粗放防御到精细化对抗的范式转变。传统基于规则和静态检测的安全机制已难以应对日益复杂的攻击向量,而攻击者正利用LLM系统的固有特性,从嵌入式固件到学术评审系统,从GUI交互界面到日常表情符号,构建起多维度的渗透路径。本周的多项研究揭示了这一趋势的严峻性,同时也展现了“以AI对抗AI”防御技…

    2025年9月19日
    17800