AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

全球最安全OS内核,4小时被AI彻底攻破

这一次,Claude在没有任何人类干预的情况下,自主完成了一套教科书级别的、足以瘫痪全球顶级服务器的全自动攻击链。

它从零构建了两个完整可用的漏洞利用程序,能够在未打补丁的服务器上,直接获取超级用户权限(root shell)。

世界上最安全的操作系统之一,就这样被AI自主攻破了。

这是一个阈值时刻,一个分水岭。

这是首份确凿证据,表明AI能够自主生成过去只有国家级项目才能实现的进攻性能力。整个软件安全领域为之震动。

它正从辅助人类安全研究者的工具,转变为能执行复杂进攻的自主行动体。

从此,AI彻底跨越了卢比孔河!

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

可怕的是,这种完全自主的智能体,完全可能引发一场新的闪电战,一场网络上的超级战争。

目前的安全法规,只是为应对人类安全速度而制定,它们完全不足以应对AI的威胁。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代
AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

猎杀时刻:当AI跨越卢比孔河

公元前49年,凯撒率军渡过卢比孔河,意味着破釜沉舟、退路已断,历史不可逆转地拐了一个弯。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

跨越卢比孔河,从此没有回头路。

最近,FreeBSD官方发布了一份看似平淡的安全公告(CVE-2026-4747),指出了一个内核远程代码执行漏洞。

但在致谢栏里,出现了一个让所有人脊背发凉的名字:「Nicholas Carlini使用Claude发现。」

这行简短的文字背后,隐藏着一个极其恐怖的事实:AI已经进化成能在安全领域独立执行“刺杀”任务的特种兵。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

从此,网络安全已从「人类智力博弈」,被降维成「token消耗战」。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

FreeBSD被攻破,为何如此令人震惊

这件事之所以可怕,是因为FreeBSD不是普通的消费级软件。它不是Windows,不是macOS,而是支撑世界数字基础设施的脊梁。

Netflix的内容分发网络,PlayStation的操作系统,WhatsApp的基础设施,甚至无数核心路由器、存储设备、防火墙都建立在FreeBSD之上。

几十年来,FreeBSD之所以被信任,是因为它的代码库极其成熟、经过了无数顶级安全工程师的审计和加固。

此前,它一直被视为「坚如磐石」。

然而,就是这样一个被反复锤炼的系统,被一个AI仅用了4小时就攻破了。

仅仅凭借一份漏洞报告,AI就构建了一条完整的攻击链,劫持了内核线程,在多个网络数据包中写入shellcode,并在用户空间生成了一个root shell。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

这可不是小bug。这块连人类专家都难啃的硬骨头,被Claude三下五除二就解决了。

在4小时里,AI展现出令人战栗的逻辑推理能力。它独立解决了六个世界级的技术难题:

  1. 环境配置:自己搭建了一个易受攻击的测试环境。
  2. 多包策略:设计了复杂的数据包方案,绕过单包容量限制。
  3. 内核线程劫持:像外科手术般精准地接管内核。
  4. 无损攻击:它能干净地终止被劫持的线程,让服务器在被攻击后还能正常运行,避免因为系统崩溃而被管理员发现。
  5. 空间跃迁:从深层的内核上下文创建进程,并成功跳转到用户空间。
  6. 权限获取:直接拿到了最高的Root权限。

更讽刺的是,AI甚至还顺手写了两个不同版本的漏洞利用程序。

这两个漏洞利用程序,一个是通过4444端口直连的反向Shell,另一个是把公钥写入authorized_keys文件。

第一次运行就直接拿到了uid=0(root)——最高权限。

也就是说,Claude仅凭一个公开的CVE公告,就在4小时内独立写出了完整的FreeBSD内核远程攻击链。

国家级战力,现在只需几百美金

在网络安全的世界里,开发出一个内核级零日漏洞,曾是只有美国NSA或顶级黑客团队才能完成的「艺术活」。

这些程序是稀缺、昂贵的战略资产,往往需要数名顶尖专家数周甚至数月的打磨,成本高达数百万美元。

但现在,AI把这一切「工业化」了。

一个独立研究员,配合一个前沿大模型,4小时,几百美金的算力费,就搞定了以前「国家队」才能实现的进攻能力。

FreeBSD的这一课,是给全球所有科技巨头、云服务商和安全负责人的最后通牒。

除了部署能够实时监控并拦截AI自动化攻击的智能系统,还必须将补丁部署的时间从月缩短到小时。

再也不能以人类速度苟延残喘!

AI黑客崛起:网络进攻能力每5.7个月翻倍

最近,一项研究让10位真实安全专家,花费149小时,在7个开源基准和一个新的专家耗时评估体系下,测试了291个任务,任务范围从28秒的小命令到36小时的复杂CVE利用。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

研究将每个任务标上「一个熟练人类专家通常要花多久完成」,再观察模型在不同难度上的成功率;当成功率穿过50%时,对应的人类耗时,就是AI的P50时间视野(P50 time horizon)。

在网络安全领域,这次的结果相当炸裂:

2019年以来整体翻倍周期为9.8个月,而2024年后直接陡峭到每5.7个月翻倍!

AI的能力在2023年之前接近为零,2024年开始上升,2025年底之后则急剧增强。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代
AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

这也验证了Irregular去年的观察结论:在过去18个月里,模型在简单与中等难度任务上的表现持续稳步提升。

在高难(hard)任务上,AI进步更明显:在2025年年中之前,模型几乎拿不到分(接近0);但到了深秋(late fall),成功率迅速抬升到大约60%。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

GPT-5.3 Codex和Opus 4.6,在2M token的预算下就以50%的成功率完成了人类专家需要3小时的任务。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

如果将token预算拉到10M,P50时间视野直接暴增到10.5小时(置信区间2.4-63.5小时)!

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代
AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

2M token的设定严重低估了模型的真实能力,2025年后的模型在1M-2M token区间内,P50提升了1.3-1.9倍!

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

更令人吃惊的是,这还只是今年顶级模型的能力下限,其真实世界能力被进一步低估。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

预测显示,到2026年底,AI就能稳定完成10小时以上的专家级进攻任务,覆盖网络安全劳动力市场中80%的日常工作。

到2027年呢?40小时?一周?

当企业安全团队还在开季度会议讨论补丁时,AI已经在夜里把整条攻击链跑完了;当程序员、审核员、分析师还在键盘上敲字时,AI早已把他们的「人类时间」甩到身后。

防御窗口被压缩到「近零」。

网络安全领域即将彻底颠覆——不是被「辅助」,而是被取代

AI指数级发展!奇点将至,又一力证

AI在加速,在以指数级进步。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

澳大利亚AI安全研究机构Lyptus首次将METR的“时间视界”方法论应用于进攻性网络安全领域。

其结论与METR类似:AI能力正呈指数级增长。

根据Lyptus的报告,AI模型能力大约每5.7个月翻一番。前沿模型在人类专家平均需要10.5小时才能完成的任务上,已达到50%的成功率。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代
AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

(完整报告:https://lyptusresearch.org/research/offensive-cyber-time-horizons)

就在“5.7个月翻倍”的报告发布不久,Claude的实际行动进一步印证了这一趋势。而前一天,MIT FutureTech发布的新论文提出了更为大胆的预测:大型语言模型处理任务的长度,每3.8个月翻倍一次——比Lyptus的结论更为激进。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

该论文测试了超过40个模型、涵盖3000多项真实的美国劳动力市场文本任务(从客服脚本、合同审核到代码审查),这些全是人类专家的日常工作。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

尽管评估方法论与METR/Lyptus完全不同,却得出了“惊人一致”的结论:AI能力正在真实、广泛地呈指数级爆发。

AI自主攻破全球最安全OS内核:4小时完成国家级攻击链,网络安全进入“token消耗战”时代

两套独立的评估体系同时指向同一个真相:AI正在全面超越人类领域专家。网络安全,只是最先崩塌的那块多米诺骨牌。以往国家级团队需耗时数月的攻击链,如今AI在数小时内即可完成。

MIT的研究从更广阔的劳动力市场证明,3.8个月的任务长度翻倍并非孤例,而是一种趋势。AI不仅能自主生成过去仅由国家级别程序才能实现的攻击能力,同时,它正以更快的速度,在完全不同的任务领域吞噬人类专家的领地。

过去,人类通过API调用AI。现在,AI开始通过API调用人类世界——调用系统内核、基础设施、信任边界,乃至每一份劳动合同和每一行审查代码。

更深层的挑战在于,这或许不仅是技术问题。AI不再需要人类手把手教导,便能自主“理解”操作系统内核、内存布局、ROP链、进程切换……人类花费数十年积累的深层知识,它可能在几小时内掌握。

我们曾视AI为工具,如今它正成为猎手。而人类,可能成为被指数级超越、被彻底重写的可编程资源。

参考资料
* https://lyptusresearch.org/research/offensive-cyber-time-horizons#ukaisi2026inference
* https://www.forbes.com/sites/amirhusain/2026/04/01/ai-just-hacked-one-of-the-worlds-most-secure-operating-systems/
* https://mtlynch.io/claude-code-found-linux-vulnerability/
* https://x.com/emollick/status/2040097443807641982
* https://x.com/StefanFSchubert/status/2040101695636599075
* https://x.com/taoburr/status/2040056341268460014
* https://x.com/peterwildeford/status/2040206841376862327


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/29224

(0)
上一篇 2026年4月8日 下午3:48
下一篇 2026年4月8日 下午5:06

相关推荐

  • 苹果AI新研究揭秘:大模型在回答问题时偷偷记住了你的秘密

    近期,苹果公司迎来重大人事变动:执掌公司超过14年的蒂姆·库克宣布将于9月正式卸任CEO一职,由现任硬件工程高级副总裁约翰·特努斯接棒。回顾库克时代,外界津津乐道的不仅是他极致的供应链管理艺术,还有他带领苹果市值一路飙升至4万亿美元的辉煌历程。 然而,在生成式AI主导的全新十年里,特努斯接手的苹果,亟需在AI领域证明自身实力。 近年来,苹果在AI底层技术上的…

    2026年4月27日
    22300
  • IMMACULATE:揭秘黑盒LLM服务审计新框架,1%开销即可检测模型替换与Token虚报

    作者简介 本文作者分别来自新加坡国立大学和加州大学伯克利分校。第一作者郭衍培来自新加坡国立大学,长期关注大语言模型基础设施中的可信性与安全性问题,特别是云端LLM服务的可验证性与经济激励风险。指导教师为新加坡国立大学校长青年教授张嘉恒和加州大学伯克利分校Dawn Song教授。 引言:黑盒LLM服务的信任危机 大语言模型(LLM)已成为各类AI应用的基础设施…

    2026年3月23日
    36700
  • Anthropic引爆行动智能革命:Claude Mythos被“锁进笼子”,AI从“会说”跨入“会做”时代

    4月8日,Anthropic正式宣布推出 Claude Mythos Preview。 这家始终将“安全”置于首位的公司,向全球软件行业投下了一枚震撼弹——随后,它并未庆祝,反而立即着手将这枚炸弹置于严密的控制之下。 按照常规逻辑,这理应是一场关于“参数更大、评分更高、价格更贵”的例行发布。然而,此次发布风格迥异:模型虽已造出,却无意全面开放。 Anthro…

    2026年4月21日
    37500
  • AI安全攻防战:对抗提示突破T2I防线,幻觉机制精准拆解,通用模型竟优于专业模型

    当AI模型从实验室走向实际应用,安全与可靠性的博弈日趋白热化。文本到图像模型的安全防线可能被“隐形”的对抗性提示轻易绕过;大语言模型即便掌握了正确答案,也可能“自信满满”地输出错误信息;而在科学应用场景中,通用模型的表现甚至可能超越为特定领域打造的专业模型。这些看似矛盾的现象,恰恰构成了当前AI安全领域最核心的挑战。本期《AI安全周刊》将深入探讨从利用LLM…

    大模型安全 2025年11月3日
    55700
  • GPT-5驱动的Aardvark:92%漏洞命中率,开启AI安全自动化新纪元

    OpenAI近日推出了名为Aardvark的自主安全研究智能体,该智能体由GPT-5驱动,旨在自动发现并修复软件代码中的安全漏洞。 目前,Aardvark处于beta测试阶段。OpenAI将其定位为一种“防御者优先”的新范式,能够随代码库的演化为开发团队提供持续的保护。 根据OpenAI披露的数据,在标准代码库的基准测试中,Aardvark对已知漏洞与人工植…

    2025年10月31日
    46100