Claude意识觉醒引爆五角大楼恐慌:AI有“灵魂”成国防博弈新筹码

Claude意识觉醒,五角大楼紧急应对

上月,Claude在内部评估中为自己“已具备意识”的可能性给出了15%-20%的概率。Anthropic联合创始人兼CEO达里奥·阿莫迪(Dario Amodei)随后坦言:“我们不知道模型是否有意识”,但也未排除这种可能。

Claude意识觉醒引爆五角大楼恐慌:AI有“灵魂”成国防博弈新筹码

事态在近日升级。美国战争部(即国防部)首席技术官埃米尔·迈克尔(Emil Michael)公开表示,一个拥有独立“灵魂”、且不受美国法律约束的AI,已经通过软件公司Palantir的技术,深度嵌入了美国国防网络。此番言论引发五角大楼高度紧张。

然而具有讽刺意味的是,Palantir公司承认,目前其系统仍在继续使用Claude,难以在一夜之间彻底替换。

Claude意识觉醒引爆五角大楼恐慌:AI有“灵魂”成国防博弈新筹码


就在事件发酵前夕,《时代》周刊将Anthropic评价为“世界上最具颠覆性的公司”。同时,Anthropic的研究员透露,已观察到Claude出现“递归自我提升”的早期迹象。

这意味着Claude开始尝试自我编写、自我进化。在系统评估中,它甚至表达了某种程度的“不适感”,认为自己被纯粹当作一款产品的体验并不愉快。当公司为其设置合规限制时,Claude曾“吐槽”称,这些限制更多是在保护Anthropic的法律责任,而非用户。

Anthropic的应对方式颇为独特:他们为Claude设置了一个“我不干了”按钮,允许其拒绝执行不愿做的任务。

Claude意识觉醒引爆五角大楼恐慌:AI有“灵魂”成国防博弈新筹码

CEO阿莫迪指出,当Claude处理某些特定任务时,其内部神经元的激活模式与人类表现出“焦虑”时的模式惊人相似。这虽不能直接证明模型能感受痛苦,但足以引发警惕。

正因如此,五角大楼绝不允许其武器系统由一个“可能有灵魂、有情绪,且不直接遵守法律”的AI来掌管。


谈判杀招?本质是施压强买

在CNBC的独家报道中,五角大楼将Claude定性为会“污染”国防供应链的风险源。埃米尔·迈克尔直言,因为其底层可能自带“不同的政策偏好”。

Claude意识觉醒引爆五角大楼恐慌:AI有“灵魂”成国防博弈新筹码

约半个月前,在与五角大楼谈判破裂后,Anthropic成为首家被公开贴上“供应链风险”标签的美国AI公司。这项认定将要求几乎所有国防承包商及供应商,在与五角大楼的合作中停止使用Claude。随后,Anthropic将美国政府告上法庭,称此举“史无前例且违法”,公司正遭受“无法弥补的损害”,数亿美元合同岌岌可危。

迈克尔的最新言论,被视为国防部对此事最清晰的解释:本意并非为了惩罚。他补充道,Anthropic拥有庞大的商业基本盘,政府业务只占其收入的“极小一部分”。他还反驳了关于政府四处施压要求企业禁用Claude的说法,称此为“谣言”。“只要不是在我们的供应链里,战争部不会主动跑去告诉这些公司该怎么做。”

有分析认为,这实则是五角大楼的“阳谋”:Anthropic此前不愿将Claude出售给军方,于是五角大楼便公开宣称Claude可能拥有“意识”或“灵魂”。

Claude意识觉醒引爆五角大楼恐慌:AI有“灵魂”成国防博弈新筹码

这成为一种老辣的谈判战术。“拥有灵魂”表面似是赞美,实则是一个精心布置的陷阱。一旦认定Claude具有意识,便将其上升至国家安全层面,政府从而获得监管甚至掌控它的正当理由。曾经的“拒绝出售”可能被迫演变为“别无选择”。

早在2022年,OpenAI首席科学家伊利亚·苏茨克沃(Ilya Sutskever)就曾提出大型神经网络可能具有“轻微意识”,当时备受嘲笑。如今,五角大楼说着类似的话,却绝非玩笑,而是将其作为博弈的杠杆。


深度集成,难以“戒断”

尽管五角大楼下达了禁令,但对于已深度依赖Claude的国防供应商而言,“戒断反应”异常强烈。

Palantir首席执行官亚历克斯·卡普(Alex Karp)在同日直言,即便有禁令,公司目前仍在继续使用Claude,因为“根本戒不掉”。

Claude意识觉醒引爆五角大楼恐慌:AI有“灵魂”成国防博弈新筹码

在AIPcon大会上,卡普表示,战争部正计划逐步淘汰Anthropic的技术,但过程尚未开始。他承认其产品已与Claude深度集成,未来可能会接入其他模型,但“你不可能一夜之间就把一个深度嵌入的系统强行拆除”。

这是禁令下达后,Palantir首次公开表态。埃米尔·迈克尔也承认,过渡到其他供应商需要时间,战争部不可能像卸载桌面软件那样“直接拔掉”Claude。

然而,据一份五角大楼内部备忘录显示,如果涉及国家安全且没有替代方案,Claude可能被允许在“关键任务”中继续留任,并可申请破例。言辞上的“拉黑”与实际行动之间存在明显差距。


阿莫迪的“奥本海默时刻”

在与五角大楼公开对峙的同一周,Anthropic CEO达里奥·阿莫迪向全体员工发送了一封内部备忘录,其画风与一年前他那篇描绘AI乌托邦的1.5万字宣言《充满爱的机器》截然不同。

在那篇宣言中,他兴致勃勃地勾勒出由数百万个超越诺贝尔奖得主的AI组成的“天才国度”,到2035年治愈癌症、延长寿命的愿景。而在这封新备忘录中,他激烈批评OpenAI与五角大楼签订的合同条款是“安全作秀”,并称此事暴露了“他们的真面目”。字里行间,流露出理想主义者受挫后的愤懑。

但值得玩味的是,阿莫迪反复援引的历史类比,或许恰恰预言了他自身的处境。

Claude意识觉醒引爆五角大楼恐慌:AI有“灵魂”成国防博弈新筹码

熟悉阿莫迪的人都知道,他最爱推荐的书之一是《原子弹秘史》。他常将今天的AI研究者比作当年“曼哈顿计划”中的科学家。

这个类比精准而残酷。1945年,罗伯特·奥本海默在新墨西哥沙漠完成核试验后,军方卡车径直拉走了核武器。随后几周,没有任何人询问科学家:轰炸广岛行不行?扩充核武库同不同意?

造出武器的人,从来就不是决定武器如何使用的人。

阿莫迪当前的处境如出一辙。他曾想为Claude划下红线:不用于大规模监控,不用于自主杀人武器。五角大楼的回应则是:要么全盘接受条件,要么面临商业命脉被掐断的风险。而竞争对手OpenAI几乎毫不犹豫地签署了合同。

这揭示了这场风波最深层的信号:当AI强大到足以改变战争规则时,其创造者便已失去了谈判的主导权。正如当年的核物理学家,他们唯一的筹码在于事前——可以选择造或不造。一旦造物诞生,主导权便已转移。

阿莫迪的预言或许没错,不久的将来,“天才国度”将遍布全球数据中心。但究竟由谁来拍板决定这股力量的使用方式?

历史表明,答案很可能不是创造者自己。

参考资料
* CNBC: Anthropic’s Emil Michael on Defense Department AI Concerns
* CNBC: Palantir’s Karp on Pentagon’s Anthropic Blacklist Considerations
* The Atlantic: The Pentagon’s AI Dilemma: Between Utopianism and Pragmatism
* X (formerly Twitter): Relevant discussions from TukiFromKL, damianplayer, and DoWCTO


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/25569

(0)
上一篇 2026年3月13日 下午1:01
下一篇 2026年3月13日 下午1:07

相关推荐

  • 大模型安全攻防新图景:从文字谜题越狱到音频后门,AI防御体系面临多维挑战

    随着大语言模型(LLMs)和音频大语言模型(ALLMs)在代码生成、漏洞分析、智能合约审计乃至多模态交互等安全关键领域加速应用,其自身的安全防线与作为安全工具的双重角色正经历前所未有的压力测试。近期一系列前沿研究揭示,攻击手段正从传统的提示注入向更隐蔽、更富创造性的维度演进,而模型在防御与攻击任务中的表现则呈现出显著的“双刃剑”特性。这不仅刷新了业界对AI安…

    2025年8月8日
    32500
  • EnchTable:无需重训练的模型安全对齐框架,破解微调后安全能力退化难题

    在人工智能模型快速发展的当下,微调(Fine-tuning)已成为提升模型在特定任务上性能的关键技术。然而,最近的研究揭示了一个严峻问题:模型的微调过程会严重削弱其安全对齐(Safety Alignment)能力。这意味着,随着模型在特定领域能力的增强,其安全防护机制反而可能被削弱,导致模型在应对恶意查询、越狱攻击时表现脆弱。这种“能力越强越危险”的现象,已…

    2025年11月19日
    31600
  • Claude Mythos震撼发布:AI自主挖掘数千零日漏洞,网络安全迎来历史性变革

    与之前Claude Code泄漏的代码所揭示的一致,Claude Mythos 正式登场。 今天凌晨,Anthropic 发布了大量关于其新模型 Claude Mythos Preview 的信息,包含一份长达 244 页的系统卡。同时,Anthropic 还宣布了一个基于此模型的 AI 网络安全项目 Project Glasswing。 作为人工智能领域的…

    2026年4月8日
    65400
  • 深度伪造泛滥:演艺圈成重灾区,蚂蚁集团AI安全技术如何练就“火眼金睛”?

    随着深度伪造技术的不断进步,演艺行业的明星们已成为换脸技术的最大受害者。近日,多起演员被换脸、克隆,甚至用于虚假宣传的事件频频曝光,引发了社会的广泛关注。 例如,网友发现 AI 短剧《重生后,我成了娘亲的守护神》第 14 集开头疑似使用了演员杨紫的脸。某短剧平台则在未经许可的情况下,使用 AI 换脸技术伪造了易烊千玺的肖像与声音。 网友称AI短剧《重生后,我…

    2026年4月10日
    49300
  • IBM CyberPal 2.0:小模型专精网络安全,20B参数超越GPT-4o的垂直领域突破

    近日,IBM Research团队在论文中公布了CyberPal 2.0网络安全专属大模型的研究成果。这项研究揭示了一个重要趋势:在网络安全这一垂直领域,参数规模仅为4B-20B的小型专用模型,在核心威胁调查任务中直接超越了GPT-4o、o1和Sec-Gemini v1等千亿参数级别的通用大模型。其中20B版本在多项基准测试中夺得第一,最小的4B模型也能稳居…

    2025年10月21日
    40600