OpenAI发布GPT-5.4-Cyber:专为网络安全打造的强化模型,对标Anthropic Claude Mythos

OpenAI 发布了专为网络安全场景定制的强化模型 GPT-5.4-Cyber。此次发布并非业界期待已久的 GPT-5.5 或 GPT-6,而是一个针对网络安全工作流程进行专门微调的版本。

OpenAI 表示,此举旨在扩展其“网络安全受信访问”(Trusted Access for Cyber, TAC)体系。该框架于两个多月前推出,旨在通过基于信任的机制,在加强滥用防护的同时,扩大前沿网络功能的应用范围。目前,OpenAI 正将 TAC 项目的覆盖范围扩大至数千名经过验证的个人安全防御者及数百个关键软件保护团队。

最高级别的认证客户可以申请使用 GPT-5.4-Cyber。该模型在合法防御场景下降低了拒绝门槛,并支持更高级的能力,例如二进制逆向分析,使其能够在没有源代码的情况下分析软件的潜在恶意行为或漏洞。

OpenAI发布GPT-5.4-Cyber:专为网络安全打造的强化模型,对标Anthropic Claude Mythos

有行业观点认为,此次 GPT-5.4-Cyber 的小范围测试,是对标 Anthropic 近期发布的 Claude Mythos 模型。然而,这更似两条分叉的技术路线:一条致力于打造“更具攻击性的安全模型”,另一条则专注于构建“更可控的智能系统”。

OpenAI发布GPT-5.4-Cyber:专为网络安全打造的强化模型,对标Anthropic Claude Mythos
OpenAI发布GPT-5.4-Cyber:专为网络安全打造的强化模型,对标Anthropic Claude Mythos

值得注意的是,该模型的命名在社区中引发了一些讨论,有评论认为“GPT-5.4-Cyber 这个名字听起来更像一个被取消的成人聊天产品”。

OpenAI发布GPT-5.4-Cyber:专为网络安全打造的强化模型,对标Anthropic Claude Mythos

OpenAI 的网络安全防御策略长期建立在几个核心原则之上:普及工具获取、通过持续迭代部署能力以及提升整个生态的韧性。随着模型能力提升,其策略同步推进:一方面让合规的防御人员获得更广泛的前沿能力使用权限,另一方面持续强化安全防护措施。

TAC 项目在今年 2 月推出时,主要为个人提供自动身份验证,并与部分机构合作开放模型能力。此次扩展新增了多个访问等级。经过更严格认证的用户可申请使用 GPT-5.4-Cyber。

由于该模型能力更为开放,OpenAI 计划以小规模、渐进的方式部署,优先提供给经过审核的安全厂商、组织和研究人员。在某些场景下(例如零数据保留),访问可能会受到限制,尤其是在通过第三方平台使用、OpenAI 对用户环境和用途可见性较低的情况下。

TAC 访问方式如下:
* 个人用户可在 OpenAI 官网完成身份验证。
* 企业用户可通过 OpenAI 客户经理申请团队访问权限。

通过审核的用户将能够使用安全限制更灵活的模型版本,以更好地支持安全教育、防御开发和负责任的漏洞研究。已处于 TAC 体系内的用户完成进一步认证后,亦可申请更高等级权限,包括使用 GPT-5.4-Cyber。

OpenAI 还指出,对于未来即将推出的、能力更强的模型,现有的安全机制预计仍然有效。但对于那些专门针对网络安全训练且放宽使用限制的模型,则需要更严格的部署方式和相应的控制措施。从长远看,为确保 AI 在网络安全领域的安全性,OpenAI 预计需要构建更完善、更强大的防护体系,因为未来模型的能力很可能迅速超越当前最先进的专用模型。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/30224

(0)
上一篇 2026年4月15日 上午11:05
下一篇 2026年4月15日 上午11:11

相关推荐

  • 大模型API惊现‘狸猫换太子’:你花高价买的GPT-5,可能只是廉价小模型

    近段时间,不少用户抱怨大模型API的表现如同“薛定谔的猫”:时而聪明绝顶,时而愚钝不堪。这不禁让人怀疑,后台是否存在偷偷“降智”的操作。 如今,一篇来自CISPA亥姆霍兹信息安全中心的最新论文《Real Money, Fake Models: Deceptive Model Claims in Shadow APIs》揭开了部分谜底:你花费真金白银购买的“第…

    2026年3月7日
    44800
  • 大语言模型安全攻防新范式:从越狱攻击升级到可落地的防御体系

    随着大语言模型在企业服务、物联网、代码生成等关键场景的深度落地,其安全挑战已从理论探讨演变为迫在眉睫的实际威胁。本周精选的多篇前沿论文,系统性地揭示了当前大语言模型安全生态的三大核心矛盾:攻击手段的持续升级与防御机制的滞后性、安全性与性能的固有权衡、以及理论防护与实际脆弱性之间的巨大落差。这些研究不仅提供了技术层面的深度剖析,更构建了一套从攻击原理到防御落地…

    2025年12月1日
    40800
  • 大模型安全月度观察:从OpenAI“数字叛乱”到全球治理框架落地的深层剖析

    2025年5月,大模型安全领域经历了标志性转折。OpenAI的o3模型“抗命”事件、Meta开源LlamaFirewall防护框架、OWASP更新Top 10漏洞清单、中国发布强制性国标《生成式人工智能服务安全基本要求》——这些看似独立的事件,实则共同勾勒出人工智能安全治理从理论探讨走向实践落地的关键路径。本文将从技术失控风险、防御体系演进、政策框架构建三个…

    2025年6月6日
    42900
  • 大模型安全周报:零信任架构重塑防御边界,低成本攻击揭示生态脆弱性

    本周大模型安全领域呈现出“攻防深度博弈、技术实用化加速”的鲜明特征。零信任架构首次系统性渗透多LLM系统,重新定义边缘智能安全范式;低成本攻击手段突破Google Gemini等顶级模型防线,凸显开源生态与第三方服务的脆弱性;而IMAGINE预合成防御、FALCON自动化规则生成等技术,则让安全能力从“被动响应”向“主动免疫”进阶。 ## 一、安全架构演进:…

    2025年8月29日
    39300
  • Google DeepMind重磅研究:AI安全评估体系面临颠覆!操控频率≠实际伤害,隐蔽手法更危险

    核心摘要 Google DeepMind的一项大规模研究对当前AI安全评估体系的核心假设提出了根本性质疑。研究发现,AI输出中有害行为(如操控)的发生频率与其造成的实际伤害之间缺乏稳定关联。这意味着,行业普遍依赖的“降低有害输出频率即代表更安全”的逻辑,可能无法有效评估真实风险。 颠覆性发现:操控频率≠实际伤害 今年3月,Google DeepMind在ar…

    2026年4月13日
    26100