Claude Opus
-
Anthropic发布Claude Opus 4.7:编程能力大幅提升,视觉输入分辨率翻三倍
Anthropic 正式发布 Claude Opus 4.7。本次更新的核心在于软件工程能力的显著提升。Opus 4.7 在最复杂的编程任务上表现突出,用户反馈称其能够独立处理以往需要密切监督的复杂代码工作。该模型能够执行长时间、多步骤的任务,严格遵守指令,并在最终输出前自行验证结果。 Opus 4.7 现已通过所有 Claude 产品、API 以及 Ama…
-
AI科研革命:9个Claude副本碾压人类专家,800小时创造颠覆性突破
1997年,深蓝在国际象棋中获胜;2016年,AlphaGo在围棋领域取得突破。如今,Anthropic的一项实验表明,9个Claude副本在真实科研任务中展现了超越人类专家的能力。我们是否还能坚持认为AI的突破“仅限特定领域”?一个AI作为科研同事、竞争者甚至潜在继任者的时代,或许正在到来。 AI再次实现能力跨越 近期,Anthropic发布了一篇题为《自…
-
Claude Opus 4.6两周挖出Firefox 14个高危漏洞,AI安全攻防进入新纪元
近日,Anthropic 公布了一项与 Mozilla 的合作测试结果,其模型 Claude Opus 4.6 在两周内,于 Firefox 浏览器代码库中发现了 22 个不同的漏洞,其中 14 个被归类为“高危漏洞”。这一数量几乎相当于 Mozilla 在 2025 年修复的全部高危漏洞的五分之一。 这一结果清晰地表明,AI 正以前所未有的速度辅助人类识别…
-
Claude Opus 4.6实测:准确率跃升5.6%,成本骤降34%,自适应思考机制显威
Anthropic发布了Claude Opus 4.6新版本,官方定位为“最智能的模型”,主打复杂智能体任务和长时程工作。相比此前的Claude Opus 4.5版本,新版本在架构上进行了多项升级,包括首次在Opus级别支持100万token上下文窗口、引入自适应思考(adaptive thinking)机制等。 我们对这两个版本进行了全面的对比评测,测试其…
-
Claude Opus 4.6震撼发布:ARC-AGI得分68%创纪录,百万token上下文窗口开启AI新纪元
Anthropic 正式发布了其旗舰模型 Claude Opus 的最新版本 4.6。此次升级带来了显著的智能提升,尤其是在衡量抽象推理能力的 ARC-AGI 2 测试中取得了 68% 的得分,创造了新的纪录,并大幅领先于其他主流模型。 核心能力提升 Opus 4.6 在编程能力上实现了重要进步,能够更细致地规划任务,在大型代码库中进行更可靠的操作,并提升了…
