
Anthropic 正式发布 Claude Opus 4.7。本次更新的核心在于软件工程能力的显著提升。Opus 4.7 在最复杂的编程任务上表现突出,用户反馈称其能够独立处理以往需要密切监督的复杂代码工作。该模型能够执行长时间、多步骤的任务,严格遵守指令,并在最终输出前自行验证结果。

Opus 4.7 现已通过所有 Claude 产品、API 以及 Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 平台提供。其定价与 Opus 4.6 保持一致:输入每百万 token 5 美元,输出每百万 token 25 美元。开发者可通过 claude-opus-4-7 标识符调用该模型。
视觉输入能力跃升
Opus 4.7 支持的图像输入分辨率大幅提高,最长边可达 2576 像素,约合 375 万总像素,是此前 Claude 系列模型的三倍以上。这一提升为需要处理密集信息截图的自动化代理、从复杂图表中提取数据以及依赖像素级细节参考的工作提供了更强大的支持。

在专业任务方面,Opus 4.7 生成的用户界面、演示文稿和文档质量更高。内部评估显示,其在金融代理任务上达到了最优水平,能够完成更严谨的金融分析、制作更专业的演示文稿,并实现更紧密的跨任务整合。在覆盖金融、法律等多个高价值知识工作领域的第三方评测 GDPval-AA 中,Opus 4.7 同样取得了最优成绩。
重要提示: Opus 4.7 的指令遵循能力有了实质性增强,这可能导致针对旧模型编写的提示词产生预期之外的结果。旧模型可能宽松解读或跳过部分指令,而 Opus 4.7 会尝试逐字严格执行。用户可能需要重新调整提示词和工作流程。
模型的记忆能力也有所改善。Opus 4.7 更擅长利用文件系统存储关键信息,能够在多个长时间运行的任务间保持记忆连续性,从而在接手新任务时所需的前置上下文更少。
安全特性
此前,Anthropic 宣布了“Project Glasswing”,旨在探讨 AI 模型在网络安全领域的风险与价值,并计划先在能力较弱的模型上测试新的网络安全防护措施,再逐步应用于更强大的模型。
Opus 4.7 是这一路线图中的首个模型。其网络攻击能力低于 Mythos Preview 模型,Anthropic 在训练过程中有意抑制了这方面的能力。发布时,模型已内置自动检测并拦截违禁或高风险网络安全用途的防护机制。Anthropic 表示,此次部署的经验将为未来大规模推出 Mythos 级别模型提供数据支持。
有合法网络安全需求(如漏洞研究、渗透测试、红队评估等)的安全专业人员,可以申请加入新推出的“网络验证计划”(Cyber Verification Program)。
整体安全表现与 Opus 4.6 相近:在欺骗、谄媚、配合滥用等问题上发生率较低。在诚实性和抵御恶意提示注入攻击方面有所改进;但在涉及管制物质的危害减少建议上,Opus 4.7 的表现略有退步。对齐评估结论认为,模型总体表现良好且值得信赖,但尚未达到理想状态。目前最佳对齐模型仍是 Mythos Preview。详细安全评估可参阅《Claude Opus 4.7 系统卡片》。
同步上线的新功能
更细致的推理控制:新增“超高”(xhigh)努力级别,位于“高”(high)和“最大”(max)之间,使用户能在推理深度与响应速度之间进行更精细的调节。在 Claude Code 中,所有套餐的默认努力级别已提升至“超高”。测试编程和代理场景时,建议从“高”或“超高”级别起步。
API 更新:除了更高分辨率的图像支持外,“任务预算”(task budgets)功能进入公开测试阶段,帮助开发者控制 Claude 在长时间运行任务中的 token 消耗分配。
Claude Code 更新:新增 /ultrareview 斜杠命令,可专门用于读取代码变更,并标出仔细审查者可能发现的 Bug 和设计问题。Pro 和 Max 用户各获得三次免费体验机会。此外,“自动”(Auto)模式现已向 Max 用户开放。在此模式下,Claude 将代替用户作出权限决策,从而在长任务运行时减少对用户的打扰,同时比跳过所有权限检查更为安全。
从 Opus 4.6 升级前的注意事项
首先,Opus 4.7 使用了更新的分词器,相同文本输入对应的 token 数量约为原来的 1.0 到 1.35 倍,具体倍数取决于内容类型。其次,在代理场景的后续交互轮次中,Opus 4.7 在较高努力级别下会产生更多的内部推理过程文本,在提升可靠性的同时也会增加输出 token 的数量。

用户可以通过调整努力级别参数、设置任务预算,或在提示词中要求模型更简洁作答来控制 token 用量。Anthropic 内部测试显示,在编程评估任务中,各努力级别下的综合 token 消耗(输入+输出)仍有改善,但仍建议在实际应用流量上进行单独测量。详细升级建议请参阅官方迁移指南。
来源:https://www.anthropic.com/news/claude-opus-4-7
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/30653

