Claude Sonnet 4.6震撼发布:百万token上下文+人类级计算机操作,性能直逼Opus

Claude Sonnet 4.6今天正式上线,这是Anthropic迄今为止最强大的Sonnet模型。该模型在编码、计算机使用、长上下文推理等核心能力上实现全面升级,最引人注目的是其beta版百万token上下文窗口。

Claude Sonnet 4.6震撼发布:百万token上下文+人类级计算机操作,性能直逼Opus

性能基准测试来看,Sonnet 4.6在终端编码、编程能力、计算机使用等关键指标上表现突出。有开发者反馈,在真实编码任务中,70%的情况下他们更倾向于选择Sonnet 4.6而非前代Sonnet 4.5,甚至59%的情况下优于去年11月发布的Opus 4.5。

计算机操作能力实现质的飞跃

计算机使用能力的提升尤为显著。OSWorld基准测试显示,Sonnet 4.6得分达到72.5%,相比2024年10月Sonnet 3.5的14.9%实现了近五倍增长。

Claude Sonnet 4.6震撼发布:百万token上下文+人类级计算机操作,性能直逼Opus

早期用户已经观察到模型在处理复杂电子表格和多步骤网页表单时展现出接近人类水平的能力。这意味着企业现在可以用AI自动化那些原本需要人工操作的遗留系统,而无需构建专门的API接口。

实际应用价值显著

对于Claude in Excel用户,新版本支持MCP连接器,可以直接与S&P Global、LSEG、PitchBook等金融数据源集成。用户可以在不离开Excel的情况下让Claude获取外部数据并进行分析。

Claude Sonnet 4.6震撼发布:百万token上下文+人类级计算机操作,性能直逼Opus

API方面,网页搜索和获取工具现在支持动态过滤功能,通过自动编写和执行代码来预处理搜索结果,提高了11%的准确性同时减少了24%的token消耗。

安全方面,Anthropic称模型对提示词注入攻击有更强的抵抗力。这符合他们一贯的安全优先策略。

实际使用中,用户反馈代码修改、文档理解和前端设计有明显改进。模型现在更擅长处理现实软件,比如电子表格和网页表单,不需要特殊API。更关键的是,它减少了过度设计和幻觉问题,在多步骤、分支任务上表现更可靠。

定价策略与可用性

Sonnet 4.6现已在所有Claude计划、Claude Cowork、Claude Code以及API中可用。免费用户现在也能默认使用Sonnet 4.6,并包含文件创建、连接器、技能和压缩功能。

有网友在社交媒体上指出,考虑到性能提升和价格优势,Sonnet 4.6可能成为OpenClaw等AI代理任务的新首选。对于预算有限的开发者,这确实提供了一个性价比极高的选择。

不过也有观点认为,对于需要最深层次推理的任务,如代码库重构或多代理协调,Opus 4.6仍然是最佳选择。关键在于根据具体使用场景在性能和成本之间找到平衡点。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21832

(0)
上一篇 1天前
下一篇 21小时前

相关推荐

  • 智源研究院:以“安卓”模式破局具身智能数据孤岛,引领行业生态共建新范式

    在2025年智源具身智能Open Day活动中,一场被业界称为“具身武林大会”的盛会,罕见地聚集了银河通用、智元、星海图、自变量、原力灵机、加速进化、北京人形、星源智、优必选、因时、软通天擎等机器人领域的主要厂商代表。这一现象背后,折射出当前具身智能产业面临的核心挑战与转型契机。 智源研究院院长王仲远在会上提出的“数据贡献与模型效用正向关联”机制,直指行业长…

    2025年11月21日
    11200
  • AgentFS:基于SQLite的AI智能体状态管理革命,单文件封装完整运行时

    在AI智能体(Agent)系统快速发展的当下,状态管理、审计追踪和合规性保障成为制约其规模化应用的关键技术瓶颈。传统解决方案往往依赖复杂的分布式数据库或云存储服务,不仅增加了系统架构的复杂性,还带来了性能开销、数据迁移困难和平台依赖等问题。近日,由Pekka Enberg与Turso数据库的Glenn Snelling合作开发的AgentFS项目,为这一领域…

    2025年11月6日
    11600
  • 智谱GLM-4.7登顶开源模型榜首,以511亿港元市值冲刺“全球大模型第一股”

    “全球大模型第一股”即将登陆港股!北京智谱华章科技股份有限公司(下称“智谱”)今起招股,预计2026年1月5日结束,并计划于2026年1月8日正式以“2513”为股票代码在港交所主板挂牌上市。 全球公开发售文件显示,智谱(02513.HK)计划在本次IPO中发行3741.95万股H股。其中,香港公开发售187.1万股H股,国际发售3554.85万股H股。以每…

    2025年12月30日
    19500
  • Ilya Sutskever深度访谈:AI进入研究时代,超级智能与对齐的未来路径

    当OpenAI前首席科学家、Safe Superintelligence Inc.创始人Ilya Sutskever在最新访谈中宣告“扩展时代已经终结”,整个AI社区为之震动。这一断言不仅挑战了过去五年以算力和数据堆砌为核心的AI发展范式,更预示着人工智能领域正迎来一次根本性的战略转向。 这场由Dwarkesh Patel主持的95分钟深度对话,在X平台上线…

    2025年11月26日
    13200
  • 资本与劳动力的世纪大脱钩:从英伟达到沃尔玛,AGI时代的渐进革命

    当英伟达以4万亿美元市值创造历史纪录时,其背后隐藏着一个更为深刻的宏观经济现象:劳动与资本的大脱钩。这家仅凭3.6万名员工就支撑起相当于15亿印度人一年GDP市值的公司,正在重新定义现代企业的生产力范式。这种脱钩并非科技行业的专属现象,从沃尔玛十年营收增长2000亿美元却员工零增长,到亚马逊最新2000亿美元营收增长仅需新增3.6万名员工,一场静默的革命正在…

    2025年11月18日
    11700