性能基准测试

AI产业动态

Claude Sonnet 4.6震撼发布：百万token上下文+人类级计算机操作，性能直逼Opus

Claude Sonnet 4.6今天正式上线，这是Anthropic迄今为止最强大的Sonnet模型。该模型在编码、计算机使用、长上下文推理等核心能力上实现全面升级，最引人注目的是其beta版百万token上下文窗口。从性能基准测试来看，Sonnet 4.6在终端编码、编程能力、计算机使用等关键指标上表现突出。有开发者反馈，在真实编码任务中，70%的情况…

2026年2月18日
404000