性能基准测试
-
Claude Sonnet 4.6震撼发布:百万token上下文+人类级计算机操作,性能直逼Opus
Claude Sonnet 4.6今天正式上线,这是Anthropic迄今为止最强大的Sonnet模型。该模型在编码、计算机使用、长上下文推理等核心能力上实现全面升级,最引人注目的是其beta版百万token上下文窗口。 从性能基准测试来看,Sonnet 4.6在终端编码、编程能力、计算机使用等关键指标上表现突出。有开发者反馈,在真实编码任务中,70%的情况…