AI平台
-
Claude Opus 4.6评测暴跌至第10名,Anthropic却亮出王炸:全栈应用构建系统或将消灭编程
近期,Claude Opus 4.6 模型在第三方基准评测中的表现引发了广泛关注。根据 BridgeBench 发布的最新报告,该模型的全球排名出现显著下滑。 报告数据显示,Claude Opus 4.6 的准确率从 83.3% 下降至 68.3%,其幻觉率则大幅上升。这一变化导致其在综合排名中从第 2 位跌落至第 10 位。 评测结果的公布,在用户社区中引…