AI平台

AI产业动态

Claude Opus 4.6评测暴跌至第10名，Anthropic却亮出王炸：全栈应用构建系统或将消灭编程

近期，Claude Opus 4.6 模型在第三方基准评测中的表现引发了广泛关注。根据 BridgeBench 发布的最新报告，该模型的全球排名出现显著下滑。报告数据显示，Claude Opus 4.6 的准确率从 83.3% 下降至 68.3%，其幻觉率则大幅上升。这一变化导致其在综合排名中从第 2 位跌落至第 10 位。评测结果的公布，在用户社区中引…

10小时前
71000