模型性能跟踪
-
揭秘大语言模型逻辑能力进化:2026年1月最新评测榜单深度解析
#1 参赛选手 本次更新模型(按发布时间顺序),共6个: 本月出榜: ERNIE 5.0 Preview(后继正式版)kimi-k2-0905-preview / Kimi-K2-Thinking(后继K2.5)Qwen3-30B-A3B-2507(不再跟踪)Doubao-Seed-1.8(后继1228版)Claude Haiku 4.5(不再跟踪)Qwen…
#1 参赛选手 本次更新模型(按发布时间顺序),共6个: 本月出榜: ERNIE 5.0 Preview(后继正式版)kimi-k2-0905-preview / Kimi-K2-Thinking(后继K2.5)Qwen3-30B-A3B-2507(不再跟踪)Doubao-Seed-1.8(后继1228版)Claude Haiku 4.5(不再跟踪)Qwen…