大语言模型评测

AI产业动态

揭秘大语言模型逻辑能力进化：2026年1月最新评测榜单深度解析

#1 参赛选手本次更新模型（按发布时间顺序），共6个：本月出榜： ERNIE 5.0 Preview（后继正式版）kimi-k2-0905-preview / Kimi-K2-Thinking（后继K2.5）Qwen3-30B-A3B-2507（不再跟踪）Doubao-Seed-1.8（后继1228版）Claude Haiku 4.5（不再跟踪）Qwen…

2026年1月31日
719000
大模型评测

2024年12月大语言模型逻辑能力深度评测：15款主流模型性能横评与趋势洞察

1 参赛选手本次评测共包含15个模型，均为近期更新版本（按发布时间排序）：本月出榜模型：* GLM-4.6（后继版本：GLM-4.7）* MiniMax M2.1（后继版本：M2）* DeepSeek V3.2-Speciale（官方已下线）* Doubao-Seed-1.6 1015（后继版本：1.8）* DeepSeek V3.2-Exp（后继版本：…

2025年12月26日
297002