大语言模型评测
-
揭秘大语言模型逻辑能力进化:2026年1月最新评测榜单深度解析
#1 参赛选手 本次更新模型(按发布时间顺序),共6个: 本月出榜: ERNIE 5.0 Preview(后继正式版)kimi-k2-0905-preview / Kimi-K2-Thinking(后继K2.5)Qwen3-30B-A3B-2507(不再跟踪)Doubao-Seed-1.8(后继1228版)Claude Haiku 4.5(不再跟踪)Qwen…
-
2024年12月大语言模型逻辑能力深度评测:15款主流模型性能横评与趋势洞察
1 参赛选手 本次评测共包含15个模型,均为近期更新版本(按发布时间排序): 本月出榜模型:* GLM-4.6(后继版本:GLM-4.7)* MiniMax M2.1(后继版本:M2)* DeepSeek V3.2-Speciale(官方已下线)* Doubao-Seed-1.6 1015(后继版本:1.8)* DeepSeek V3.2-Exp(后继版本:…