逻辑推理

AI产业动态

MiniMax M2.5深度评测：国模编程可用性突破，逻辑与工程能力全面进化

短的结论：向下扎根，向上生长基本情况：稀宇的前一代M2.1因技术问题，在逻辑能力上落后于M2。M2.5基本解决了这些问题，能力回归正轨，相比M2的综合性能提升约17%。不过，部分进步是通过更长的思维链和更深的解空间探索换来的。M2.5的平均Token消耗在测试模型中排第6高，几乎是对手Sonnet的2倍。得益于稀宇充足的算力与可控的成本，M2.5在编程…

2026年2月13日
1.1K000
AI产业动态

稀宇MiniMax M2.5深度评测：编程能力突破性提升，逻辑推理稳中有进

短的结论：向下扎根，向上生长基本情况：稀宇的前一代M2.1因技术问题，在逻辑能力上落后于M2。M2.5基本解决了这些问题，能力回归正轨。相比M2，M2.5的综合能力提升约17%。部分进步源于更长的思维链和更深的解空间探索，M2.5的平均Token消耗在测试模型中位列第6，几乎是对手Sonnet的2倍。得益于稀宇充足的算力与可控的成本，M2.5在编程上虽…

2026年2月13日
921000