中文大模型

字节豆包Seed 2.0 Mini实测：轻量级AI模型如何实现成本效益与性能平衡？

字节跳动近期正式发布了Seed 2.0系列，该系列针对大规模生产环境进行了系统性优化，旨在处理真实世界中的复杂任务。通过提供Pro、Lite、Mini及Code/Preview等全系列尺寸，该系列旨在为不同规模与复杂度的应用场景提供专业级支持。本次评测的Doubao-Seed-2.0-mini是该系列的轻量级版本，面向低时延、高并发与成本敏感场景，强调快速…

2026年2月25日

798000

AI产业动态

MiniMax M2.5全面评测：中文场景性能跃升，Agent能力暴涨10.6%，成本效率比显著优化

MiniMax在春节假期前发布了MiniMax M2.5新版本。官方表示，该模型经过数十万个真实复杂环境中的大规模强化学习训练，在编程、工具调用和搜索、办公等生产力场景达到了行业前沿水平。我们对MiniMax M2.5与上一代MiniMax M2.1进行了全面的中文场景对比评测，测试其在准确率、响应时间、token消耗和成本等关键指标上的表现差异。本次评测…

2026年2月13日

509000

AI产业动态

揭秘大语言模型逻辑能力进化：2026年1月最新评测榜单深度解析

#1 参赛选手本次更新模型（按发布时间顺序），共6个：本月出榜： ERNIE 5.0 Preview（后继正式版）kimi-k2-0905-preview / Kimi-K2-Thinking（后继K2.5）Qwen3-30B-A3B-2507（不再跟踪）Doubao-Seed-1.8（后继1228版）Claude Haiku 4.5（不再跟踪）Qwen…

2026年1月31日

721000

AI产业动态

ERNIE-5.0全面评测：2.4万亿参数旗舰大模型性能与成本深度解析

百度近期正式发布了原生全模态大模型ERNIE-5.0（文心5.0），这是一款参数达2.4万亿、采用原生全模态统一建模技术的旗舰级产品，支持文本、图像、音频、视频等多种信息的输入与输出。我们对ERNIE-5.0正式版与此前的ERNIE-5.0-Thinking-Preview版本进行了全面的对比评测，测试其在准确率、响应时间、token消耗和成本等关键指标上的…

2026年1月24日

1.2K000