中文大模型
-
字节豆包Seed 2.0 Mini实测:轻量级AI模型如何实现成本效益与性能平衡?
字节跳动近期正式发布了Seed 2.0系列,该系列针对大规模生产环境进行了系统性优化,旨在处理真实世界中的复杂任务。通过提供Pro、Lite、Mini及Code/Preview等全系列尺寸,该系列旨在为不同规模与复杂度的应用场景提供专业级支持。 本次评测的Doubao-Seed-2.0-mini是该系列的轻量级版本,面向低时延、高并发与成本敏感场景,强调快速…
-
MiniMax M2.5全面评测:中文场景性能跃升,Agent能力暴涨10.6%,成本效率比显著优化
MiniMax在春节假期前发布了MiniMax M2.5新版本。官方表示,该模型经过数十万个真实复杂环境中的大规模强化学习训练,在编程、工具调用和搜索、办公等生产力场景达到了行业前沿水平。我们对MiniMax M2.5与上一代MiniMax M2.1进行了全面的中文场景对比评测,测试其在准确率、响应时间、token消耗和成本等关键指标上的表现差异。 本次评测…
-
揭秘大语言模型逻辑能力进化:2026年1月最新评测榜单深度解析
#1 参赛选手 本次更新模型(按发布时间顺序),共6个: 本月出榜: ERNIE 5.0 Preview(后继正式版)kimi-k2-0905-preview / Kimi-K2-Thinking(后继K2.5)Qwen3-30B-A3B-2507(不再跟踪)Doubao-Seed-1.8(后继1228版)Claude Haiku 4.5(不再跟踪)Qwen…
-
ERNIE-5.0全面评测:2.4万亿参数旗舰大模型性能与成本深度解析
百度近期正式发布了原生全模态大模型ERNIE-5.0(文心5.0),这是一款参数达2.4万亿、采用原生全模态统一建模技术的旗舰级产品,支持文本、图像、音频、视频等多种信息的输入与输出。我们对ERNIE-5.0正式版与此前的ERNIE-5.0-Thinking-Preview版本进行了全面的对比评测,测试其在准确率、响应时间、token消耗和成本等关键指标上的…
