推理性能
-
谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破
谷歌深夜放大招:Gemini 3.1 Pro 重磅发布,推理性能翻倍 谷歌在春节档大模型竞争白热化之际,于深夜突然发布了 Gemini 3.1 Pro。相较于去年11月发布的 Gemini 3 Pro,此次虽只是「.1」的小版本号升级,但提升幅度显著。 根据官方演示,3.1 Pro 在多模态生成和语义理解能力上均提升了一个层级。 新模型还能将日常数据转化为互…
-
成本与性能的完美平衡:字节豆包Seed 2.0 Lite深度评测,73.9%准确率仅需5.4元/千次调用
春节前夕,字节跳动正式发布了 Seed 2.0 系列大模型。在先前的评测中,我们已经对该系列的旗舰版本 Doubao-Seed-2.0-pro 进行了详细分析。 在实际的商业落地与开发场景中,模型的成本控制往往与性能表现同等重要。与 Doubao-Seed-2.0-pro 版本同期发布的,还有定位更加轻量、普惠的 Doubao-Seed-2.0-lite 模…
-
Gemini 3.1 Pro Preview深度评测:推理速度登顶,成本优势收窄,与GPT-5.2上演巅峰对决
短的结论:王与马共天下 基本情况: Google与OpenAI在顶尖模型上的追逐异常激烈。三个月前,Gemini 3 Pro曾领先于当时的GPT-5,随后被GPT-5.2反超,双方各领风骚数十天。如今,Gemini 3 Pro停留在Preview阶段,其继任者3.1 Pro Preview登场,而保持了两个月智力王冠的GPT-5.2,其领先地位再次被Goog…
-
谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,多项基准测试刷新纪录,重新登顶AI模型王座
上周,谷歌发布了 Gemini 3 Deep Think 的一次重大更新,以应对当今科学、研究和工程领域的复杂挑战。而就在刚刚,谷歌正式推出支撑这些突破的升级版核心智能:Gemini 3.1 Pro。 参与了 Gemini 3 Deep Think 研究的姚顺宇也发推介绍了这项新突破,并表示:「后续还会有更好的模型源源不断地涌现」。 谷歌表示,基于 Gemi…
-
字节Seed-2.0-pro深度评测:挑战GPT与Gemini,多模态推理新标杆
短的结论:通往下一个时代的钥匙 基本情况: 字节跳动推出的多模态大模型 Seed-2.0-pro,是其技术序列中的关键升级。此前,Doubao 1.8 版本已展现出接近国际领先水平的潜力,而如今经过全面打磨的 Seed-2.0-pro 旨在确立其顶尖地位。 综合来看,Seed-2.0-pro 无愧于“Pro”的定位,在核心能力上与 Gemini 3 Pro …
