谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

谷歌深夜放大招:Gemini 3.1 Pro 重磅发布,推理性能翻倍

谷歌在春节档大模型竞争白热化之际,于深夜突然发布了 Gemini 3.1 Pro。相较于去年11月发布的 Gemini 3 Pro,此次虽只是「.1」的小版本号升级,但提升幅度显著。

根据官方演示,3.1 Pro 在多模态生成和语义理解能力上均提升了一个层级。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

新模型还能将日常数据转化为互动可视化内容,例如轻松生成一个航空航天仪表盘:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

在模拟城市生成任务中,它能够一次性完成地形生成、道路铺设和交通线路规划:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

其强大的能力引发了网友热议,甚至有评论认为其他模型可以直接“退场”了。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

推理能力实现跨越式进步

此次升级的核心,是公开了上周发布的 Gemini 3 Deep Think 背后的核心智能。Gemini 3.1 Pro 在核心推理能力上更进一步。

在 ARC-AGI-2 基准测试中,3.1 Pro 获得了 77.1% 的验证分数,其推理性能达到了 Gemini 3 Pro 的 2 倍。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

此外,3.1 Pro 支持 100 万(1M)上下文,知识截止日期为 2025 年 1 月,在多模态理解、代码生成、多语言性能和长上下文处理方面均有增强。

在 Arena 的对比评测中,3.1 Pro 的整体排名分数也比 3 Pro 高出 13 分,文本与代码维度的表现进步明显:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

在官方展示的多模态效果中,对于同一提示词,3.1 Pro 在动作连贯性和色彩输出上较 3.0 Pro 有明显提升:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

在推理能力上,3.1 Pro 能应对结构更复杂、步骤更多的提示词。例如,它能直接生成一个 3D 版“椋鸟群飞”的视觉代码,并实现可交互玩法:用户可通过手势追踪操控鸟群,画面还能根据鸟群运动生成音乐。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

整体而言,Gemini 3.1 Pro 在复杂主题的可视化方面进化显著。

网友们也第一时间对官方宣传进行了检验。例如,用 3.1 Pro 直接生成《我的世界》游戏场景:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

有网友用它快速构建了个人网站:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

还有网友开发了一款教育应用,并称赞其光线模拟效果逼真。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

一轮体验下来,网友普遍认为“Gemini没有在开玩笑”。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

目前,Gemini 3.1 Pro 已在 Gemini 应用和 API 中上线,Google AI Pro 和 Ultra 用户还可以在 NotebookLM 中使用该模型。

成本效率的革命性突破

值得注意的是,这是谷歌首次采用「.1」的小版本号,发布节奏之快引发关注。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

此次升级将大模型向“帕累托前沿”(即在最小化成本的同时最大化性能)又推进了一步。

定价方面,Gemini 3.1 Pro Preview 的输入/输出价格与 Gemini 3 Pro Preview 持平。但从 ARC-AGI 基准的视角看,每完成一次 ARC-AGI-2 任务的花费约为 0.96 美元。

相比之下,性能仅高出几个百分点的 Gemini 3 Deep Think,其价格却是 3.1 Pro 的 10 倍。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

有观点认为,这样的推进速度“完全打破了传统的成本-智能曲线”。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

相比于基准测试成绩的变化,对于高速进化的大模型应用而言,成本方面的持续压缩更值得关注。2026年的大模型竞争,才刚刚开始。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/21916

(1)
上一篇 2026年2月25日 上午11:38
下一篇 2026年2月25日 上午11:38

相关推荐

  • 智能机器人产业生态构建:从技术突破到全要素协同的深度解析

    随着人工智能技术的飞速发展,智能机器人产业正迎来前所未有的变革机遇。从工业自动化到服务型机器人,从人形机器人到特种应用,智能机器人正逐步渗透到社会经济的各个领域。然而,产业的蓬勃发展背后,仍面临着技术瓶颈、产业链协同不足、应用场景碎片化等多重挑战。如何构建健康、可持续的产业生态,成为当前智能机器人领域亟待解决的核心问题。 从技术层面来看,智能机器人的发展高度…

    2025年11月10日
    18900
  • AI自动化率仅3%:Scale AI研究揭示大模型在真实工作场景中的局限性

    近期,Scale AI与Center for AI Safety联合发布的研究报告《远程劳动指数(RLI):评估AI在真实工作环境中的端到端性能》引发广泛关注。该研究通过构建包含240个真实远程工作项目的RLI基准,对全球六大顶尖AI模型进行了系统性评估,结果显示当前AI在处理具有经济价值的复杂任务时,自动化率最高仅为2.5%,整体平均不足3%。这一发现不仅…

    2025年11月6日
    15300
  • Claude深夜全线宕机10小时!AWS数据中心遭不明物体袭击,全球打工人集体断粮

    新智元报道编辑:桃子 好困 【新智元导读】 深夜,Claude突发全球性大规模宕机,引发用户广泛讨论。与此同时,美国财政部宣布全面停用Claude。硅谷数百名CEO与行业领袖联名发起行动,声援Anthropic。 全球Claude用户的心态,在那一刻彻底崩了。一场突如其来的全球性宕机,瞬间引爆网络。 此前,一场抵制ChatGPT、转投Claude的运动在全球…

    2026年3月3日
    27700
  • OpenAI挖角英特尔首席AI官:算力军备竞赛下的巨头人才争夺战

    今天,人工智能领域的格局再次因一次关键人事变动而震动——英特尔首席技术官兼首席AI官Sachin Katti宣布离职,并正式加入OpenAI,负责构建面向通用人工智能(AGI)的算力基础设施。这一事件不仅揭示了OpenAI在算力布局上的战略野心,也暴露了传统芯片巨头英特尔在AI转型中的深层困境。 从技术背景来看,Sachin Katti的加入对OpenAI具…

    2025年11月11日
    15800
  • VinciCoder:视觉强化学习突破多模态代码生成瓶颈,开启统一框架新纪元

    长期以来,多模态代码生成领域的发展始终受限于传统监督微调(SFT)范式的固有缺陷。尽管SFT在Chart-to-code等特定任务上取得了显著成果,但其“狭隘的训练范围”从根本上制约了模型的泛化能力,阻碍了通用视觉代码智能的演进。更为关键的是,纯SFT范式在确保代码可执行性和高视觉保真度方面存在结构性瓶颈——模型在训练过程中完全无法感知代码的渲染效果,导致“…

    2025年11月17日
    14700