谷歌深夜放大招:Gemini 3.1 Pro 重磅发布,推理性能翻倍
谷歌在春节档大模型竞争白热化之际,于深夜突然发布了 Gemini 3.1 Pro。相较于去年11月发布的 Gemini 3 Pro,此次虽只是「.1」的小版本号升级,但提升幅度显著。
根据官方演示,3.1 Pro 在多模态生成和语义理解能力上均提升了一个层级。

新模型还能将日常数据转化为互动可视化内容,例如轻松生成一个航空航天仪表盘:

在模拟城市生成任务中,它能够一次性完成地形生成、道路铺设和交通线路规划:

其强大的能力引发了网友热议,甚至有评论认为其他模型可以直接“退场”了。

推理能力实现跨越式进步
此次升级的核心,是公开了上周发布的 Gemini 3 Deep Think 背后的核心智能。Gemini 3.1 Pro 在核心推理能力上更进一步。
在 ARC-AGI-2 基准测试中,3.1 Pro 获得了 77.1% 的验证分数,其推理性能达到了 Gemini 3 Pro 的 2 倍。

此外,3.1 Pro 支持 100 万(1M)上下文,知识截止日期为 2025 年 1 月,在多模态理解、代码生成、多语言性能和长上下文处理方面均有增强。
在 Arena 的对比评测中,3.1 Pro 的整体排名分数也比 3 Pro 高出 13 分,文本与代码维度的表现进步明显:

在官方展示的多模态效果中,对于同一提示词,3.1 Pro 在动作连贯性和色彩输出上较 3.0 Pro 有明显提升:

在推理能力上,3.1 Pro 能应对结构更复杂、步骤更多的提示词。例如,它能直接生成一个 3D 版“椋鸟群飞”的视觉代码,并实现可交互玩法:用户可通过手势追踪操控鸟群,画面还能根据鸟群运动生成音乐。

整体而言,Gemini 3.1 Pro 在复杂主题的可视化方面进化显著。
网友们也第一时间对官方宣传进行了检验。例如,用 3.1 Pro 直接生成《我的世界》游戏场景:

有网友用它快速构建了个人网站:

还有网友开发了一款教育应用,并称赞其光线模拟效果逼真。

一轮体验下来,网友普遍认为“Gemini没有在开玩笑”。

目前,Gemini 3.1 Pro 已在 Gemini 应用和 API 中上线,Google AI Pro 和 Ultra 用户还可以在 NotebookLM 中使用该模型。
成本效率的革命性突破
值得注意的是,这是谷歌首次采用「.1」的小版本号,发布节奏之快引发关注。

此次升级将大模型向“帕累托前沿”(即在最小化成本的同时最大化性能)又推进了一步。
定价方面,Gemini 3.1 Pro Preview 的输入/输出价格与 Gemini 3 Pro Preview 持平。但从 ARC-AGI 基准的视角看,每完成一次 ARC-AGI-2 任务的花费约为 0.96 美元。
相比之下,性能仅高出几个百分点的 Gemini 3 Deep Think,其价格却是 3.1 Pro 的 10 倍。

有观点认为,这样的推进速度“完全打破了传统的成本-智能曲线”。

相比于基准测试成绩的变化,对于高速进化的大模型应用而言,成本方面的持续压缩更值得关注。2026年的大模型竞争,才刚刚开始。
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21916
