谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

谷歌深夜放大招:Gemini 3.1 Pro 重磅发布,推理性能翻倍

谷歌在春节档大模型竞争白热化之际,于深夜突然发布了 Gemini 3.1 Pro。相较于去年11月发布的 Gemini 3 Pro,此次虽只是「.1」的小版本号升级,但提升幅度显著。

根据官方演示,3.1 Pro 在多模态生成和语义理解能力上均提升了一个层级。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

新模型还能将日常数据转化为互动可视化内容,例如轻松生成一个航空航天仪表盘:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

在模拟城市生成任务中,它能够一次性完成地形生成、道路铺设和交通线路规划:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

其强大的能力引发了网友热议,甚至有评论认为其他模型可以直接“退场”了。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

推理能力实现跨越式进步

此次升级的核心,是公开了上周发布的 Gemini 3 Deep Think 背后的核心智能。Gemini 3.1 Pro 在核心推理能力上更进一步。

在 ARC-AGI-2 基准测试中,3.1 Pro 获得了 77.1% 的验证分数,其推理性能达到了 Gemini 3 Pro 的 2 倍。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

此外,3.1 Pro 支持 100 万(1M)上下文,知识截止日期为 2025 年 1 月,在多模态理解、代码生成、多语言性能和长上下文处理方面均有增强。

在 Arena 的对比评测中,3.1 Pro 的整体排名分数也比 3 Pro 高出 13 分,文本与代码维度的表现进步明显:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

在官方展示的多模态效果中,对于同一提示词,3.1 Pro 在动作连贯性和色彩输出上较 3.0 Pro 有明显提升:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

在推理能力上,3.1 Pro 能应对结构更复杂、步骤更多的提示词。例如,它能直接生成一个 3D 版“椋鸟群飞”的视觉代码,并实现可交互玩法:用户可通过手势追踪操控鸟群,画面还能根据鸟群运动生成音乐。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

整体而言,Gemini 3.1 Pro 在复杂主题的可视化方面进化显著。

网友们也第一时间对官方宣传进行了检验。例如,用 3.1 Pro 直接生成《我的世界》游戏场景:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

有网友用它快速构建了个人网站:

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

还有网友开发了一款教育应用,并称赞其光线模拟效果逼真。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

一轮体验下来,网友普遍认为“Gemini没有在开玩笑”。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

目前,Gemini 3.1 Pro 已在 Gemini 应用和 API 中上线,Google AI Pro 和 Ultra 用户还可以在 NotebookLM 中使用该模型。

成本效率的革命性突破

值得注意的是,这是谷歌首次采用「.1」的小版本号,发布节奏之快引发关注。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

此次升级将大模型向“帕累托前沿”(即在最小化成本的同时最大化性能)又推进了一步。

定价方面,Gemini 3.1 Pro Preview 的输入/输出价格与 Gemini 3 Pro Preview 持平。但从 ARC-AGI 基准的视角看,每完成一次 ARC-AGI-2 任务的花费约为 0.96 美元。

相比之下,性能仅高出几个百分点的 Gemini 3 Deep Think,其价格却是 3.1 Pro 的 10 倍。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

有观点认为,这样的推进速度“完全打破了传统的成本-智能曲线”。

谷歌Gemini 3.1 Pro重磅发布:推理性能翻倍,成本效率革命性突破

相比于基准测试成绩的变化,对于高速进化的大模型应用而言,成本方面的持续压缩更值得关注。2026年的大模型竞争,才刚刚开始。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21916

(1)
上一篇 2026年2月25日 上午11:38
下一篇 2026年2月25日 上午11:38

相关推荐

  • Gemini桌面客户端重磅发布:原生macOS体验,全局快捷键+窗口共享,AI助手终于坐到你桌边

    谷歌正式为 Gemini 推出了 macOS 原生桌面客户端。这不仅意味着用户可以从网页浏览器中解放出来,更关键的是,Gemini 现在能够通过全局快捷键随时呼出,并直接“看到”你屏幕上的窗口内容,将 AI 助手更深地嵌入工作流。 长期以来,尽管 Gemini 模型能力声量很大,但其桌面端的存在感一直较弱,用户仍需在浏览器中切换标签页进行操作,体验较为割裂。…

    2026年4月17日
    35900
  • AI公司开始为结果买单:Sierra估值150亿美元,RaaS模式能否终结AI泡沫?

    自从黄仁勋在GTC大会上鼓励企业将Token消耗量纳入工程师的KPI考核后,一系列令人费解的现象便层出不穷。 先是Meta内部掀起了“烧Token竞赛”,员工为了冲刺KPI,编写死循环Bot、使用低效提示词来刷数据;紧接着,亚马逊员工为了证明自己“高频使用Agent”,即使是不需要自动化的任务,也强行将其自动化。表面上看,这是大厂员工在“内卷AI使用率”,但…

    3天前
    9300
  • AI裁员潮来袭:2026年科技巨头用机器换人,Oracle、亚马逊、Block裁员数万,AI重写公司用人公式

    截至2026年2月,美国科技行业已裁员约9万人,这一数字比2025年全年裁员总数(约5.5万)高出近100%。本轮裁员的主要公司包括:* 亚马逊:裁员约16,000人,其目标是实现80%的代码由AI生成。* 甲骨文(Oracle):计划裁员30,000至45,000人,以筹集资金投入数据中心建设。* Block:裁员约4,000人,占员工总数的40%。 外界…

    2026年3月25日
    1.6K00
  • DeepSeek-V4来了:百万上下文标配,华为算力下半年上线

    刚刚,DeepSeek-V4来了! 预览版正式上线并同步开源。 一共两个版本: DeepSeek-V4-Pro:对标顶级闭源模型,1.6T,49B激活,上下文长度1M; DeepSeek-V4-Flash:更小更快的经济版,284B,13B激活,上下文长度1M。 官方原话是:在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。 并且: 目前De…

    2026年4月24日
    41400
  • 解放双手!Happy Coder:用手机远程监控与操控AI编程助手

    使用 Claude Code 或 Codex 辅助编程能显著提升开发效率,尤其对于非技术背景的用户,可以快速将想法转化为产品。 这如同拥有了一位专家级别的程序员同事,并且这位同事无需休息,能够 24 小时不间断工作。 然而,它存在一个明显的不足:在工作过程中经常需要与我们确认需求。如果我们不在电脑前,它便会暂停工作,直到我们返回并确认后才能继续。 为此,我在…

    2026年1月24日
    1.6K00