谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

今天凌晨,谷歌正式发布了Gemini 3.1 Pro模型。该模型在多项基准测试中刷新了全领域SOTA(State-of-the-Art)记录,实现了推理能力的大幅跃升。
谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

在ARC-AGI-2测试中,Gemini 3.1 Pro得分77.1%,性能是上一代3.0 Pro的两倍多。在ARC-AGI-1测试中,新模型得分达到98%,超越了GPT-5.2 Pro和Claude Opus 4.6。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

参与过Gemini 3 Deep Think研究的清华校友姚顺宇也参与了3.1 Pro的研究,并发文表示:「后续还会有更好的模型源源不断地涌现」。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

在官方展示的“鹈鹕骑自行车”SVG动画中,同一提示词下,Gemini 3.1 Pro的生成效果相比前代有明显提升。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

百万Token上下文,刷爆全领域SOTA

Gemini 3.1 Pro具备原生的全模态输入能力,支持高达100万Token的超长上下文,知识截止日期为2025年1月。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

谷歌表示,3.1 Pro在核心推理能力上实现了进一步跃升。在内部基准测试中,该模型刷新了多个领域的SOTA成绩:

  • 推理能力:在人类最后考试(HLE)中,Gemini 3.1 Pro在零工具辅助下取得了44.4%的成绩,超越GPT-5.2(34.5%)和Opus 4.6(40%);
  • 科学知识:在GPQA钻石级测试中得分为94.3%;
  • 编码:在LiveCodeBench Pro上Elo得分为2887,在SWE-Bench Verified上得分为80.6%;
  • 多模态理解:在MMMLU测试中达到了92.6%。
谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

在Artificial Analysis的排行榜上,Gemini 3.1 Pro已跃居榜首。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

相比于上一代,Gemini 3.1 Pro的幻觉率降低了38%,这意味着模型在不确定答案时“瞎编”的倾向显著降低。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

应用效果大幅飞跃,SVG生成能力突出

Gemini 3.1 Pro在应用层面的表现相比前代有了显著进步。

例如,在生成3D建模的宝可梦世界时,3.1 Pro的效果更加生动,细节也更丰富。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

在多个演示案例中,3.1 Pro在SVG生成方面表现尤为突出。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

它还能开发逼真的城市规划应用程序,处理复杂地形、绘制基础设施图以及模拟交通,可视化效果质量很高。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

在创意编程方面,3.1 Pro能够将文学主题转化为可运行的代码。例如,为《呼啸山庄》设计一个现代风格的个人主页时,它能深入理解小说基调,构思出时髦现代的界面。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

价格不变,性价比突出

Gemini 3.1 Pro保持了与3 Pro相同的定价:输入每百万tokens 2美元起,输出每百万tokens 12美元起。

相比之下,Claude Opus 4.6的定价为5美元/25美元,GPT-5.2的定价为1.75美元/14美元。据Artificial Analysis计算,跑完整个智能指数测试集,Gemini 3.1 Pro的花费不到Claude Opus 4.6的一半。

谷歌Gemini 3.1 Pro震撼发布:百万Token上下文、全领域SOTA刷新、SVG生成王者,价格不变性能翻倍

在ARC-AGI基准上,每完成一次ARC-AGI-2任务的花费约为0.96美元。相比之下,性能仅相差几个百分点的Gemini 3 Deep Think,价格是3.1 Pro的10倍。

谷歌表示,今天推出的Gemini 3.1 Pro是一个预览版,未来将在自主工作流等领域寻求进一步突破,并会正式全面开放。目前,该模型已在Gemini和NotebookLM中上线,开发者可通过Google AI Studio、Antigravity以及Android Studio抢先体验。

参考链接:
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
https://x.com/ShunyuYao14/status/2024570477390582189
https://deepmind.google/models/gemini/pro/


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/22058

(0)
上一篇 2026年2月20日 上午8:52
下一篇 2026年2月20日 下午8:16

相关推荐

  • DeepSeek开源视觉压缩模型引爆业界,单GPU实现高效长文本处理

    DeepSeek-OCR创新性地提出“视觉压缩文本”范式,通过将文本信息转化为图像表征,有效解决大模型处理长文本时的算力瓶颈。该3B参数模型采用DeepEncoder编码器和DeepSeek3B-MoE-A570M解码器双组件架构,实现用少量视觉token高效表示海量文本内容。实验表明,在10倍压缩率下解码准确率达97%,20倍压缩率仍保持60%准确率。仅需单张A100 GPU即可每日生成超20万页训练数据,在OmniDocBench基准上以最少token数达到SOTA性能。这一突破性方法不仅被业界誉为“AI的JPEG时刻”,更为统一视觉与语言处理、构建类人记忆机制提供了新路径。

    2025年10月21日
    65200
  • 马斯克AI独角兽xAI人才流失加剧:创始团队近六成离职,3位华人联合创始人出走

    已有3位华人联合创始人离职。 智东西2月27日消息,今日上午,马斯克旗下AI独角兽xAI的联合创始人、前谷歌DeepMind工程师 托比·波赫伦(Toby Pohlen) 宣布离职,马斯克在其推文下留言致谢。 据不完全统计,xAI的12位创始团队成员中已有 7位 离职,另有 8位 技术团队成员也已离开。从时间线看,人才流失速度惊人,仅 2月份就有11位 员工…

    2026年2月27日
    56500
  • 智算中心建设蓝图:2026年规划方案与关键技术解析

    一、前言 智算中心的建设需要大量的资金投入,涵盖数据存储设备、计算资源、网络设施以及人工智能模型的开发与优化。尤其在初期阶段,其运营成本较高,特别是电力和冷却系统的需求。因此,如何有效降低长期运营成本并确保投资回报,是企业决策中必须审慎考量的核心问题。 智算中心的建设背景,既根植于持续的技术进步与不断变化的市场需求,也与国家发展战略及产业转型升级紧密相连。随…

    2026年2月1日
    1.2K00
  • Anthropic疯狂输出:从Claude Cowork到Design,揭秘3000词系统提示词背后的设计工程体系

    Anthropic 在今年保持着密集的产品迭代节奏。 打开 Claude 的更新日志,一条紧凑的时间线清晰呈现: 1 月 12 日,Claude Cowork 上线:一个能够直接操作文件系统的桌面级智能体,定位为真正能完成工作的虚拟同事,而非简单的聊天机器人。 2 月 5 日,Opus 4.6 发布:将上下文窗口扩展至 100 万 token,并实现了长达 …

    2026年4月20日
    44700
  • ICML 2026论文:EMFormer破解气象预测三大痛点,精度效率双提升还能跨界视觉任务

    随着全球气候变化日益复杂,气象预测已成为机器学习领域最具挑战性的赛道之一。近日,国际机器学习顶会 ICML 2026 接收了论文《Efficient Multi-Scale Transformer for Accumulative Context Weather Forecasting》。 该研究提出的高效多尺度 Transformer 架构(EMForme…

    2026年5月15日
    16800