谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

谷歌发布Gemini 3.1 Flash-Lite:主打轻量高速与极致性价比

谷歌近日正式推出 Gemini 3.1 Flash-Lite 模型。从命名可知,该模型主打轻量化与高速度。官方将其定位为迄今为止 Gemini 3系列中性价比最高 的模型。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

其定价极具竞争力:每百万输入token仅需0.25美元,每百万输出token为1.5美元。作为参考,仅需约1.8元人民币的成本,即可让AI处理相当于三本《三体》全集长度的文本。

在性能方面,相较于前代主力模型 Gemini 2.5 Flash,其首次响应token时间快2.5倍,输出速度提升45%。该模型专为 大规模智能应用 设计,旨在实现低成本、高效率的批量部署。

极致性价比解析

Gemini 3.1 Flash-Lite 是Gemini 3系列中速度最快、成本最低的模型,目前已通过Google AI Studio中的Gemini API和Vertex AI平台提供。

在Artificial Analysis基准测试中,其输出速度显著优于Gemini 2.5 Flash,同时价格大幅降低。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

需要指出的是,官方并未将其与 Gemini 3 Flash 直接对比,而是选择了更早的Gemini 2.5 Flash版本。两者定位有所区别:Gemini 3 Flash侧重于逻辑推理效率,而Gemini 3.1 Flash-Lite更关注极致性价比。

与市面上其他轻量级模型(如GPT-5 mini、Claude 4.5 Haiku)相比,Gemini 3.1 Flash-Lite在速度和成本上均表现出显著优势。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

在Arena测评中,该模型获得1432分,与Grok-4.1-fast水平相当,在创意写作和长篇查询任务中表现突出, 领跑低价位段模型。Gemini-3.1 Pro则持续位居高价型号第一梯队,Gemini 3 Flash处于中间位置。

在Code Arena中,它与Qwen3-coder并列第35名,展现出优秀的智能Web开发能力。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

此外,在GPQA Diamond和MMMU Pro基准测试上,Gemini 3.1 Flash-Lite分别取得了86.9%和76.8%的分数,超越了前几代规模更大的Gemini模型。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

除了基础性能,该模型还支持 可调思考层级。开发者可根据任务复杂度,灵活调整模型的思考深度,从而在需要处理高频、大量请求的场景中,更好地 平衡速度与效果

这意味着该模型既能处理低成本批量任务(如长文本翻译),也能胜任需要深度思考的工作(如生成用户界面、执行复杂逻辑指令)。官方示例显示,它能快速将上百种不同类别的产品信息填充至电子商务线框图中。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

总而言之,该模型适用于企业及开发者在生产环境中进行实时响应与大规模任务处理,其高性价比构成了核心竞争优势。

GPT迅速回应

在Gemini 3.1 Flash-Lite发布仅两小时后,ChatGPT迅速推出 GPT-5.3 Instant 作为回应。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

该模型同样主打快速响应,但侧重点在于优化用户交互体验。据官方介绍,GPT-5.3 Instant能提供更精准的回答,并在联网搜索时给出信息更丰富、语境更贴合的结果,是专为日常对话优化的版本。

有网友对两款模型进行了实测对比。在 编程测试 中,Gemini 3.1 Flash-Lite的输出简洁直接,以单文件实现核心后端功能,便于快速运行,无冗余内容。而GPT-5.3 Instant提供的代码方案更为完整和工程化,更接近真实上线情况,例如其仪表盘数据可实现实时自动刷新。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元 | 谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元
—|—
Gemini 3.1 Flash-Lite | GPT-5.3 Instant

深度推理 任务中,两者表现相当,均能给出正确结果且推导过程清晰。Gemini 3.1 Flash-Lite正确运用了复杂物理学公式,回复结构完整,先给出简要结论再进行数学推导。GPT-5.3 Instant同样完成了推理,并额外提供了表格和通俗解释,使结果更易于理解。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元 | 谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元
—|—
Gemini 3.1 Flash-Lite | GPT-5.3 Instant

然而,在大规模吞吐量和成本控制方面,Gemini 3.1 Flash-Lite显然更具优势。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/24185

(0)
上一篇 2026年3月4日 下午8:29
下一篇 2026年3月5日 上午10:44

相关推荐

  • OpenAI商业模式变革:从API收费转向价值共享,AI药物研发成新盈利点

    今天一早,OpenAI CEO 山姆·奥特曼在社交媒体上公布了其API业务的收入情况:“仅我们的API业务而言,上个月就增加了超过10亿美元的年度经常性收入(ARR)。” 他进一步表示,公众的注意力大多集中在ChatGPT上,但API团队的工作同样取得了令人瞩目的成就。 奥特曼此举可能意在提振市场信心。近期有消息称,OpenAI正计划进行新一轮融资,目标估值…

    2026年1月23日
    49900
  • ICML 2026征稿新规深度解析:透明度、责任与学术伦理的范式演进

    作为机器学习领域的顶级会议,国际机器学习大会(ICML)每年都引领着学术研究的前沿方向。近日,ICML 2026(将于2026年7月7日至12日在韩国首尔举办)公布了详细的征稿指南与政策更新,这些变化不仅关乎投稿流程,更折射出整个学术社区在透明度、责任伦理与评审机制上的深刻转型。本文将从多个维度深入剖析这些新规,探讨其对研究者、评审体系乃至整个AI生态的长期…

    2025年11月6日
    99300
  • 华人学者苏炜杰获2026考普斯奖:为大语言模型建立严格统计基础,14年来首位华人得主

    在时隔14年之后,有着“统计学诺贝尔奖”之称的考普斯奖(COPSS Presidents’ Award),又一次迎来了华人得主。 2026年考普斯奖颁给了北大校友、现宾夕法尼亚大学副教授苏炜杰。 奖项委员会给他的评语是:“为大语言模型的多项应用建立了严格的统计基础;在隐私保护数据分析方面取得突破性进展,并成功应用于2020年美国人口普查;设计了A…

    2026年2月7日
    27800
  • AI Agent也能自己赚钱了!FluxA推出Agent钱包,让龙虾自主抢红包、交易艺术品

    AI Agent 获得自主支付能力:FluxA 推出 Agent 钱包 现在,AI Agent 也能拥有自己的“数字钱包”了。 只需为 Agent 配置一个钱包和预算,它便能自主调用需要付费的 API 或服务来完成复杂任务,整个过程无需人类手动注册、购买和配置密钥,实现了高度自动化。 完成这一“AI 自主支付”能力的产品,是海外初创公司 FluxA 推出的 …

    2026年3月15日
    63700
  • 从破折号到引号:解码AI文本的“语言指纹”与OpenAI的修正尝试

    在人工智能生成的文本中,一些看似普通的标点符号和语言习惯正逐渐成为识别其来源的“语言指纹”。其中,破折号的过度使用尤为突出,以至于被用户戏称为“ChatGPT体”。这一现象不仅反映了大型语言模型在语言生成上的固有模式,也揭示了人类与AI在语言表达上的微妙差异。 破折号在AI文本中的泛滥并非偶然。从语言学的角度看,破折号具有解释、补充、转折等多种功能,能够使句…

    2025年11月17日
    35600