谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

谷歌发布Gemini 3.1 Flash-Lite:主打轻量高速与极致性价比

谷歌近日正式推出 Gemini 3.1 Flash-Lite 模型。从命名可知,该模型主打轻量化与高速度。官方将其定位为迄今为止 Gemini 3系列中性价比最高 的模型。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

其定价极具竞争力:每百万输入token仅需0.25美元,每百万输出token为1.5美元。作为参考,仅需约1.8元人民币的成本,即可让AI处理相当于三本《三体》全集长度的文本。

在性能方面,相较于前代主力模型 Gemini 2.5 Flash,其首次响应token时间快2.5倍,输出速度提升45%。该模型专为 大规模智能应用 设计,旨在实现低成本、高效率的批量部署。

极致性价比解析

Gemini 3.1 Flash-Lite 是Gemini 3系列中速度最快、成本最低的模型,目前已通过Google AI Studio中的Gemini API和Vertex AI平台提供。

在Artificial Analysis基准测试中,其输出速度显著优于Gemini 2.5 Flash,同时价格大幅降低。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

需要指出的是,官方并未将其与 Gemini 3 Flash 直接对比,而是选择了更早的Gemini 2.5 Flash版本。两者定位有所区别:Gemini 3 Flash侧重于逻辑推理效率,而Gemini 3.1 Flash-Lite更关注极致性价比。

与市面上其他轻量级模型(如GPT-5 mini、Claude 4.5 Haiku)相比,Gemini 3.1 Flash-Lite在速度和成本上均表现出显著优势。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

在Arena测评中,该模型获得1432分,与Grok-4.1-fast水平相当,在创意写作和长篇查询任务中表现突出, 领跑低价位段模型。Gemini-3.1 Pro则持续位居高价型号第一梯队,Gemini 3 Flash处于中间位置。

在Code Arena中,它与Qwen3-coder并列第35名,展现出优秀的智能Web开发能力。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

此外,在GPQA Diamond和MMMU Pro基准测试上,Gemini 3.1 Flash-Lite分别取得了86.9%和76.8%的分数,超越了前几代规模更大的Gemini模型。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

除了基础性能,该模型还支持 可调思考层级。开发者可根据任务复杂度,灵活调整模型的思考深度,从而在需要处理高频、大量请求的场景中,更好地 平衡速度与效果

这意味着该模型既能处理低成本批量任务(如长文本翻译),也能胜任需要深度思考的工作(如生成用户界面、执行复杂逻辑指令)。官方示例显示,它能快速将上百种不同类别的产品信息填充至电子商务线框图中。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

总而言之,该模型适用于企业及开发者在生产环境中进行实时响应与大规模任务处理,其高性价比构成了核心竞争优势。

GPT迅速回应

在Gemini 3.1 Flash-Lite发布仅两小时后,ChatGPT迅速推出 GPT-5.3 Instant 作为回应。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元

该模型同样主打快速响应,但侧重点在于优化用户交互体验。据官方介绍,GPT-5.3 Instant能提供更精准的回答,并在联网搜索时给出信息更丰富、语境更贴合的结果,是专为日常对话优化的版本。

有网友对两款模型进行了实测对比。在 编程测试 中,Gemini 3.1 Flash-Lite的输出简洁直接,以单文件实现核心后端功能,便于快速运行,无冗余内容。而GPT-5.3 Instant提供的代码方案更为完整和工程化,更接近真实上线情况,例如其仪表盘数据可实现实时自动刷新。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元 | 谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元
—|—
Gemini 3.1 Flash-Lite | GPT-5.3 Instant

深度推理 任务中,两者表现相当,均能给出正确结果且推导过程清晰。Gemini 3.1 Flash-Lite正确运用了复杂物理学公式,回复结构完整,先给出简要结论再进行数学推导。GPT-5.3 Instant同样完成了推理,并额外提供了表格和通俗解释,使结果更易于理解。

谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元 | 谷歌Gemini 3.1 Flash-Lite震撼发布:性价比之王,每百万token仅0.25美元
—|—
Gemini 3.1 Flash-Lite | GPT-5.3 Instant

然而,在大规模吞吐量和成本控制方面,Gemini 3.1 Flash-Lite显然更具优势。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/24185

(0)
上一篇 9小时前
下一篇 2025年11月17日 下午1:58

相关推荐

  • COMET框架:突破AI加速器性能瓶颈,显式建模集体通信与复合操作数据流

    关键词:复合操作数据流建模、集体通信操作、内存层级优化、机器学习加速器、性能建模与优化 在人工智能技术日新月异的今天,大语言模型、状态空间模型等复杂神经网络已成为推动技术发展的核心引擎。然而,这些模型所依赖的复合操作——即由多个基础操作(如矩阵乘法、归一化、逐元素变换)组合而成的结构化模块——正在对现有的硬件加速器数据流设计与性能优化提出严峻挑战。 传统的数…

    2026年1月26日
    13400
  • ICML 2026征稿新规深度解析:透明度、责任与学术伦理的范式演进

    作为机器学习领域的顶级会议,国际机器学习大会(ICML)每年都引领着学术研究的前沿方向。近日,ICML 2026(将于2026年7月7日至12日在韩国首尔举办)公布了详细的征稿指南与政策更新,这些变化不仅关乎投稿流程,更折射出整个学术社区在透明度、责任伦理与评审机制上的深刻转型。本文将从多个维度深入剖析这些新规,探讨其对研究者、评审体系乃至整个AI生态的长期…

    2025年11月6日
    58600
  • 快手CroPS:跨视角正样本引擎打破搜索信息茧房,AAAI 2026 Oral成果引领向量检索新范式

    短视频搜索是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据,导致系统陷入信息茧房,难以召回潜在相关的新鲜内容。 针对这一问题,快手搜索团队提出了一套全新的检索数据引擎 CroPS(Cross-Perspective Positive Samples)。该方法通过引入用户换 Query 数据、推荐流数据以及…

    2026年1月12日
    11600
  • Sakana AI:估值4000亿日元的AI新星,如何用自然进化思想重塑大模型范式?

    近日,日本AI初创公司Sakana AI宣布完成200亿日元(约合1.35亿美元)的B轮融资,公司估值达到约4000亿日元(约合26.35亿美元),创下日本非上市初创企业的估值纪录。这一数字不仅刷新了日本科技创业生态的天花板,更在全球AI投资趋冷的背景下显得格外耀眼。 Sakana AI成立于2023年7月,由Transformer论文八位作者之一的Llio…

    2025年11月19日
    15300
  • GigaWorld-0:世界模型驱动VLA性能跃升300%,具身智能迈入数据高效新纪元

    在具身智能迈向开放世界落地的进程中,长期制约其发展的核心瓶颈并非算法本身,而是高质量、大规模真实机器人交互数据的极度稀缺。真机数据采集成本高昂、周期漫长,且难以覆盖多样化的开放场景,严重限制了视觉语言动作(VLA)大模型的规模化训练与泛化能力。传统仿真方法虽能快速生成数据,却受限于显著的Sim-to-Real差距,难以支撑真实世界的鲁棒部署。世界模型(Wor…

    2025年12月2日
    15200