早上趁着工作间隙浏览帖子时,发现一位网友晒出了一组疑似 Gemini 3.5 Flash 的实测数据,结果着实令人震惊。
先来看看速度表现:
- 第一组:首字延迟 6850 毫秒,每秒处理 934 个 tokens。
- 第二组:首字延迟 7486 毫秒,每秒处理 923 个 tokens。
- 第三组:首字延迟 4421 毫秒,每秒处理 577 个 tokens。
- 第四组:首字延迟 3630 毫秒,每秒处理 673 个 tokens。
它并非偶然爆发一次,而是在不同任务中,都能稳定维持在一个相当夸张的速度区间。
更离谱的是代码编写能力:
网友在真实的编码场景下实测,Gemini 3.5 最快能达到每秒 1141 个 tokens(tps),普通速度也能稳定在 900 tps 左右。
这个数字有多夸张呢?我们可以拿官网目前的 Gemini 3 Flash 做个对比。
谷歌官方对 Gemini 3 Flash 的定位,本就是“为速度而生”(built for speed)。在 Artificial Analysis 的 Google AI Studio 测试中,它的输出速度大约为 164.8 tokens/s,首字延迟约 6.95 秒。
以此为参照,网友实测的速度大约是官网 3F 版本的 3 到 7 倍。虽然网友的测试口径与标准化的 API 跑分存在一些差异,但这个差距已经足够惊人。
紧接着,网友又测试了 Gemini 3.5 的前端代码编写能力。
首先让它构建一个 MC 沙盒游戏。从截图来看,页面已经包含了方块地形、角色视角、游戏界面以及操作区域。
接着,再让它生成一组天气卡片并查看效果。这个测试更侧重于 UI 审美,听起来简单,但实际上特别容易暴露模型的真实水平。较弱的模型,最终往往会做出一张表格,所有元素杂乱地堆砌在一起,能用,但毫无美感。而能否有层次地呈现信息,是判断模型是否具备审美能力的关键。
网友接连放出了几张效果图,整体观感不错。最后是真实的网页效果,配色高级,延续了 Gemini 一贯的前端审美水准。
如果一个模型只是速度变快,那有可能是纯粹牺牲质量换来的。但如果它速度暴涨,同时代码生成质量没有明显下降,那性质就完全不同了。
此外,网友还测试了 Simple Bench,结果稳定在 9/10,概率题全部正确,没有出现退步。
可以肯定的是,Gemini 3.5 并非一个为了追求速度而牺牲质量的阉割版本。
一、版本重塑
按照惯例,新一代 Gemini 应该被命名为 Gemini 3.2。但从网友 Lentils 的爆料来看,谷歌大概率会选择直接跳级,命名为 Gemini 3.5。这个举动很值得玩味。
它更像是在向外界宣告:这不是一次小修小补,而是 Gemini 3 系列的版本重塑。
目前,模型尚未正式发布,但外界已经有不少爆料,开始提前为它定调。
早在这次跳级命名曝光之前,Abacus.AI 的 CEO Bindu Reddy 就在 X 平台上披露过一组数据。据她所述,早期的基准测试(benchmark)显示,新一代 Gemini Flash 在编码和推理任务上,能达到 GPT-5.5 大约 92% 的性能,但推理成本仅为 GPT-5.5 的十五分之一到二十分之一。
网友 Fandu 也曾扒到过模型选择器的最新界面,认为新一代 Gemini 很可能有较大调整。它不仅将原生支持 MCP 第三方工具接入,思维模式也从原来的独立 Thinking 模式,变成了全局开关,分为 Standard 和 Extended 两档。
最后,还有一件比较有趣的事。X 平台上的 AI 圈知名爆料人 can,曾披露过一批新一代 Gemini 的 SVG 输出样例。一个是 DualShock 4 手柄的交互式蓝图拆解,另一个是鹈鹕骑自行车的矢量插画。
可以看到,新一代 Gemini 不只是生成一张图,而是附带了一个 7 维定制面板,可以调整车架颜色、光照、头饰、篮筐内容以及蹬车速度。这已经不是传统意义上的 SVG 生成了,更像是通过一个 prompt 就能直接生成一个可交互的小型 Web 应用。
当然,这些都还不是谷歌官方盖章确认的信息。但无论这其中有多少营销预热,多少群众猜测,我们至少能得出一个非常明确的结论:新一代 Gemini 的升级重点,大概率不是单纯把模型分数往上推一点,而是瞄准了一套更完整的能力组合。
我目前的猜测是,新一代 Gemini 很可能不会只围绕“模型智力”来展开叙事。它更可能会把重点放在三个词上:快、便宜、能干活。尤其是“快”这一点,我认为可能是谷歌这次最想打穿的地方。
因为在 AI 编程这件事上,Gemini 并非完全不会写代码。它的问题是,在开发者心中,Claude Code 和 Codex 已经先入为主地占据了位置。很多人一想到 AI 编程,第一反应不是 Gemini,这对谷歌来说就很尴尬。所以,它如果想重新杀回这个战场,更现实的打法就是,先把用户最容易感知的体验做到极致。
二、I/O 大会马上来了
我亲测下来,目前还没有稳定可用的 Gemini 3.5 途径。现在各种说法也比较混乱,有人说云端能用,有人说反重力(指非官方渠道)里能用。前面那位网友,正是通过非官方的 CPA 反代渠道,将其包装出来进行测试的。
所以,如果你现在打开 Gemini、AI Studio 或者反重力渠道,没有看到 Gemini 3.5,也很正常。这波更像是发布前露出的一些边角料。
真正关键的,还是即将到来的 Google I/O 大会。Google I/O 2026 将于 5 月 19 日至 20 日举行,主 keynote 定于太平洋时间 5 月 19 日上午 10 点,也就是北京时间 5 月 20 日凌晨 1 点。
除了 Gemini 3.5,另一个最值得关注的产品是 Gemini Spark。Spark 的前身是谷歌内部代号为 Remy 的 Agent 升级版,谷歌计划打造一个 24 小时在线的日常 AI Agent,用于接管更长链路的任务。看起来,谷歌仍然更关注多模态系统。
不过,我现在也不太想把期待拉得太满。OpenAI 依靠高频迭代不断刷存在感,GPT-5.5 的效果大家已经看到了,模型能力依然排在第一。Anthropic 则依靠长久稳定的体验和开发者口碑,将 Claude Code 牢牢钉进了 AI 编程的主战场。
也就是说,留给谷歌的空间其实不多了。如果它拿不出什么真东西,真的很难收场……
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/35364

