谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

谷歌I/O 2026大会火力全开,劈柴与Demis Hassabis同台亮相,将半年积攒的重磅技术一夜之间悉数揭晓。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

毫无悬念,今晚的绝对主角——Gemini Omni正式登场!

作为一款真正意义上的“全能”大模型,Omni能够接收任意形式的输入,并生成任何类型的内容。

它首发支持视频输出,堪称“视频版Nano Banana”。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

另一大高潮来自Gemini 3.5 Flash

在几乎所有基准测试中,3.5 Flash都实现了对自家前代旗舰Gemini 3.1 Pro的碾压式超越。

输出速度直接翻倍,相比GPT-5.5和Opus 4.7更是快了4倍有余。

性能更强的3.5 Pro版本,则计划于下个月发布。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

此外,还有一系列重磅新品亮相:

· Antigravity 2.0:全新独立桌面应用,从IDE进化为Agent开发平台

· Gemini Spark:个人AI特工,7×24小时云端运行

· Gemini App改版(代号Neural Expressive),转为算力计费模式

· AI Ultra订阅计划新增100美元档位,最高档从250美元降至200美元

· 谷歌搜索迎来25年来最大升级,接入3.5 Flash,新增智能搜索框、自动生成mini应用等功能

……

毫不夸张地说,这场I/O大会的干货密度堪称历年之最。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

Gemini Omni首发:一个“全能”AI诞生了

正如预热视频所疯狂暗示的那样,万众期待的Gemini Omni终于到来。

Hassabis亲自登台宣布:“我们正迈出下一个重要的一步——Gemini Omni,这是一个可从任何输入创建内容的全新模型。”

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

这个排面足以说明一切。谷歌此次要打造的,是一个“全能”的AI创作引擎。

它将Gemini的智能与最强的生成式AI融为一体,在世界理解、多模态和编辑三个维度上全部拉满。

直白地说,只要给出图片、音频、视频、文字的任意组合,它就能生成一段高质量视频。而且,用户可以通过聊天的方式编辑视频。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

更关键的是,Omni不仅仅是“看起来像”,它真的在理解物理世界。

Hassabis的原话是,以前的系统在模拟重力、动能等概念时经常翻车,但Omni实现了一个“阶跃变化”。

它将Gemini的“世界知识”和“推理能力”注入了视频生成

只需一句prompt“用粘土动画解释蛋白质折叠”,生成的视频里氨基酸链折叠成α螺旋和β折叠的每一步都科学准确,视觉上是精致的定格动画。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

又比如为英文26个字母匹配对应物体。

C是水豚(Capybara),D是迪斯科球,L是熔岩灯。Omni不是在拼贴素材,它真的在把语言、图像和语义联结在一起。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

不得不说,从逼真到有意义,这一步跨得太大了。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

在台上,Hassabis掏出一段自拍视频开始现场魔改。手掌上随手画的圈变成了黑洞,傍晚散步的街道变成了赛博朋克场景。

一句话重写画面,一句话改变世界。

任何东西都可以成为创造全新现实的画布。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

再比如,自拍掌中玩火,一张纸画了一个圈立即变黑洞,各种脑洞大开的玩法都可实现。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

|

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

而且,这不是一次性生成完事。用户可以接着聊。

Gemini Omni输出的视频,角色保持一致,物理逻辑成立,场景记忆连贯。

从一段原始的演奏画面开始。第二轮,“把小提琴手传送到这张图片的环境里”,附一张雪山草地的参考图,场景瞬间切换,动作、光影全部适配新环境。

第三轮,“把镜头切到小提琴手的肩膀后方”,视角旋转,但演奏动作和音乐完全连续。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

不论场景如何变幻,画面的主体都不会崩坏。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

更让人细思极恐的是,Omni的输入灵活性。

图片、文字、视频、音频,任何参考物都可以混合输入,生成一个连贯的输出。

用户甚至可以创建自己的Avatar,让AI版的自己出现在任何场景中,说自己的声音、做自己没做过的事。

目前,Omni Flash已正式上线,API版本将在未来几周开放。而更强的Omni Pro也在路上了。

凭借谷歌强大的整合能力,Omni首发就接入了Gemini App、Google Flow和YouTube Shorts,YouTube Shorts用户甚至可以免费使用。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

Flash干翻Pro:3.5重写了“旗舰”的定义

Gemini Omni之后,I/O大会本场另一重头戏,就是全新旗舰Gemini 3.5 Flash的发布。

谷歌给它的定义是:迄今最强的编码、智能体模型。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

现场,劈柴亲口宣布:“3.5 Flash在几乎所有基准测试中,全面胜出Gemini 3.1 Pro!”

要注意,3.1 Pro可是谷歌三个月前才推出的旗舰模型,现在,一个Flash级别的模型就把它碾了。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

没想到,谷歌竟在如此短时间内,交出了亮眼的成绩单:

  • Terminal-Bench 2.1(编码):76.2%
  • GDPval-AA(真实世界Agent任务):1656 Elo
  • MCP Atlas(大规模工具使用):83.6%
  • CharXiv Reasoning(多模态理解):84.2%

以上四大基准测试,相较于Gemini 3.1 Pro,3.5 Flash堪称断层跃迁。

在速度方面,3.5 Flash独占一个象限,289 tokens/秒,比其他前沿模型快4倍还要多。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

|

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

另外,3.5 Flash在一部分基准测试中,性能媲美,甚至足以碾压GPT-5.5、Claude Opus 4.7。

不得不说,3.5 Flash又快又强,几乎没有对手。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

参数太抽象,不如看看下面这个真实的极限演示。

只需一瞬间,3.5 Flash就能消化一篇天书般的学术论文,并写出一个带有完美交互的可视化网站。

在智能体任务中,通过Antigravity,它可以完成多步工作流,自动对铺屏的资产完成分类和命名。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

亦或是,利用两个Agent,在短短六小时内复现了AlphaZero论文,并编写出一款可完整运行的游戏。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

**

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

**

93个Agent造出OS,仅12小时

可以看到,3.5 Flash这一切能力的实现,全部是借助全新Antigravity 2.0实现的。

今天,谷歌Agent开发平台Antigravity升级到了2.0,从IDE变成了独立桌面应用,彻底拥抱Agent-first设计。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

Varun上台给出一个让全场屏息的Demo。

他让Antigravity搭载3.5 Flash,从零开始构建一个操作系统。

93个Agent协同工作,发送超过15000次模型请求,处理了26亿个token。经过12小时,一个原本空白的项目演变成了功能完整的操作系统内核。

调度程序、内存管理和文件系统——每一行代码都由Agent编写、测试和审计。

API总成本不到1000美元。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

随后,他尝试在这个AI生成的操作系统上运行DOOM。

首次尝试失败,原因是缺少视频和键盘驱动。他立刻在Antigravity 2.0中输入修复指令,Agent自动开始补写驱动代码。

片刻后,DOOM画面显示在屏幕上,全场爆发出掌声。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

|

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

—|—

总结来说,Antigravity 2.0的核心升级包括:

  • 子Agent可动态创建,主Agent将任务拆分为子任务并分配,互不干扰地并行执行;
  • 异步任务管理确保长时间操作不再阻塞主线程;
  • Scheduled Tasks支持设置定时任务,让Agent自动执行,比如每天检查一次PR状态,或每小时运行一次健康检查脚本。

新增斜杠命令:/goal 让Agent一次性完成所有任务,/grill-me 则反过来让Agent先明确需求再动手,/browser 显式控制浏览器的使用。

不过,这些都是内部已验证的功能。

谷歌内部使用Antigravity处理token的速度,3月份是每天5000亿。如今,这一数字飙升至每天3万亿。

而且,这个12倍加速版的Flash,今天起在Antigravity中即可使用。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

3.5 Flash同时成为Gemini App和Google搜索AI Mode的默认模型,面向全球所有用户开放。

开发者可通过Antigravity 2.0、Gemini API、Google AI Studio调用。企业用户则通过Gemini Enterprise Agent Platform接入。

更令人震撼的是,3.5 Pro正在内部测试中,预计下个月发布。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

7×24小时个人管家:谷歌Spark终于来了

今晚的第三大发布,当属Gemini Spark!

劈柴对其定位非常明确:你的个人AI Agent。即使合上笔记本电脑,它也不会停歇。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

|

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

—|—

它运行在云端的专用虚拟机上,可实现7×24小时在线。

Gemini Spark由Gemini 3.5和Antigravity框架驱动,深度整合了谷歌的“办公全家桶”。

产品副总裁Josh Woodward上台演示了两个场景,直接让全场陷入疯狂。

第一个是工作场景:输入一条指令,“帮我起草一封给团队的邮件,汇总过去一周关于Gemini Live发布的所有信息”。

Spark自动跨Gmail、Docs和聊天记录抓取信息,还调用了Woodward自己编写的一个“ghostwriter”技能,让邮件自动匹配他的个人语气。

整个过程在后台完成,人类只需审核和发送。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

没错,Spark支持自定义技能(skills),让它学会你的口吻、你的偏好、你的工作方式。

第二个是生活场景:规划一场街区派对。

Spark收到任务后一步步执行。它创建了一个Google Sheets的RSVP追踪表,直接连接Gmail,谁回复了自动更新。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

|

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

—|—

对于未报名的邻居,Spark自动起草催促邮件,生成草稿等确认后再发送。

然后,它还生成了一个Google Slides的宣传演示文稿,连街区里要放充气城堡的信息都写进去了。

全程无需打开任何App。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

不仅如此,Spark还具备强大的语音输入能力。

现场,Woodward掏出手机,直接用语音甩出三个任务:

“找到所有跟Sundar的会议标成亮粉色”、“给新邻居John写邀请函加入block party名单”、“创建一个文档列出学年结束前要为孩子做的事,按截止日期排序”。

语音直接转成了文字指令,Spark自动将一段连续的语音拆分成三个独立任务线程,在后台并行执行。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

定价方面,AI Ultra订阅每月100美元可用Spark Beta。最高级Ultra计划从250美元降至200美元。

Spark将在下周率先对美国AI Ultra用户开放Beta版试用。

谷歌I/O 2026炸场:Gemini Omni全能模型发布,视频生成碾压OpenAI和Anthropic

这一夜,谷歌撕开了ASI入口

回顾这次I/O,真正令人震撼的,不是某一个产品。

而是所有能力同时到位。

全模态理解、全模态生成、全天候在线Agent——这三块拼图,谷歌在一夜之间全部拼上了。

Omni将一句话变成一个世界,无需人类提供任何素材。

93个Agent从零造出操作系统,无需人类写一行代码。

Spark 7×24小时替你工作,无需人类打开一个App。

当AI不再需要人类“喂料”,而是自己理解、自己决策、自己执行、自己迭代——这条路的终点,叫ASI。

没有人能给出确切的时间表。但今晚的Google I/O,让所有人意识到一件事:

通往超级智能的路上,已经没有“技术上做不到”这个障碍了。剩下的,只是工程部署的速度。

半年前我们还在争论AGI是不是泡沫。半年后,谷歌已经在用Agent写操作系统了。

这个行业的加速度,已经超出了人类直觉能感知的范围。

参考资料:

https://youtu.be/wYSncx9zLIU

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/

https://antigravity.google/blog/introducing-google-antigravity-2-0

https://antigravity.google/blog/google-io-2026-feature-deep-dive


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/35528

(0)
上一篇 1小时前
下一篇 1小时前

相关推荐

  • 视频仿真革命:Google DeepMind用Veo模型重塑机器人策略评估范式

    在通用型机器人技术快速发展的当下,如何高效、安全地评估机器人策略已成为制约行业进步的关键瓶颈。传统基于真实硬件的评估方法不仅成本高昂、耗时漫长,更在安全性测试方面存在难以逾越的障碍。Google DeepMind Gemini Robotics团队最新提出的基于Veo视频模型的机器人策略评估系统,为这一难题提供了突破性的解决方案。 传统评估体系面临的根本性挑…

    2025年12月15日
    43900
  • TOON vs JSON:为LLM优化的结构化数据格式革命

    在提示词日益冗长、AI模型愈发强大的当下,一个核心问题反复浮现:如何同时降低使用成本和处理时间? 在以编程方式使用大语言模型时,结构化输出已成为标准实践。开发者可以要求模型按特定格式输出,例如JSON。通过定义一个模型架构并阐明各字段含义,AI会尽力理解上下文,并在其能力范围内填充输出。 这使得处理AI的响应变得前所未有的便捷。然而,输入环节呢? 即便我们能…

    2026年1月31日
    39900
  • 从监狱到AI独角兽:Firmus如何用690亿债务融资打造1.6GW绿色算力工厂

    澳洲AI基础设施独角兽狂吸金,要建出1.6GW的数据“巨兽”。 他蹲过大牢,做过加密货币,现在转投AI基础设施,一次直接融资超100亿美元。这一句话,浓缩了澳洲AI基础设施独角兽Firmus联合创始人兼首席执行官Oliver Curtis的十年。 智东西2月14日报道,2月9日,Firmus宣布获得了约100亿美元(约合人民币690亿元) 的债务融资,融资由…

    2026年2月14日
    35500
  • 神经网络权重空间的柏拉图式启示:通用子空间假说如何重塑AI架构认知

    近期,约翰斯・霍普金斯大学的一项突破性研究揭示了神经网络训练中一个令人震撼的规律:超过1100个在不同数据集、不同初始化条件下训练的神经网络,其最终学到的权重都会收敛到一个共享的低维子空间。这一发现不仅挑战了传统机器学习中“数据驱动一切”的范式,更暗示着神经网络架构本身可能蕴含着某种先验的数学结构——所有训练过程本质上都是在“发现”而非“创造”这个早已存在的…

    2025年12月14日
    39700
  • 微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复

    微软突破亿年数据存储:玻璃硬盘Silica技术登Nature,实现零错误恢复 《三体》中,人类为文明选择的“亿年级”存档方案,是最原始的“把字刻在石头上”。如今,微软的研究团队真正将数据刻在了玻璃里。 《自然》杂志最新发表的研究,展示了一种名为Silica的三维光学玻璃存储技术。在一块巴掌大小(120mm×120mm)、仅2mm厚的玻璃片中,研究团队实现了3…

    2026年2月21日
    76200