DeepMind CEO揭秘:后Gemini3时代,谷歌如何用AI仿真环境攻克所有疾病?

DeepMind CEO揭秘:后Gemini3时代,谷歌如何用AI仿真环境攻克所有疾病? DeepMind CEO揭秘:后Gemini3时代,谷歌如何用AI仿真环境攻克所有疾病?

Gemini 3 Deep Think 的发布,在业界引发了巨大震动。谷歌这款最前沿的模型,以惊人的速度将聊天机器人推向了新的高度,使其成为一个能力超越普通人、甚至博士水平的强大科研助手。这一切的背后,都离不开一个曾被马斯克、奥特曼等人视为“危险人物”的名字:Demis Hassabis

从击败围棋世界冠军的AlphaGo,到解决蛋白质折叠难题的AlphaFold,再到如今全面主导谷歌AI战略的Gemini,Demis的职业生涯如同一部现代AI发展的编年史。近日,《财富》杂志在其YouTube官方频道发布了达沃斯世界经济论坛期间对Demis的独家专访。主持人、《财富》杂志主编Alyson Shontell,对这位以5亿美元将DeepMind出售给谷歌、并在不到一年内成功主导Gemini逆袭OpenAI的诺贝尔奖得主,进行了一次深度对话。

这次访谈,既是对Demis职业高光时刻的个人复盘,也揭示了谷歌在通往通用人工智能(AGI)道路上的里程碑式思考。核心观点如下:

首先,Demis提出了一个关键判断:AI的发展主线正变得异常“浓缩”。

“每一年都浓缩了过去十年的进展。今年也不会例外,节奏非常紧张。”

他认为,战略判断的窗口期正在缩短,组织的反应速度必须重构。从全局看,Gemini 3是一个分水岭,标志着AI已接近能够构建真正的“智能体(Agent)系统”。他预计,到今年年底,“我们将开始看到‘将完整任务交给AI执行’的形态落地”。

其次,Demis指明了另一个方向:模型将走进现实世界。重点不在于让设备端的模型变得更强,而是打造一个“通用助手”(谷歌内部已存在原型)。它将存在于所有终端——浏览器、手机、车载系统、未来的智能眼镜,并具备跨场景的连续认知能力。这暗示着对人机交互形态的重新定义。

“我认为技术能力现在终于接近可行的临界点,这可能会成为眼镜形态的杀手级应用。”

当然,Demis本人重仓押注的领域,依然是AI医疗。他的目标堪称宏大:“解决所有疾病”。这并非硅谷式的空谈,Demis已经看到了清晰的解决路径:大规模计算模拟 → 化学空间搜索 → 湿实验仅用于验证。在他看来,药物研发的主战场将从实验室,转向由AI算力支撑的通用药物发现引擎平台。

“我认为,要在健康领域实现跃迁式进展,就必须把大规模假设搜索和分子设计放在计算机模拟环境中完成,这比湿实验室效率高出数百甚至上千倍。湿实验室更多承担验证角色。”

此外,在机器人领域,Demis判断未来18个月内有望看到突破性进展。

以上所有方向,都是谷歌目前全力推进的重点,当然也包括持续提升Gemini模型本身的能力。

当被问及如何在如此快的迭代节奏下同时管理多个项目和团队时,Demis透露了他的工作状态。他坦言并无妙招,唯有四个字:“加班熬夜”。他每天保证6小时睡眠,白天在办公室安排密集的背靠背会议,几乎没有间隔。晚上与家人共度时光后,大约10点开始第二轮工作,持续到凌晨4点,这段时间主要用于思考、研究和创造性工作。这样的节奏,Demis已经保持了十年。

对于AGI的实现,Demis依然保持着他谨慎的工程视角。他认为必须为此做好全方位准备:可靠性、安全性、部署框架,以及商业层面的权衡。

“过去十多年我学到的一点是,当目标极其宏大,比如解决所有疾病或构建AGI,必须设定阶段性里程碑。这些节点本身也很有挑战,但能让你确认方向正确。AlphaGo、AlphaFold,再到Gemini,都是这样一步步拆解完成的。”

展望未来十年甚至更久,Demis给出了一个乐观的设想:

“如果方向走对,十到十五年后,我们会进入一个全新的发现黄金时代,某种意义上的文艺复兴。”

他预见,个性化医疗将成为现实,人类将利用AI解决诸多重大科学难题,例如新材料、可控核聚变、更高效的太阳能与电池技术,甚至找到解决能源危机的路径。再往后,人类可能进入一个极度富足的时代,拥有充足能源去探索宇宙、走向星际。

“我相信这就是人类的命运。”


深度回溯:关键节点的幕后

历史总有蝴蝶效应:5亿美元卖给谷歌,间接催生了OpenAI

Demis拥有计算机科学和认知神经科学双博士学位。2010年,他与人共同创立DeepMind,公司目标雄心勃勃——解决“智能”这一终极问题。在他的领导下,DeepMind在人工智能模型上取得了一系列突破。四年后,谷歌以数亿美元收购了这家研究型初创公司。

主持人:Demis,我们现在在达沃斯。谢谢你抽时间。你刚经历了一个重大的2025年,也在为2026年做准备。在谈这些之前,我想让大家更多了解你。你热爱国际象棋,是一名大师级棋手;也热爱天文学。这两件事如何把你带入AI?

Demis:我从小就对天文学、宇宙学、物理学这些领域感兴趣,因为我总是在思考那些宏大的问题——宇宙究竟在发生什么?意识是什么?意识的本质是什么?如果你对这些问题着迷,很自然会被物理学吸引。另一方面,我也热爱游戏和策略。小时候我非常认真地下国际象棋,这其实是在训练自己的思维。下棋让我开始思考“思考本身”——大脑如何运作?这些兴趣最终汇聚在一起,引导我走向AI。计算机和人工智能既能帮助我们理解自身的心智,也能成为理解宇宙的强大工具。

主持人:2014年你将DeepMind以大约5亿美元卖给谷歌。这是一笔热门交易,Meta当时也想收购。从今天看,这可能是商业史上最具变革性的交易之一。你为谷歌打下了AI机器的基础。回头看,你如何评价那个决定?当时就意识到这是关键时刻吗?

Demis:是的,我们当时其实很清楚。2010年我们创立DeepMind时,几乎没人谈论AI,但我们知道方向。我们的使命是解决智能,然后用它去解决其他一切问题。目标是打造通用人工智能,并优先用于科学研究。2014年谷歌找上门,这笔交易由当时的CEO Larry Page推动。某种程度上,这个价格低估了未来价值。但对我而言,关键从来不是钱,而是使命,是加速实现通用人工智能和解答科学问题的进程。谷歌拥有强大的算力,这对发展智能至关重要。我当时就对Larry说,这可能会成为谷歌历史上最重要的一次收购之一——考虑到他们曾收购YouTube和Android,这句话分量很重。

主持人:如果回看OpenAI的起源,马斯克和Sam Altman之所以联手,部分原因就是担心谷歌在收购DeepMind后在AI领域形成垄断。某种意义上,你也催生了一个超级竞争对手。

Demis:历史中总有蝴蝶效应。还有一个重要因素是AlphaGo的成功。那是第一个击败围棋世界冠军的程序,基于强化学习和深度学习。2016年的那场胜利是一个分水岭,也为现代AI时代鸣响发令枪。包括OpenAI的创始人,也是在看到那场比赛后意识到这一方向的潜力。


凭借AlphaFold获得诺贝尔奖:解决困扰科学界50年的难题

2015年,AlphaGo成为首个击败职业围棋冠军的AI系统。此后,DeepMind的模型在国际象棋、Stratego以及《星际争霸II》等游戏中接连击败顶级选手。

2020年,AlphaFold2解决了困扰科学界数十年的蛋白质折叠问题——仅凭氨基酸序列就能以极高准确度预测蛋白质的三维结构。团队随后将这一方法扩展到超过2亿种蛋白质结构,并建立了公开数据库。2024年,Demis Hassabis因这一成就获得诺贝尔化学奖,并被授予爵士称号。

主持人:在Alphabet体系下,你有机会做很多“登月式”探索,有些短期内未必带来收入,但带来重大突破。AlphaFold就是其中之一,你也因此获得诺贝尔奖。能否谈谈它为何如此重要?它将如何改变我们对疾病的解决方式?

Demis:成为谷歌和Alphabet的一部分,让我们拥有资源和时间去攻克深层科学难题。AlphaFold是典型案例。它解决了一个困扰生物学界50年的重大挑战:是否可以仅根据蛋白质的氨基酸序列预测其三维结构。蛋白质几乎参与人体所有功能,从肌肉收缩到神经元信号传导。如果你知道蛋白质的三维结构,就能部分理解它的功能及其支持的生物过程。这对疾病研究和药物设计至关重要。

蛋白质一旦出问题,就可能导致疾病。例如在阿尔茨海默症中,蛋白质会错误折叠,进而引发病变。所以理解蛋白质结构对药物研发和基础生物学都极其关键。

AlphaFold解决的正是50年前由另一位诺贝尔奖得主提出的难题:是否可以从一维的氨基酸序列,直接推导出蛋白质折叠后的三维结构,也就是它如何“卷曲成团”。AlphaFold不仅给出了解决方案,而且效率极高。我们预测了科学界已知的2亿种蛋白质结构,并与欧洲生物信息研究所合作建立了公开数据库,免费向全球开放。现在每天有超过300万研究人员在使用AlphaFold。

主持人:你也把这项技术应用到Isomorphic Labs。这家公司得到谷歌支持,融资数亿美元。它的使命很宏大——你说要“解决”所有疾病。你刻意用“解决”这个词。能解释一下吗?另外,药物从研发到进入临床试验通常极其困难,这个过程到底有多复杂?

Demis:AlphaFold最初的愿景就包含这一点。理解蛋白质结构能推动大量基础科学研究,甚至可以反向设计新蛋白质——设想一种目标结构,再推导出对应的基因序列。但在药物研发中,知道蛋白质结构只是第一步。通常从确认疾病靶点到药物上市,平均需要10年时间,投入数十亿美元,而且成功率只有约10%。生物系统极其复杂,效率低下。一直以来,我最希望AI优先应用的领域就是人类健康。AlphaFold证明了这条路可行。

于是三四年前,我们将相关能力拆分出来成立Isomorphic Labs,继续打造更多“AlphaFold级别”的突破,尤其是在化学空间。现在如果你知道蛋白质结构,还需要预测药物分子会在哪个位置结合、产生什么效果,这需要新的AI系统。Isomorphic正在做的正是这件事。

我们已与礼来和诺华等顶级制药公司合作,目前有17个在研药物项目,未来希望扩展到数百个。我认为,要在健康领域实现跃迁式进展,就必须把大规模假设搜索和分子设计放在计算机模拟环境中完成,这比湿实验室效率高出数百甚至上千倍。湿实验室更多承担验证角色。当然,最终仍需进入人体临床试验确保安全,但绝大部分搜索与设计都可以在计算环境中完成。

主持人:2026年会是关键一年吗?是否可能迎来首个进入临床试验的药物?会是在癌症领域吗?

Demis:我们目前在癌症、心血管疾病和免疫学等多个方向推进,未来希望覆盖所有治疗领域。我们正在构建一个通用的药物发现引擎平台。目前已有部分癌症项目进入早期临床前阶段。如果一切顺利,希望年底前推进到正式临床试验。

主持人:你同时在推进Gemini 3这样的大模型产品,又在推动药物进入临床试验,这听起来像两个完全不同的世界。你如何管理时间与团队?

Demis:我的强项之一是组建世界级的跨学科团队。我喜欢搭建管理层架构。在Isomorphic,我们把顶尖生物学家和化学家与顶级机器学习工程师融合在一起。跨领域协作会产生真正的创新。

在Google DeepMind,我们结合了初创公司式的灵活与跨国企业的规模优势。借助谷歌庞大的产品平台,我们可以迅速部署Gemini等技术,获得真实用户反馈,并影响数十亿人的日常生活。这种规模与速度的结合极具激励性。

至于时间管理,我睡得不算多,但会保证大约六小时。我白天在办公室安排密集会议,几乎没有间隔。晚上与家人共度时间后,大约晚上10点开始第二轮工作,一直持续到凌晨4点,这段时间主要做思考、研究和创造性工作。这样的节奏我保持了十年,对我来说有效。我通常在凌晨一点后最清醒。

主持人:当时外界认为谷歌在AI上反应迟缓。你如何整合两个团队,让产品重新加速发布?

Demis:DeepMind与Google Brain都是世界级团队。现代AI行业约90%的核心技术,源自这两个团队的研究成果,从Transformer到深度强化学习。我们拥有全球最深厚的人才储备。

问题在于,在算力需求迅速扩张的时代,同时维持两个前沿项目变得过于复杂。即便是谷歌,也难以支撑两条顶级前沿线并行推进。因此必须整合资源,集中力量打造Gemini。我性格开放、协作,始终保持学习状态。我很喜欢一个日本词——“Kaizen”,持续改进。

合并过程中,我们融合两种文化的优势,如今已开始看到成果。现在Google DeepMind就像谷歌的“引擎室”,为整个公司提供动力。我特别自豪的一点,是重新建立起快速发布的文化,敢于承担经过计算的风险,加快创新节奏。

我认为目前整体进展非常顺利。我们一方面加快节奏,另一方面依然保持科学和工程上的严谨,对外发布的每一项技术都经过深思熟虑。我希望我们找到了那个平衡点。

主持人:你提到要找回谷歌的“黄金时代”,现在创始人也重新深度参与进来,Sergey几乎回到一线。和他们一起推动AI是什么体验?

Demis:非常棒。Larry更多从战略层面参与,Sergey则深入技术细节,亲自写代码,参与Gemini等项目。看到创始人重新投入,是一件很振奋的事。有创始人参与会更容易推动方向。

我自己也以联合创始人的心态在领导Google DeepMind。过去十多年我学到的一点是,当目标极其宏大,比如解决所有疾病或构建AGI,必须设定阶段性里程碑。这些节点本身也很有挑战,但能让你确认方向正确。AlphaGo、AlphaFold,再到Gemini,都是这样一步步拆解完成的。

任何雄心勃勃的科学与工程项目,都需要可管理的阶段目标。过去几年对我们来说意义非凡,我感觉我们已经进入状态,外界包括资本市场也开始感受到这一点。

主持人:Gemini 3发布后声势巨大,甚至让OpenAI进入“红色警报”。还有与苹果达成的重要合作。你是如何设定KPI并保持2026年的动能?

Demis:一切从研究开始。核心是模型必须达到最先进水平。没有一流模型,其它都没有意义。我们先确保Gemini以及图像模型Nano Banana、视频模型Veo、世界模型等都达到领先水平。

然后快速把研究成果反映到产品中,同时做好市场与分发。

接下来是内部重构,让基础设施可以迅速把最新模型能力注入Search、YouTube、Chrome以及Gemini应用等核心产品。整个行业都在经历这种架构重建,我们用了大约一年到一年半完成整合。

现在Google DeepMind更像是整个公司的“发动机”。我们还在加速节奏,强调专注和强度,把资源集中在真正重要的事情上,减少干扰。在这个嘈杂的时代,持续做出理性决策、减少戏剧化波动,长期会形成巨大复利效应。

主持人:如果成功,这将是商业史上最大规模的技术转型之一。作为领导者,你如何确保这场变革对社会、对劳动力市场、对谷歌本身都是正向的?

Demis:这是典型的创新者困境。搜索业务目前依然强劲。但如果我们不主动革新自己,别人就会。主动掌握节奏更好。责任感一直伴随我,从学术时期到创立DeepMind都是如此。

当我们相信AGI有可能实现时,也明白它将极大改变世界。它能推动科学、医疗、能源等领域进步,同时也存在风险。这是一种双刃剑技术,可能被滥用,也可能在高度自主化后带来新的技术风险。我对此保持高度警惕。

同时,我们需要健康的商业引擎支持研究投入。像AlphaFold这样的项目成本巨大,但我们选择免费开放给全世界。未来还想做更多类似的事情,这要求商业层面必须成功。平衡非常重要。

我们也希望成为负责任部署AI的示范者。前沿实验室都面临选择:是把AI用于医疗、减轻贫困与行政负担,还是走向剥削性的用途。我们会尽力做出正确的选择。难免犯错,这项技术仍在早期且复杂,但我们会保持科学严谨,把可靠性、安全性嵌入产品之中。我相信市场最终会奖励这种稳健。企业级用户尤其如此,他们需要明确的保障,知道引入的AI系统会如何运作。

Demis:因此,我认为AI变得高度商业化可能反而是一件好事。商业激励会推动系统在稳健性、可靠性、安全性等方面持续改进,而这些正是为AGI真正进入世界所必须提前准备好的基础能力。

今年,AI的主线故事:模型变为Agent型系统、AI助手走进现实世界

主持人:展望未来一年,你认为AI的主线故事会是什么?我们会实现什么?

Demis:老实说,在AI领域几乎每一年都像是关键节点。对身处一线做研究的人来说,仿佛每一年都浓缩了过去十年的进展。

今年也不会例外,节奏依然非常紧张。但同时也需要偶尔抬头看战略全局。以我们为例,我认为Gemini 3是一个分水岭。它已经非常强大,我自己每天都在用它辅助研究、做摘要、写代码。我感觉这些系统已经接近可以真正构建“Agent型系统”的阶段。整个行业谈“Agent”和更高自主性的系统已经很久了,把完整任务交给系统去执行。我判断到今年年底,我们会开始真正看到这种形态落地。

我也非常期待AI助手走进现实世界,比如通过智能眼镜随身陪伴。我们有一个大型智能眼镜项目。我认为技术能力现在终于接近可行的临界点,这可能会成为眼镜形态的杀手级应用。

同时,机器人领域也在推进。我仍然认为机器人还需要更多研究,但在未来18个月内,我预期会看到突破性时刻。所有这些方向我们都在全力推进,同时持续提升Gemini本身。

主持人:你现在戴的就是那种眼镜吗?

Demis:不是。如果是的话,我一定会戴。

通用助手将覆盖所有终端界面

主持人:我正想问你,传统电脑并不是为AI而设计的。面对AI的能力扩展,你认为未来的计算形态是什么?听起来像是眼镜会是其中一种解决方案?

Demis:我们内部有一个概念,叫“通用助手”。它在日常生活中极其有帮助,会推荐新事物、丰富你的体验、处理行政事务等等,而且覆盖所有终端界面。它存在于你的电脑、浏览器、手机上,也会出现在新的设备上,比如眼镜。它是同一个助手,能够理解你在不同场景下的语境——无论是在车里、办公室,还是跨越多次对话。如果你愿意,这些数据都可以整合在一起,从而在生活的各个方面持续提升你的体验。

主持人:也许明年圣诞节大家都能收到谷歌眼镜。你们之前是不是太早了一点?

Demis:回头看,我们确实在很多领域都走在太前面了。眼镜当年一方面硬件还不够成熟,比如体积太笨重,另一方面缺少真正的“杀手级应用”。我认为AI数字系统可能正是那个缺失的关键。

未来十年,发现黄金时代:解决能源危机,走向星际

主持人:最后一个问题。给我一个最大胆的预测。往前看,当AI真正改变世界时,会是什么样子?你说现在十年像一年一样飞快,那再往远一点看呢?会是一个极度富足的世界吗?

Demis:如果方向走对,十到十五年后,我们会进入一个全新的发现黄金时代,某种意义上的文艺复兴。

人类健康将被彻底重塑,医疗形态会与今天完全不同。个性化医疗会成为现实。

我们会利用AI解决许多重大科学难题,例如新材料、可控核聚变、更高效的太阳能、电池优化,甚至找到解决能源危机的路径。

随后我们可能进入一个极度富足的时代,拥有充足能源去探索宇宙、走向星际。我相信这就是人类的命运。

主持人:听起来令人振奋。希望你们真的能把它建成。感谢今天的分享。

Demis:很高兴交流。

DeepMind CEO揭秘:后Gemini3时代,谷歌如何用AI仿真环境攻克所有疾病?


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21428

(0)
上一篇 20小时前
下一篇 19小时前

相关推荐

  • MCP Apps提案:从文本交互到可视化界面的范式跃迁,如何重塑AI智能体生态

    作为连接AI模型与数字生态的“神经中枢”,MCP(Model Context Protocol)协议已成为智能体(AI Agent)基础设施的核心组件。然而,长期以来,MCP的交互仅局限于文本和结构化数据交换,这种“盲人摸象”般的体验严重制约了复杂应用场景的落地。近日,MCP社区正式提出MCP Apps提案(SEP-1865),旨在填补这一关键空白:通过规范…

    2025年11月24日
    10000
  • 学术产业化危机:当AI顶会成为明码标价的“入学筹码”

    在人工智能技术迅猛发展的当下,一个令人担忧的现象正在学术圈蔓延:商业机构将学术研究包装成可量产的“产品”,通过付费辅导班的形式,将顶级学术会议论文变为明码标价的“入学筹码”。这不仅严重稀释了学术研究的含金量,挤占了宝贵的学术资源,更可能引发深层次的学术信任危机。香港大学计算与数据科学学院院长马毅(网名“毅马当闲”)在微博中尖锐指出:“顶会规模化后,已基本失去…

    2025年12月8日
    10000
  • 从特征拼接失败到策略共识突破:多模态机器人感知的范式转移

    在机器人技术快速发展的今天,多模态感知融合已成为提升机器人环境交互能力的关键路径。然而,传统方法在处理稀疏模态任务时暴露出的严重缺陷,正推动着研究范式的根本性转变。由伊利诺伊大学香槟分校、哈佛大学、哥伦比亚大学和麻省理工学院联合完成的这项研究,通过《Multi-Modal Manipulation via Policy Consensus》论文(链接:htt…

    2025年12月3日
    9800
  • LoopTool:打破静态数据桎梏,实现工具调用任务的闭环数据进化

    在人工智能从“语言理解”迈向“任务执行”的关键转型期,大语言模型(LLM)与外部工具的协同能力已成为核心突破点。无论是API调用、多轮任务规划、知识检索还是代码执行,模型精准调用工具的能力不仅依赖其内在的推理逻辑,更需要海量高质量、针对性强的函数调用数据进行训练。然而,当前主流的数据生成与训练流程普遍存在“静态化”缺陷——数据在训练前一次性生成,无法感知模型…

    2025年11月19日
    11900
  • UNeMo:多模态世界模型与分层预测反馈机制重塑视觉-语言导航新范式

    在具身智能(Embodied AI)领域,视觉-语言导航(VLN)作为核心任务之一,要求智能体仅凭视觉图像和自然语言指令,在未知环境中自主完成目标导航。随着大语言模型(LLM)的兴起,基于LLM的导航方法虽取得一定进展,但仍面临推理模态单一、优化目标冲突等关键瓶颈。深圳大学李坚强教授团队联合北京理工莫斯科大学等机构提出的UNeMo框架,通过多模态世界模型(M…

    2025年12月10日
    13100