MIT博士生退学:投入100亿美元、5万张H100,10年内实现数字人类

「我决定从麻省理工学院退学,不再攻读博士学位。人工智能的进化速度太快,我们这些血肉之躯已经追不上了。

但或许还有另一条路:我发现数字人类的实现,远比大多数人想象的更近。如果能集结顶尖的人工智能研究人员,投入大约100亿美元、动用5万张H100 GPU,或许在不到10年之内,这个目标就能实现。」

MIT博士生退学:投入100亿美元、5万张H100,10年内实现数字人类

写下这段话的是Isaak Freeman,麻省理工学院的一名博士生。他认为,人工智能的发展速度已经让人类难以望其项背。生物大脑的进化受限于碳基组织的物理法则——比如神经信号传导速度、寿命和记忆容量——如果人类继续维持碳基形态,注定会在智力竞赛中被AI淘汰。将意识迁移到数字基质上,才是让人类智能实现「指数级扩展」的唯一出路。

换句话说,既然我们无法阻止AI的狂奔,那就借助AI所创造的算力和工具,把自己也变成「数字形态」,从而加入这场竞赛。

在科学界,这个想法并不新鲜。2023年《流浪地球2》上映时,它还曾引发过热议(电影中刘德华饰演的图恒宇为了给车祸去世的女儿丫丫「完整的一生」,不惜违规将她的数字信息备份上传)。但Isaak表示,他不认为这还停留在科幻层面,而是已经有了各种支撑其实现的现实可能性——我们完全可以利用高分辨率扫描技术,把现有的智能结构完整地复制出来。

为了证明自己不是一时冲动,他给出了一个粗略的计算:

运行人类大脑所需的算力,可能远比想象中要低——大约5万张H100 GPU就足够了。而xAI目前已经拥有超过20万张H100或更高规格的芯片。在相对悲观的假设下,如果采用当前高分辨率的神经元模型(如Hodgkin-Huxley模型)以及多状态突触,模拟人类大脑大约需要600 exaFLOP/s的算力、每GPU 700 GB的内存容量,以及24 GB/s的互联带宽——这些指标,如今的超算集群已经触手可及。

MIT博士生退学:投入100亿美元、5万张H100,10年内实现数字人类

如果更简单的神经元模型(如Leaky-Integrate-and-Fire模型)就能胜任(这一点仍有待实证研究验证),那么模拟一个人类大脑所需的算力,可能低至约2到3 petaFLOP/s,几乎相当于单张H100在FP16精度下的算力。当然,内存容量与互联带宽很可能才是更紧张的瓶颈。

但问题的核心在于:该运行哪些神经元?参数如何设定?连接方式又该如何构建?

因此,数据采集才是真正的瓶颈,而这一环节本身就面临重重难题:我们需要数百台下一代显微镜持续运行数年;需要自动化的大规模组织采集与染色流程;需要约20倍放大率的膨胀显微镜技术,并对30种以上的受体、神经递质与神经肽进行全面的分子染色;还需要X射线显微镜,以便在一年内完成对整个人类大脑的成像。与此同时,还需要能够跨越蠕虫、鱼类等动物完整成像脑活动的全脑功能成像设备,从而破解「结构-功能」的对应关系。

MIT博士生退学:投入100亿美元、5万张H100,10年内实现数字人类

除此之外,研究人员还需要开发结构到功能的预测模型、连接组校对模型、严格的评估基准,以及以动物仿真作为概念验证的完整研究框架。

令人鼓舞的是,这一领域正在逐渐成形:从早期的线虫仿真尝试(如BAAIWorm),到已绘制完成的14万神经元果蝇连接组,再到一项不完整的果蝇仿真实验意外在X平台上引发病毒式传播,脑机接口研究所生成的大量数据集,即将面世的斑马鱼连接组,乃至能够以吉赫兹速度成像的新一代显微镜。Isaak认为,种种迹象表明,「数字人类」的前沿探索,已不再只是遥远的科幻构想。

MIT博士生退学:投入100亿美元、5万张H100,10年内实现数字人类

正是带着让这一领域变得更加平易近人的愿望,Isaak在离开MIT之前,耗费大量心血撰写了一篇深度报告,系统梳理了从线虫仿真迈向数字人类的完整路径。他坦言,这份论文仍粗糙、仍不完善,但其中倾注了他满腔的热情与心血。

MIT博士生退学:投入100亿美元、5万张H100,10年内实现数字人类

  • 报告标题:From Worm to Human: Scaling Brain Emulation
  • 报告链接:https://pdf.isaak.net/scaling-emulations

这篇论文详细规划了从线虫(302个神经元)到人类(860亿神经元)的全脑仿真路线图,包括连接组学成本、数据瓶颈、技术路径等。

MIT博士生退学:投入100亿美元、5万张H100,10年内实现数字人类

图注:电子显微镜连接组学的现状。

论文指出,实现这一宏大愿景需要三大核心支柱的协同突破:结构测绘、功能记录与计算仿真。而摆在研究者面前的第一座高山,便是最基础的结构测绘。

想要模拟大脑,首先得知道大脑长什么样。目前主要依赖电子显微镜(EM),但它面临极大的规模化难题。人工校对成本极高,例如果蝇连接组的校对就花费了33个「人年」。如果要扫描人类大脑,按照目前的成本,仅单个神经元的重建就需要天文数字的资金。

为此,作者提出了结合膨胀显微镜(ExM)和蛋白质条形码等新兴技术。这些技术能在保留分子层面信息(如离子通道、神经递质受体)的同时,大幅降低追踪难度,让AI自动分割模型的准确率飙升。

MIT博士生退学:投入100亿美元、5万张H100,10年内实现数字人类

图注:EM vs ExM 图像对比

当然,仅有静态的物理结构是不够的,大脑是会放电的,我们还需要记录神经元的动态放电过程。但哺乳动物的大脑组织会散射光线,导致目前光学成像的「玻璃天花板」卡在表面以下1到2毫米深处。

于是作者找了两个天然的「替代品」:天生透明的斑马鱼幼体,以及体型袖珍的线虫。在这些生物上,人类已经能够初步实现全脑、单神经元级别的实时功能记录,这为建立「结构-功能」的映射关系提供了至关重要的真实数据。

那如何将静态的连接图谱转化为动态的仿真?论文指出,在果蝇视觉系统和线虫的初步实验中,即使是最简单的微分方程模型,只要有准确的连接组数据,也能重现令人惊讶的真实生物行为。

正如前文所述,单纯的计算速度(FLOP/s)已经不再是最大的绊脚石。真正的挑战在于「内存墙」与「互联带宽」。模拟千亿个神经元和庞大的突触网络,需要约70 PB的内存容量和极高的跨节点通信速度,这是目前偏向纯算力的AI数据中心需要克服的架构难题。

最后,如何证明我们真的「上传」了一个人类,而不是造了一个只会查表的机器?作者提出了类似于图灵测试的「具身图灵测试」——把仿真大脑放入虚拟躯体中,看它能否像真实的线虫或老鼠一样觅食、学习和趋利避害。

作者估算,这绝非几家实验室能完成的零散工作,而是需要一场类似人类基因组计划或阿波罗计划的「大科学」工程,可能需要耗时10到25年,投资50亿到500亿美元。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/34198

(0)
上一篇 1天前
下一篇 1天前

相关推荐