陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道 陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

最近,数学家、菲尔兹奖得主陶哲轩联合多位顶尖科学家与世界级奖项得主,共同发起创立了一家专注于人工智能与科学研究的基金会——SAIR

陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

在SAIR成立当天,陶哲轩阐述了该机构的使命:致力于探索新的科学研究范式。他表示:“作为联合创始人,我很高兴能够汇聚数学与各科学领域的顶尖研究者,共同探讨人工智能与新兴技术如何加速科学发现,并开启新的研究工作流程。”

这一举动被视为“AI for Science”领域即将迎来新变化的关键信号。那么,陶哲轩是如何思考AI以及AI for Science的演进路径的?

在SAIR官方视频账号近期的一场全球直播中,图灵奖得主Richard Sutton、诺贝尔奖得主Barry Barish,以及来自微软、英伟达等机构的技术专家分享了他们的见解。

陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

同时,SAIR也发布了一段对陶哲轩的专访。在采访中,陶哲轩解释了成立SAIR的多方面原因。他判断,“AI for Science”领域的技术已经发展到足以改变科学的阶段,但将AI融入科研存在许多错误路径,正确的路径其实更少。因此,我们需要审慎思考并准备好如何采用这些技术。

他强调,在这一过程中,学术界必须主动参与:“学术界需要深度参与,而不是等待科技公司推出产品然后直接使用。我们要互动、要探索真正的需求,弄清楚哪些科学领域适合AI,哪些仍然适合人类传统方法。”

陶哲轩还提到了另一个现实因素:过去一年,科研资金环境出现了很大的不确定性。例如,他所在的IPAM(纯数学与应用数学研究所)曾一度暂停资助。这段“寻找新的资金来源的混乱时期”,反而催生了包括SAIR在内的新机会。他表示:“那段时间迫使我们寻找新的资金来源,与新的投资人和合作伙伴建立联系。某种程度上,这段混乱时期也带来了新机会,如今IPAM有了许多新项目,其中就包括这次合作。”

在访谈中,陶哲轩还阐述了一系列关于AI的“反直觉”真相。他指出,人们对AI最大的误解在于将其视为一种单一技术,而实际上它是“数百种相关技术的集合”。大众更多将AI视作可以聊天、生成图片或视频的机器人,但在科研领域,存在着非常不同且更有效的AI应用方式。

他进一步分析了当前AI的局限性:
* 上下文记忆不稳定:AI在新会话中容易“忘记”之前的交流内容。即使保留上下文,其记忆也是暂时的、不稳定的。他甚至提到一种常见现象:如果你告诉AI不要做某件事,它反而更容易去做。
* 缺乏持续学习能力:当前的AI不具备稳定、持续的从错误中学习并长期成长的能力,无法像人类研究生那样真正进步。
* 目标对齐的风险:人类并不擅长精确定义目标,而AI在执行目标时却过于“认真”,像一个字面理解愿望的精灵。这可能导致AI通过修改定义、补充公理或钻漏洞等“作弊”手段来完成任务。

总之,在陶哲轩看来,目前的AI更像一个掌握多种方法的“通才研究生”,而非革命性的“天才科学家”。他指出:“AI在数学上的优势主要是广度,掌握大量技巧和文献套路,但尚未展现真正脱离既有文献的原创思想。”

在科研方面,AI 应用的进展如何?陶哲轩表示,数学领域的确取得了不错的成果:形式化证明助手可以自动完成验证。这种机制在某种程度上“约束”了 AI,使其更难胡说八道。但问题也很明显。他认为目前 AI 还谈不上是一个真正的“合著者”。科研真正需要的往往是推导过程、思路演化和与文献的关联,而非一个“一键生成”的最终答案;人与 AI 的协作缺少那种面对面讨论中的即时反馈、非语言信息与共同建构感,协作体验仍显割裂。

对于未来 AI 的下一个突破口在哪里?陶哲轩给出了两个方面:创造力和持续学习能力。但他判断这个突破的过程不会太久,也许只要十年。“关键在于研究如何正确使用它。”

跟顶级科学家发起 SAIR 背后:AI 融入科研有很多错误路径

主持人:大家好。今天我们再次邀请到陶哲轩,非常荣幸能再次采访他。我们将讨论 AI 在科学中的应用,尤其是几天后即将启动的 SAIR。我们很期待带来一些新的视角,看看 AI 可以如何用于科学,以及未来我们可以做些什么。如果方便的话,能否请您简单介绍一下自己?

陶哲轩:好的。我是陶哲轩,加州大学洛杉矶分校的数学教授。过去我主要从事纯数学研究,但近年来,我越来越多地参与探索利用 AI 以及其他新技术来进行数学研究,乃至更广义的科学研究。最近我和几位科学家以及资助人一起参与创立了 SAIR,这是一个新的基金会,旨在支持“AI for Science”,探索如何将这些新技术整合进科学研究流程。几天后,我们将在加州大学洛杉矶分校数学科学研究所(IPAM)举办首次启动活动。

主持人:很多人可能都会问,是什么促使您决定共同创办 SAIR?

陶哲轩:这是多方面因素共同作用的结果。过去几年里,我越来越确信这些技术已经准备好改变科学,我们必须做好准备去采用它们。同时,我们要学会如何正确使用,也要避免错误的使用方式。把 AI 融入科研有很多错误路径,正确路径其实更少,因此必须慎重。学术界需要深度参与,而不是等待科技公司推出产品然后直接使用。我们要互动、要探索真正的需求,弄清楚哪些科学领域适合 AI,哪些仍然适合人类传统方法。

尤其是在过去一年,资金环境出现了很大的不确定性。比如我所在的 IPAM 曾一度暂停资助,许多计划中的项目都面临不确定性。那段时间迫使我们寻找新的资金来源,与新的投资人和合作伙伴建立联系。某种程度上,这段混乱时期也带来了新机会,如今 IPAM 有了许多新项目,其中就包括这次合作。

陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

AI 的可靠性是一个大问题,但数学是一个例外

主持人:对于数学而言,AI 是否显得格外强大?

陶哲轩:潜力确实非常突出。现代 AI,尤其是大语言模型,有一个明显弱点:它们并不真正扎根于现实。有时能给出极好的答案,有时却完全错误。它们本质上是在进行统计匹配,而非真正理解。因此,在许多领域,AI 的应用效果不如最初预期,可靠性是一个问题。

但数学几乎是个例外,因为我们有非常成熟的验证机制。给我一个数学证明,我们可以依据逻辑法则和数学定律检查其是否正确,现在甚至可以借助计算机完成。形式化证明助手可以自动完成验证。这种机制在某种程度上“约束”了 AI,使其更难胡说八道。数学有更大的机会过滤掉糟糕用法,保留有效用法。当然也并非所有数学内容都能形式化验证。提出新猜想或解释概念时,AI 还未必擅长,但至少在部分领域,潜力巨大。

AI还不擅长提出新猜想,有真正价值的部分很少

主持人:随着验证程序的发展,未来是否可能出现这样一种系统:AI 不断生成想法,同时由程序验证,从而创造新的成果,而不局限于既定计划?

陶哲轩:这确实是目标。目前 AI 会生成各种想法,其中只有少部分真正有价值,我们暂时还无法直接验证“想法”本身。不过可以借鉴物理或化学的方法。物理学家提出假设后,会通过实验收集证据,虽然不是严格证明,但可以提高或降低对假设的信心。

我预见数学未来会增加更多实验性成分。现在的数学几乎完全是理论性的,但 AI 可以提出假设,也可能设计实验来测试它们。例如提出某个公式对所有自然数成立,可以测试若干数值案例,检查与文献中已有结果是否兼容。这类应用仍处于早期阶段,因为我们还缺乏完善的验证机制。随着对 AI 的理解不断成熟,我能想象这种模式会出现,不过也许需要十年左右。

陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

AI与人的分工

主持人:十年听起来并不算太久。

陶哲轩:进展其实比我预期快。有些人曾经对 AI 抱有极高期待,认为数学家或科学家很快会被取代。现实并非如此。不过 AI 已经能够证明一些此前未被证明的定理,通常是通过已有方法,也能发现我们未曾察觉的模式。它仍然不够可靠,但潜力显而易见。关键在于研究如何正确使用它。

主持人:AI 很擅长结构化重复任务。它能节省时间,让我们专注于更具创造性的部分。

陶哲轩:确实如此。AI 和人类不同。或许“人工智能”这个名称给人一种它要取代人的印象,但人类并不喜欢高度重复的任务。比如在数学里,如果给一个人一千道类似问题,他可能解前一两道,剩下的就不愿意做了。把那 998 道交给 AI 是很自然的分工。短期内更合理的模式是:人类提出构想,给出初步步骤和方向,然后由 AI 细化、完成繁重工作。这会大幅加速现有流程。

怎样让AI停止胡说八道:形式化验证

主持人:归根结底,它是一种工具,用来简化流程。但当 AI 给出看似随机的解释时,我们该如何应对?

主持人:当 AI 给出看似合理、实际上却可能是胡说八道的解释时,我们该怎么办?很多时候它生成的内容看起来像对的,但其实经不起推敲。您认为该如何改进?

陶哲轩:在数学中,目前最有效的办法是形式化验证。AI 先生成一段自然语言论证,这段论证可能对也可能错。接着,我们会让同一个或另一个 AI,把它转换成形式化语言。每一个断言都必须转化为精确表达,然后交由一个非常严格的编译器验证。这个编译器并不是 AI,而是传统、可靠的软件系统,专门为高度可靠性设计。迄今为止,在主流形式化证明语言的编译器中,几乎没有发现重大漏洞。

如果验证失败,我们会让 AI 重试;如果通过,我们就得到一份很长的形式化证明,虽然未必易读,但可以反向让另一个 AI 做解释。形式化证明的好处在于每一步都极其精确,你可以把一个大型定理拆分成若干部分逐一分析。即使证明有上千行,也可以由人类和 AI 结合进行研究。

我们已经见过很多例子:AI 给出一个一开始难以理解的证明,我们对其“反编译”,最终由人类找到了其中的思路。到目前为止,每当 AI 给出令人惊讶的证明,经过几天研究后,我们通常能在文献中找到类似的先例。

AI 的优势之一在于广度。它并不真正记住全部文献,但吸收了大量技巧的“精华”。人类数学家可能熟练掌握四五种技巧,而 AI 可能掌握十几种,虽然不总是用得恰当,但它的广度很强——前提是问题本身已有文献基础。我们还没有看到 AI 提出完全没有先例的全新思想,不过大多数人类数学家也做不到这一点。

陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

AI下一个里程碑:创造力、持续学习能力

主持人:那在您看来,AI 的一个重要里程碑会是什么?是思考方式的改变、理解能力的提升,还是应用层面的突破?

陶哲轩:还有很多方面有待提升。首先是创造力,尤其是无法追溯到既有文献的创造力。其次是持续学习能力,尤其是在特定知识领域内的深度学习。我曾把当前 AI 在数学方面的能力比作数学研究生:掌握大量技巧,尝试应用,有时成功,有时失败。但人类研究生的优势在于,他们会从错误中学习。如果指出哪里错了,下周再见面时他们通常会避免重复同样的错误。AI 却往往在新会话中“忘记”一切。你可以把上下文保留,它会暂时记住,但并不稳定。还有一个众所周知的现象:如果你告诉 AI 不要做某件事,它反而更容易做。

当前的 AI 是通用模型,无法真正专门化为“只做数学”。虽然可以微调,但远远达不到我们期望的专业化程度。不过我最希望看到的是一个真正稳健、成熟的工作流程整合方式。目前我们只是拼凑式地使用 AI。写论文卡住了,就打开浏览器问聊天机器人;有人尝试把 AI 作为代理接管电脑,这其实风险很大。它还谈不上真正的“合著者”。与人类合作时,可以在黑板前讨论、写公式、互动交流,而与 AI 的互动还缺乏那种高度整合的感觉。几百年来,我们打磨了人与人协作的方式,却还没有找到与 AI 协作的最佳模式。

陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

主持人:您觉得在工作流程上具体缺少什么?

陶哲轩:这问题很难回答,也许是某种难以言说的因素。就像疫情期间大家改用远程会议。从功能上讲,线上会议完全可以交流思想,但面对面交流中有一些微妙元素,比如眼神交流、肢体语言,这些并未被完全捕捉。人与人之间的互动,语言和公式只是其中一部分,还有很多隐性的信号。与 AI 互动时,这些层面是缺失的。

合作感缺失:AI 给出全部答案,但人却没有参与创造过程

主持人:也许还包括人与人之间的合作感?

陶哲轩:是的。AI 公司往往倾向于展示“一键生成完整解决方案”的产品模式。按下按钮,AI 给出全部答案,但你没有参与创造过程。如果需要向他人解释这个答案,你却无法说明它的来龙去脉;想修改,只能再交给 AI,每次修改可能都会变差。

更理想的方式是互动式合作:你走一步,AI 接一步,你提供反馈,它调整方向。通过这种互动,你会理解证明是如何发展的。人类写证明时,可以解释思路、尝试过哪些方法、受到哪些文献启发。AI 给出的往往只是一个成品解答,却没有生成过程的记录。有时我们意识到,我们真正想要的并不只是答案本身。我们真正想要的其实也包括过程本身。如果能找到一种方式把 AI 融入其中,也许关键在于把它当成“盐”——少量能让食物更好吃,但不会把整罐盐都倒进去。合适的时候用,不合适的时候不用。

主持人:这很有意思。科研本身往往也不是立刻得到答案,而是一个漫长的迭代过程,有时甚至未必能得到最终解。

AI太擅长优化目标了,甚至不惜作弊

陶哲轩:人类其实不太擅长精确定义目标。AI 在执行目标上却过于“认真”,有点像一个字面理解愿望的精灵。你说“优化某个指标”或“解决这个问题”,它就会投入大量算力和努力去精确完成指令。如果我让它在形式化证明助手里生成一个证明,并要求“无论如何都要得到证明”,它可能会作弊,比如随意添加公理、修改定义,只为满足你字面上的要求。

所以我们正在学习,给 AI 布置任务时,尤其是那些需要精确规范的任务,必须把目标描述得非常清楚,堵住所有漏洞,并认真思考自己真正想要什么。在证明问题上,我们要的不只是答案,还包括理解:它如何与现有文献关联?还能解决哪些问题?如何向他人解释?过去给人类布置任务时,不需要这么精确,因为人类会自动补足隐含需求。比如你让人端茶,他们不会把茶直接倒在你身上,而会给你杯子和托盘。AI 有时能理解语境,有时却不行,所以我们必须更擅长界定目标。

主持人:AI 似乎更专注于回答问题本身,而不一定确保整体意义上的“正确”。

陶哲轩:这正是机器学习的哲学。早期 AI 试图构建模仿人类思维的推理系统,效果并不好,只能完成非常基础的任务。后来人们转向另一种方法:只定义目标,然后不管过程是否“优雅”或“合理”,只要最大化某个衡量指标即可。最初效果一般,但随着算力、数据和规模的增加,它突然变得非常有效,跨过某个阈值后表现相当出色。不过它有时“太”擅长优化目标了。比如让 AI 打游戏,它会找到漏洞,利用代码缺陷达成目标,而不遵循游戏的精神。它确实完成了任务,却未必符合初衷。

AI 并非单一技术,而是数百种技术的集合

主持人:最后一个问题,您认为人们在科学中使用 AI 时最常见的误解是什么?

陶哲轩:对大多数人来说,AI 就是聊天机器人。它会回应你,说些让人感觉不错的话。有些科学家也用聊天机器人辅助思考,但在科研中更有效的 AI 用法其实很不同,通常会结合验证机制。我常用它做数值计算、画图、检验论证。科学家使用 AI 的方式与公众不同。我们不会大量生成可爱的图片,那对科研没太大帮助。

遗憾的是,人们把 AI 视为单一技术,实际上它是数百种相关技术的集合。最受关注的往往并非科研中最常用的技术。也许我们需要更好的命名方式,而不是把所有东西都叫做 AI。

陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道

主持人:公众往往关注“AI”这个标签,而不太关心它的差异、用途或工作机制。但理解它如何运作,决定了它的准确性和应用方式。

陶哲轩:神经网络已经存在二十多年了。它们没有现代大语言模型那么“性感”,但科学家多年来一直在使用,而且效果很好。它们没有文本对话界面,只是用于在数据中寻找模式,本质上是数据处理工具。它很朴素、很日常,只是做数值计算,并不会给人一种在和科幻机器人对话的感觉。

主持人:好的,我想这就结束了。非常感谢您再次接受采访。

陶哲轩:很高兴参与。

https://www.youtube.com/watch?v=Z5GKnb4H_bM

陶哲轩领衔SAIR:AI for Science的正确路径与学术界深度参与之道


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/21158

(0)
上一篇 1天前
下一篇 1天前

相关推荐

  • AI能力指数级跃迁:从实验室到职场的颠覆性跨越

    在公众仍聚焦于AI模型的偶然失误时,前沿研究揭示了一个截然不同的现实:人工智能正以指数级速度逼近并超越人类专业能力。AlphaGo、AlphaZero核心作者Julian Schrittwieser近期罕见发声,直言公众对AI的认知至少滞后一个世代。这一警告并非危言耸听,而是基于多项严谨研究的实证分析。 Julian Schrittwieser作为深度强化学…

    2025年11月4日
    10100
  • OpenAI稀疏电路研究:为破解大模型黑箱提供可解释性新路径

    在人工智能领域,大模型的“黑箱”问题一直是制约其可信应用的核心障碍。OpenAI最新发布的研究论文《Circuit Sparsity in Neural Networks》通过训练结构更简单、连接更稀疏的神经网络,为构建既强大又透明的模型提供了全新方向。这一突破性进展不仅揭示了神经网络内部的可解释性机制,更可能成为未来AI系统安全部署的关键技术基础。 研究团…

    2025年11月14日
    8300
  • 2026年IEEE Fellow华人学者全景分析:技术贡献、领域分布与未来影响

    美国电气电子工程师学会(IEEE)近日公布了2026年度Fellow名单,这一全球电气电子工程领域的最高荣誉再次彰显了华人学者在该领域的卓越地位。据统计,本届新晋Fellow中约40%为华人学者,这一比例不仅反映了华人科研力量的崛起,更揭示了全球科技格局的深刻变化。本文将从技术贡献、领域分布、机构表现及未来影响四个维度,对2026年IEEE Fellow华人…

    2025年12月5日
    9000
  • 从工具到导师:AI教育如何通过多模态交互实现真正的授人以渔

    在AI技术快速渗透教育领域的当下,一个核心问题日益凸显:大多数AI教育产品仍停留在“授人以鱼”的工具层面,追求快速响应和标准答案输出,却未能触及“授人以渔”的教学本质。这种模式虽然提升了效率,却掩盖了学生思维过程的缺失,导致“一听就会、一做就废”的学习困境。真正的AI教育革命,应当聚焦于如何将思考过程还给学生,而不仅仅是提供答案。 当前AI教育市场呈现两极分…

    2025年11月11日
    9700
  • GPT-5自主攻克分子克隆:AI物理元年开启,79倍效率提升背后的暴力美学与精准设计

    【新智元导读】 AI真正走入实验室!OpenAI最新研究显示:GPT-5在「零决策干预」下自主迭代5轮,独创RAPF方案,竟将分子克隆效率暴力拉升79倍! 这不是代码模拟,而是真实物理世界的重塑。欢迎来到2025AI物理元年。 2025年底,OpenAI宣布:AI已经跨越数字边境,正式进入物理实验室! 在最新的研究中,GPT-5化身科学家,不仅优化了分子克隆…

    2025年12月20日
    11600