Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

Karpathy开源autoresearch:630行代码实现AI自主科研进化

AI领域知名研究者Karpathy近日开源新项目 autoresearch,这是一个能够自主进化AI科研循环系统。其核心目标是让智能体完全自主地进行科研探索:用户只需在Markdown文档中设定研究指令,后续的代码修改、实验运行、结果评估与决策优化等流程将全部由AI自动完成。

Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

该项目框架极为精简,核心代码仅630行,且单个GPU即可运行。系统以约5分钟为一轮实验周期,在每轮结束后自动根据验证结果决定保留或丢弃代码改动,实现不间断的自我迭代与优化。

Karpathy进一步展望,未来有望让成千上万个此类智能体在大量分支上异步协作,摆脱传统单一主分支(master)的局限,通过群体智慧实现科研效率的跃升。

项目开源不到两天,已在GitHub上获得超过9.5k星标

Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

其在X平台上的相关介绍也获得了超过580万次浏览

Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

Shopify CEO Tobi Lütke在看过项目后表示赞叹,称其“简直疯狂”。

Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

5分钟自动化实验循环

autoresearch的核心思路是将AI研究中的“尝试-评估”循环自动化。系统自主修改训练代码、运行短时实验、并根据评估指标自动决定后续方向。

项目基于nanochat模型训练,并设定了两条核心规则:
1. 每轮实验的纯训练时间严格固定为5分钟,以确保不同改动之间的评估基准一致。
2. 仅以验证集上的每字节位数(val_bpb)作为评估指标。该指标数值越低代表模型效果越好,且与模型大小无关。

通过以上设计,整个自主研究流程被浓缩为一个轻量级、单GPU可运行的版本。代码库主要包含三个核心文件:

  • prepare.py:定义训练所需的固定常量(如模型维度)、负责下载原始数据与准备分词器,并提供实验所需的工具函数。该文件在实验过程中保持不变。
    Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类
  • train.py:包含完整的GPT模型架构、优化器及训练循环逻辑。这是AI唯一可以编辑的文件,相当于其“实验笔记本”。AI可在此调整层数、批次大小、学习率等超参数。
    Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类
  • program.md:由人类编写和维护的纯文本文件,用于向AI下达研究指令、定义实验规则与提供背景知识。切换研究方向时,通常只需更新此文件。
    Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

其工作流程如下:
1. AI读取program.md中的指令。
2. 对train.py进行针对性修改(通常每次仅改动1-2处)。
3. 启动为期5分钟的严格训练。
4. 训练结束后,根据val_bpb指标对本次修改进行评分。
5. 做出决策:若评分提升(val_bpb降低),则保留本次修改,并将其作为下一轮实验的起点;若评分下降,则放弃改动,回退至上个最佳版本并重新开始探索。
Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

以5分钟一轮计算,AI每小时可完成超过10组实验,其试错与迭代效率远超手动调整。

Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类
上图展示了一次近250轮的自主探索过程,AI最终筛选并保留了29次有效改进。图中灰色点代表被判定为无效而舍弃的实验,它们同样为探索过程提供了有价值的“避坑”经验。

未来愿景:模拟分布式博士社群

Karpathy在项目发布后,进一步阐述了其长远构想。他借鉴了1999年加州大学伯克利分校发起的SETI@home(搜寻地外文明)项目理念,指出autoresearch的终极目标不仅是模拟单个研究者的工作,更是要模拟一个分布式、异步协作的整个博士生研究社群

Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

SETI@home通过汇聚全球志愿者闲置的计算机算力,共同分析射电望远镜数据,开创了大规模分布式计算的先河。Karpathy认为,当前的研究智能体大多仍局限于单一的、线性的发展路径,这限制了其潜力。

他理想中的模式,是让初始代码库像种子一样,向无数个不同的研究方向和计算平台衍生出海量分支,形成类似SETI@home的分布式群体探索网络

Karpathy指出,这种探索受限于当前以Git/GitHub为代表的主流协作工具的设计哲学——它们默认存在一个权威的“主分支”,所有其他分支的最终归宿都是合并回主干。这种“寻求唯一正确答案”的模式,与需要海量非线性探索的自动化研究之间存在根本性矛盾。

Karpathy开源autoresearch:630行代码实现AI自主科研进化,5分钟一轮实验效率超人类

为探索新路径,他进行了一些实验:让智能体在通宵运行后,将研究总结发布在GitHub Discussion板块,或通过Pull Request提交精确的代码变更。这些PR可能永远不需要被合并,但它们作为独立的研究分支被有效记录和积累。智能体可以读取已有的讨论和记录来获取灵感,再将新发现反馈回社区。

本质上,这旨在探索一种更适合AI高频产出与试错的协作方式,让科研过程从传统的“编写软件”逻辑,转向更灵活的“积累经验”逻辑。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/24987

(0)
上一篇 1天前
下一篇 1天前

相关推荐

  • GitHub热门开源:Nano Banana Pro精选资源与小红书AI创作工具解析

    Awesome Nano Banana Pro Awesome Nano Banana Pro 是一个精选资源列表,旨在汇集与 Nano Banana Pro 模型相关的高质量内容。当某个模型或技术方向流行起来后,GitHub 上通常会出现对应的 Awesome 合集,此项目便是其中之一。 该项目目前拥有超过 2800 个 Star,精心整理了大量的高质量提…

    2025年12月4日
    18700
  • 探索Vibe Coding:4个GitHub开源项目带你进入AI编程新范式

    Andrej Karpathy 是 OpenAI 创始成员、前特斯拉 AI 总监。他年初在 X 上发布了一条推文,分享了自己使用 Cursor 与 Claude 进行编程的体验,并首次提出了 Vibe Coding 这一概念。 Vibe Coding 是一种基于 AI 的全新编程范式。开发者通过与 AI 进行对话式协作,共同构建应用程序或网站,其核心在于专注…

    2025年12月12日
    17600
  • 三大前沿GitHub项目解析:云端IDE、开源游戏宝库与AI呼叫中心革新

    把 VS Code 装进浏览器 这个开源项目可以让你在浏览器里面写代码,它把 VS Code 完整地搬进浏览器中运行,现在已经 75K 的 Star 了。 code-server 让 VS Code 编辑器脱离本地电脑的环境,可以在任意服务器上运行,再通过浏览器访问。 这意味着你可以在一台 Linux 服务器上安装 code-server,然后从任何有浏览器…

    2025年11月22日
    18600
  • 4款惊艳AI开源项目盘点:从图表重建到桌面助手,解锁智能新体验

    01 图片、PDF转为可编辑 Edit Banana 是一个由北京理工大学开发的开源项目。它能够将不可编辑的图片或PDF格式的统计图表、流程图,转换为可完全编辑的格式,例如 DrawIO 的 XML 或 PPTX。 该项目并非简单的OCR工具,而是基于计算机视觉模型,对图表中的逻辑关系、形状组件和文本进行深度重建,实现高保真还原。生成的图形元素可以独立选中和…

    2026年2月21日
    20000
  • 三大开源神器:小红书数据采集、智能PPT生成、代码驱动视频制作

    小红书采集神器 Spider_XHS 是一个在 GitHub 上已获得超过 3000 Star 的小红书数据采集与运营工具。它不仅仅是一个爬虫,更提供了一套完整的小红书全域运营解决方案。 该项目支持多维度数据抓取,可将结果保存为 Excel 表格或直接下载多媒体文件。 采集用户所有笔记至本地 该工具能够自动下载用户的所有笔记,并按统一格式保存到本地文件夹。每…

    2025年11月30日
    21900