OpenAI发起Model Craft挑战：16MB参数极限压缩，10分钟训练，争夺百万算力与面试机会

2小时前 • AI产业动态 • 阅读 18

OpenAI 发起了一项名为 Model Craft Challenge 的全新挑战，其核心项目为“Parameter Golf”。这项挑战设定了极为严苛的约束条件。

参与者需要在固定的 FineWeb 数据集上，尽可能降低模型的验证损失。同时，最终的模型产物（包含权重与训练代码）必须控制在 16 MB 以内，并且训练过程必须在 8 张 H100 GPU 上于 10 分钟内完成。

这些限制条件几乎排除了单纯堆叠参数或比拼算力的传统方法。挑战的重点转向了模型结构设计、极致压缩技术、策略取舍以及工程实现上的巧思。

OpenAI发起Model Craft挑战：16MB参数极限压缩，10分钟训练，争夺百万算力与面试机会

挑战的名称“Parameter Golf”借鉴了高尔夫运动的理念。如同高尔夫追求以最少的杆数进洞，“Parameter Golf”旨在鼓励研究者用最少的参数达成最优的模型性能，探索模型效率的技术极限。

该挑战面向全球开放，旨在探索严格资源约束下更高效的预训练模型。表现突出的参与者可能获得 OpenAI 的面试机会，获胜方案亦有机会被公开展示。

OpenAI发起Model Craft挑战：16MB参数极限压缩，10分钟训练，争夺百万算力与面试机会

在赛题设计上，挑战借鉴了“NanoGPT Speedrunning”的思路，即在限定时间内达到目标性能。OpenAI 在此基础上进一步聚焦于参数限制，以推动在新型架构、压缩方法和训练推理策略上的创新。

为降低参与门槛，官方将排行榜的提交限制在 8 张 H100 GPU 和 10 分钟训练时间内。对于超出此算力限制的方案，也鼓励提交至非记录板块进行探索。此外，OpenAI 提供了总额 100 万美元的算力支持，以帮助参与者启动训练。

挑战于 3 月 18 日开始，持续至 4 月 30 日。

如何参与？
参与者需 Fork 项目提供的 GitHub 仓库，其中包含基线模型、固定数据集和评测脚本。在满足模型大小与算力限制的前提下进行改进后，提交一个包含代码、日志、成绩及简短说明的 PR。审核通过后，结果将被合并，排行榜自动更新。参与者还可申请有限的免费算力额度。

常见问题解答：
* 参与资格：原则上面向年满 18 岁且位于支持地区的个人。OpenAI 员工可参与但无法获得算力奖励。
* 产物大小计算：16MB（16,000,000 字节）上限包含代码体积与压缩后的模型体积。所有代码需置于 train_gpt.py 中，产物须完全自包含，评测时不允许任何外部网络请求。
* 评测限制：评测阶段本身也需在 8 张 H100 GPU 上于 10 分钟内完成（此时间在训练时间之外）。评测流程设计相对自由，允许在任意序列长度上进行。
* 算力与提交：可多次申请算力额度（但资源有限，不保证获批），也可多次提交参赛作品。但提交仅限个人，不接受团队形式。

业界看法：
对于此项挑战，业界观点呈现分歧。有观点认为这是在资源受限环境下识别优秀工程师的有效方式。也有人担忧其他公司可能效仿其形式却无实质激励。此外，讨论还延伸至一个有趣的方向：模型设计与优化本是 AI 擅长的领域，此事是否应交由 AI Agent 自动完成？有研究者表示，理论上可以组建“AI Agent 集群”参与此类竞赛。

OpenAI发起Model Craft挑战：16MB参数极限压缩，10分钟训练，争夺百万算力与面试机会