OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会

OpenAI 发起了一项名为 Model Craft Challenge 的全新挑战,其核心项目为“Parameter Golf”。这项挑战设定了极为严苛的约束条件。

参与者需要在固定的 FineWeb 数据集上,尽可能降低模型的验证损失。同时,最终的模型产物(包含权重与训练代码)必须控制在 16 MB 以内,并且训练过程必须在 8 张 H100 GPU 上于 10 分钟内完成。

这些限制条件几乎排除了单纯堆叠参数或比拼算力的传统方法。挑战的重点转向了模型结构设计、极致压缩技术、策略取舍以及工程实现上的巧思。

OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会

挑战的名称“Parameter Golf”借鉴了高尔夫运动的理念。如同高尔夫追求以最少的杆数进洞,“Parameter Golf”旨在鼓励研究者用最少的参数达成最优的模型性能,探索模型效率的技术极限。

该挑战面向全球开放,旨在探索严格资源约束下更高效的预训练模型。表现突出的参与者可能获得 OpenAI 的面试机会,获胜方案亦有机会被公开展示。

OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会

在赛题设计上,挑战借鉴了“NanoGPT Speedrunning”的思路,即在限定时间内达到目标性能。OpenAI 在此基础上进一步聚焦于参数限制,以推动在新型架构、压缩方法和训练推理策略上的创新。

为降低参与门槛,官方将排行榜的提交限制在 8 张 H100 GPU 和 10 分钟训练时间内。对于超出此算力限制的方案,也鼓励提交至非记录板块进行探索。此外,OpenAI 提供了总额 100 万美元的算力支持,以帮助参与者启动训练。

挑战于 3 月 18 日开始,持续至 4 月 30 日。

如何参与?
参与者需 Fork 项目提供的 GitHub 仓库,其中包含基线模型、固定数据集和评测脚本。在满足模型大小与算力限制的前提下进行改进后,提交一个包含代码、日志、成绩及简短说明的 PR。审核通过后,结果将被合并,排行榜自动更新。参与者还可申请有限的免费算力额度。

常见问题解答:
* 参与资格:原则上面向年满 18 岁且位于支持地区的个人。OpenAI 员工可参与但无法获得算力奖励。
* 产物大小计算:16MB(16,000,000 字节)上限包含代码体积与压缩后的模型体积。所有代码需置于 train_gpt.py 中,产物须完全自包含,评测时不允许任何外部网络请求。
* 评测限制:评测阶段本身也需在 8 张 H100 GPU 上于 10 分钟内完成(此时间在训练时间之外)。评测流程设计相对自由,允许在任意序列长度上进行。
* 算力与提交:可多次申请算力额度(但资源有限,不保证获批),也可多次提交参赛作品。但提交仅限个人,不接受团队形式。

业界看法:
对于此项挑战,业界观点呈现分歧。有观点认为这是在资源受限环境下识别优秀工程师的有效方式。也有人担忧其他公司可能效仿其形式却无实质激励。此外,讨论还延伸至一个有趣的方向:模型设计与优化本是 AI 擅长的领域,此事是否应交由 AI Agent 自动完成?有研究者表示,理论上可以组建“AI Agent 集群”参与此类竞赛。

OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/26442

(0)
上一篇 2026年3月19日 下午7:39
下一篇 2026年3月19日 下午7:50

相关推荐

  • 2026年工作流升级指南:10个现代Python库助你提升开发效率

    现代 Python 强调速度、清晰性和低摩擦。开发者期待能消除环境搭建之痛、缩短反馈回路的工具。 以下这些库可以在不增加复杂度的前提下,帮助你改进日常工作。 1. Pixi 📦 如果你曾花更多时间在排查虚拟环境而不是写代码上,Pixi 就是为你准备的。它是一个构建在 Conda 生态上的高性能包管理器,但针对速度与简洁做了优化。 为什么值得切换: 相比传统 …

    2026年1月26日
    53200
  • 隐形攻击:HTML代码中的隐藏指令如何操控大模型网页总结

    在人工智能工具日益普及的今天,网页内容自动总结已成为许多用户获取信息的便捷方式。然而,一项来自印度马尼帕尔大学的最新研究揭示了一个令人不安的安全漏洞:攻击者可以通过在HTML代码中植入隐形元素,向大语言模型(LLM)传递隐藏指令,从而操控其总结输出,而用户对此毫无察觉。 这项研究系统地探讨了LLM处理网页内容时的潜在风险。当前,许多AI工具(如浏览器插件、自…

    AI产业动态 2025年9月23日
    38700
  • 小模型专项训练新范式:Karpathy 如何通过数据增强让“蜜蜂大脑”学会字母计数

    近日,OpenAI 联合创始人 Andrej Karpathy 在社交媒体上分享了一项引人深思的实验:他成功训练了一个参数量极小的语言模型 nanochat d32 完成一项看似简单却极具挑战性的任务——准确计算单词中特定字母(如字母“r”)的数量。这一实验不仅展示了小模型在特定任务上的潜力,更揭示了在资源受限条件下,如何通过精心设计的数据增强策略来弥补模型…

    2025年10月26日
    33500
  • GDPS 2025:上海张江的具身智能“协同大考”,如何定义机器人产业未来?

    一场具身智能的“终极大考”正在上海张江科学会堂上演。全球具身智能顶级赛事——GDPS 2025拉开帷幕,这场赛事不仅汇聚了智元、宇树等国内头部机器人企业,更吸引了国际参赛队伍,将百大真实场景浓缩为一道道协同考题,从工业搬运、花艺创作到康养护理、灾害救援,全面检验机器人从“赛博推理”走向“物理执行”的能力。 舞台两侧,智元远征A2与灵犀X2机器人联袂亮相,穿着…

    2025年12月13日
    33300
  • DeepSeek宕机8小时竟是升级前兆?模型能力突变引发全网热议

    DeepSeek宕机8小时竟是升级前兆?模型能力突变引发全网热议 DeepSeek服务中断超过8小时,引发用户广泛讨论。此次宕机并非普通的服务器故障,而被许多用户解读为模型重大升级的前兆。 在服务中断前,已有大量用户报告DeepSeek网页版出现显著变化,模型能力大幅提升。例如,在经典的“用SVG画鹈鹕骑自行车”任务中,3月29日版本的构图与色彩表现明显优于…

    2026年3月30日
    46600