OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会

OpenAI 发起了一项名为 Model Craft Challenge 的全新挑战,其核心项目为“Parameter Golf”。这项挑战设定了极为严苛的约束条件。

参与者需要在固定的 FineWeb 数据集上,尽可能降低模型的验证损失。同时,最终的模型产物(包含权重与训练代码)必须控制在 16 MB 以内,并且训练过程必须在 8 张 H100 GPU 上于 10 分钟内完成。

这些限制条件几乎排除了单纯堆叠参数或比拼算力的传统方法。挑战的重点转向了模型结构设计、极致压缩技术、策略取舍以及工程实现上的巧思。

OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会

挑战的名称“Parameter Golf”借鉴了高尔夫运动的理念。如同高尔夫追求以最少的杆数进洞,“Parameter Golf”旨在鼓励研究者用最少的参数达成最优的模型性能,探索模型效率的技术极限。

该挑战面向全球开放,旨在探索严格资源约束下更高效的预训练模型。表现突出的参与者可能获得 OpenAI 的面试机会,获胜方案亦有机会被公开展示。

OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会

在赛题设计上,挑战借鉴了“NanoGPT Speedrunning”的思路,即在限定时间内达到目标性能。OpenAI 在此基础上进一步聚焦于参数限制,以推动在新型架构、压缩方法和训练推理策略上的创新。

为降低参与门槛,官方将排行榜的提交限制在 8 张 H100 GPU 和 10 分钟训练时间内。对于超出此算力限制的方案,也鼓励提交至非记录板块进行探索。此外,OpenAI 提供了总额 100 万美元的算力支持,以帮助参与者启动训练。

挑战于 3 月 18 日开始,持续至 4 月 30 日。

如何参与?
参与者需 Fork 项目提供的 GitHub 仓库,其中包含基线模型、固定数据集和评测脚本。在满足模型大小与算力限制的前提下进行改进后,提交一个包含代码、日志、成绩及简短说明的 PR。审核通过后,结果将被合并,排行榜自动更新。参与者还可申请有限的免费算力额度。

常见问题解答:
* 参与资格:原则上面向年满 18 岁且位于支持地区的个人。OpenAI 员工可参与但无法获得算力奖励。
* 产物大小计算:16MB(16,000,000 字节)上限包含代码体积与压缩后的模型体积。所有代码需置于 train_gpt.py 中,产物须完全自包含,评测时不允许任何外部网络请求。
* 评测限制:评测阶段本身也需在 8 张 H100 GPU 上于 10 分钟内完成(此时间在训练时间之外)。评测流程设计相对自由,允许在任意序列长度上进行。
* 算力与提交:可多次申请算力额度(但资源有限,不保证获批),也可多次提交参赛作品。但提交仅限个人,不接受团队形式。

业界看法:
对于此项挑战,业界观点呈现分歧。有观点认为这是在资源受限环境下识别优秀工程师的有效方式。也有人担忧其他公司可能效仿其形式却无实质激励。此外,讨论还延伸至一个有趣的方向:模型设计与优化本是 AI 擅长的领域,此事是否应交由 AI Agent 自动完成?有研究者表示,理论上可以组建“AI Agent 集群”参与此类竞赛。

OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/26442

(0)
上一篇 2026年3月19日 下午7:39
下一篇 2026年3月19日 下午7:50

相关推荐

  • 图灵奖得主Yann LeCun离职Meta创业:以世界模型推动高级机器智能革命

    近日,人工智能领域的标志性人物、图灵奖得主Yann LeCun宣布将在年底离开Meta,并创立一家专注于高级机器智能(Advanced Machine Intelligence,AMI)的初创公司。这一消息在科技界引发广泛关注,不仅因为LeCun作为深度学习先驱的行业地位,更因为其新公司的目标直指AI发展的核心挑战——构建能够理解物理世界、具备持久记忆和复杂…

    2025年11月20日
    26400
  • CREAO AI新品引爆热议:自然语言描述需求,AI现场编码构建可持续运行系统,无需技术门槛的Agent新范式

    「用一句话交代任务,然后什么都不用管,AI 自动执行。」这或许是人们对「AI 超级助手」最初的想象。 以常见的电商运营场景为例:当你描述完「每周一早上 9 点,扫描 3 个竞品网站的价格变动,记录到 Google Sheets,如果波动超过 10% 就在 Slack 通知我」之后,你期望的是,此后每周一早上 9 点,AI 都会自动执行这一任务。 如今,借助各…

    2026年4月9日
    30600
  • Meta AI基础设施十年演进:从GPU集群到自研芯片的下一代蓝图

    关键词:基础设施演进、AI集群、大语言模型、GPU扩展、自研芯片 我们仍处于人工智能工作负载演进和应用的早期阶段。过去几年我们一直忙碌不停,而未来几年的发展速度将更快。人工智能对硬件提出的需求,丝毫没有放缓的迹象。 在过去的21年里,Meta实现了指数级增长,从一个连接美国几所大学数千人的小型社交网络,发展成为拥有多款应用程序和新型硬件产品、服务全球超过34…

    2026年1月30日
    52800
  • 文心一言5.0正式版深度评测:国产大模型如何突破算力桎梏,在多模态赛道站稳脚跟?

    核心结论: 文心一言5.0正式版在预览版基础上进行了针对性打磨,整体可用性有所提升,在国产大模型中站稳了第二梯队的位置。其核心优势在于长链推理、多轮对话的稳定性,但算力消耗与上下文幻觉问题仍是主要挑战。 逻辑能力表现:注1:表格为突出对比关系,仅展示部分可对照模型,非完整排序。注2:题目及测试方式,参见《大语言模型逻辑能力横评(25年12月榜)》,新增#55…

    2026年1月23日
    53600
  • Nano Banana Pro深度解析:时空重构AI的突破与局限

    近期,Nano Banana Pro凭借其“时空重现”能力引发广泛关注。这款AI模型只需输入坐标和可选时间参数,就能生成对应时空的拟真影像,从技术角度看,这标志着多模态AI在时空理解与生成领域迈出了重要一步。 从技术架构分析,Nano Banana Pro的核心突破在于实现了从“推理”到“创造”的能力跃迁。早期版本已能通过图像反推拍摄坐标,展现出色的地理空间…

    2025年11月26日
    31000