OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会

OpenAI 发起了一项名为 Model Craft Challenge 的全新挑战,其核心项目为“Parameter Golf”。这项挑战设定了极为严苛的约束条件。

参与者需要在固定的 FineWeb 数据集上,尽可能降低模型的验证损失。同时,最终的模型产物(包含权重与训练代码)必须控制在 16 MB 以内,并且训练过程必须在 8 张 H100 GPU 上于 10 分钟内完成。

这些限制条件几乎排除了单纯堆叠参数或比拼算力的传统方法。挑战的重点转向了模型结构设计、极致压缩技术、策略取舍以及工程实现上的巧思。

OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会

挑战的名称“Parameter Golf”借鉴了高尔夫运动的理念。如同高尔夫追求以最少的杆数进洞,“Parameter Golf”旨在鼓励研究者用最少的参数达成最优的模型性能,探索模型效率的技术极限。

该挑战面向全球开放,旨在探索严格资源约束下更高效的预训练模型。表现突出的参与者可能获得 OpenAI 的面试机会,获胜方案亦有机会被公开展示。

OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会

在赛题设计上,挑战借鉴了“NanoGPT Speedrunning”的思路,即在限定时间内达到目标性能。OpenAI 在此基础上进一步聚焦于参数限制,以推动在新型架构、压缩方法和训练推理策略上的创新。

为降低参与门槛,官方将排行榜的提交限制在 8 张 H100 GPU 和 10 分钟训练时间内。对于超出此算力限制的方案,也鼓励提交至非记录板块进行探索。此外,OpenAI 提供了总额 100 万美元的算力支持,以帮助参与者启动训练。

挑战于 3 月 18 日开始,持续至 4 月 30 日。

如何参与?
参与者需 Fork 项目提供的 GitHub 仓库,其中包含基线模型、固定数据集和评测脚本。在满足模型大小与算力限制的前提下进行改进后,提交一个包含代码、日志、成绩及简短说明的 PR。审核通过后,结果将被合并,排行榜自动更新。参与者还可申请有限的免费算力额度。

常见问题解答:
* 参与资格:原则上面向年满 18 岁且位于支持地区的个人。OpenAI 员工可参与但无法获得算力奖励。
* 产物大小计算:16MB(16,000,000 字节)上限包含代码体积与压缩后的模型体积。所有代码需置于 train_gpt.py 中,产物须完全自包含,评测时不允许任何外部网络请求。
* 评测限制:评测阶段本身也需在 8 张 H100 GPU 上于 10 分钟内完成(此时间在训练时间之外)。评测流程设计相对自由,允许在任意序列长度上进行。
* 算力与提交:可多次申请算力额度(但资源有限,不保证获批),也可多次提交参赛作品。但提交仅限个人,不接受团队形式。

业界看法:
对于此项挑战,业界观点呈现分歧。有观点认为这是在资源受限环境下识别优秀工程师的有效方式。也有人担忧其他公司可能效仿其形式却无实质激励。此外,讨论还延伸至一个有趣的方向:模型设计与优化本是 AI 擅长的领域,此事是否应交由 AI Agent 自动完成?有研究者表示,理论上可以组建“AI Agent 集群”参与此类竞赛。

OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会
OpenAI发起Model Craft挑战:16MB参数极限压缩,10分钟训练,争夺百万算力与面试机会


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/26442

(0)
上一篇 2小时前
下一篇 2小时前

相关推荐

  • HeyGen ARR破亿背后的AI时代运营哲学:从“稳定地基”到“驾驭浪潮”的范式革命

    近日,AI视频生成领域的明星公司HeyGen宣布其年化经常性收入(ARR)已突破1亿美元大关。这一里程碑尤为引人注目的是,该公司在短短29个月前才刚刚达到100万美元ARR,实现了百倍级的指数增长。这一成就不仅彰显了HeyGen在商业上的成功,更揭示了AI技术快速迭代时代下,一种全新的企业运营范式正在崛起。 HeyGen创始人兼CEO Joshua Xu近期…

    2025年10月18日
    22800
  • 颠覆认知:扩散模型表征对齐中,空间结构竟比全局语义更重要

    在扩散模型的训练优化领域,表征对齐(REPA)技术自去年十月问世以来,一直被视为加速扩散Transformer训练的关键突破。该方法通过将预训练视觉编码器的表征蒸馏为中间扩散特征来指导生成式训练,显著提升了训练效率。然而,一个根本性问题长期悬而未决:对于生成任务而言,目标表征的哪个维度更为关键?是编码器捕获的全局语义信息(通常以ImageNet-1K分类准确…

    2025年12月13日
    17100
  • AI资本内循环:从万亿美元市值到信息平权的技术革命

    在人工智能浪潮席卷全球的当下,一个引人深思的现象正在硅谷乃至全球科技界上演:AI产业的资本流动形成了一个精密的闭环系统,几家科技巨头通过复杂的交易与合作,共同撑起了万亿美元的市值。这不仅是市场层面的繁荣写照,更揭示了AI技术发展背后的资本逻辑与产业生态的深刻变革。 这一资本内循环的核心驱动力,源于AI技术对算力的巨大需求。今年9月,OpenAI与Oracle…

    2025年11月29日
    21500
  • 从12次拒签到AI框架革命:Soumith Chintala与PyTorch的逆袭之路

    在人工智能发展的历史长河中,框架工具往往成为技术演进的关键催化剂。2017年,一个名为PyTorch的开源框架悄然问世,它改变了深度学习研究的范式,重塑了AI开发的生态格局。而这一切的背后,是一位曾被世界反复拒绝的工程师——Soumith Chintala。 Soumith Chintala的起点并不耀眼。他出生于印度海德拉巴,就读于VIT Vellore这…

    2025年11月15日
    17400
  • 昆仑万维开源SkyReels-V3:多模态视频生成新标杆,虚拟网红时代的技术引擎

    AI 网红们在社交平台上混得风生水起。他们手握品牌合作,坐拥百万粉丝,但很多人至今不知这些都是 AI 生成的,依然像追真人明星一样互动、点赞、被种草。 这也难怪有博主直呼:虚拟网红时代已经到来。 现在,昆仑万维也来添了把火,直接把背后的技术开源了。 1 月 29 日,Skywork AI 团队宣布开源 SkyReels-V3 多模态视频生成模型系列。该系列涵…

    2026年1月29日
    23700