具身智能开源社区AlphaBrain Platform上线:开源灵魂“大脑”,挑战特斯拉Optimus

这会是具身智能领域的“OpenClaw”时刻吗?

4月,特斯拉宣布开放其人形机器人 Optimus 的手部专利与硬件结构细节,意图通过开源加速技术普及,定义硬件入场规则。此举在业内引发巨震。

今日,面对硅谷巨头的战略布局,国内团队给出了回应:你开源钢铁躯壳,我开源灵魂“大脑”。

具身智能开源社区AlphaBrain Platform上线:开源灵魂“大脑”,挑战特斯拉Optimus

全球首个一站式、开箱即用的具身智能模型开源社区 AlphaBrain Platform 正式上线,向全行业交付了一套完整的“顶配全家桶”技术栈。

该平台打通了“数据→训练→架构→测试”全链路,集成了世界模型类脑模型等前沿技术,具备跨范式即插即用能力,并提供了统一的 Benchmark 评估标准。此前仅存在于顶尖实验室的能力,现已全面开放,供开发者取用、测试与落地。

推动这一社区的,是国内具身智能创业公司智平方(AI² Robotics)。

技术路线集齐,重塑开源标准

AlphaBrain Platform 集成了当前具身智能领域最热门的多个技术路线,包括世界模型、类脑模型、RL Token 等,并针对量产落地挑战提出了独特解法。其技术核心包含以下五大亮点:

具身智能开源社区AlphaBrain Platform上线:开源灵魂“大脑”,挑战特斯拉Optimus

1. 迈向生物脑:全球首个开源类脑 VLA 模型(NeuroVLA)

NeuroVLA 是首个在类脑控制任务中展现卓越效能的开源模型,刷新了类脑具身性能纪录,开启了向生物脑学习机制进化的新篇章。

具身智能开源社区AlphaBrain Platform上线:开源灵魂“大脑”,挑战特斯拉Optimus

传统机器人动作输出依赖连续值,而 NeuroVLA 创新性地引入脉冲神经网络(SNN)动作头,以脉冲编码模拟生物神经元的放电机制。该模型具备“在线自适应”能力,部署时无需反向传播,仅依赖环境交互的自监督奖励信号即可实时更新权重,实现任务过程中的持续适应。配合 GRU-FiLM 动作精修模块,系统可基于机器人本体状态对 SNN 输出进行条件性修正,大幅提升动作精度。

2. 告别“灾难性遗忘”:首个面向跨架构 VLA 的开源持续学习算法

大模型在学习新技能时易产生“灾难性遗忘”,且微调成本高昂。该算法通过以下方式突破了架构兼容性瓶颈:

  • 高效微调:集成 LoRA 参数,仅训练 VLM 骨干网 6% 的参数,显存占用降低 60%。
  • 经验回放:维护可配置的任务级回放缓冲区,在学习新任务时自动回放旧任务样本,实现知识累积迁移。
  • 增量式设计:所有改动不修改基座代码,与具体 VLA 框架解耦。

该算法已在 QwenGR00T、LLamaOFT 等多种架构上验证了兼容性,实现跨架构通用。

3. 低成本泛化:首个基于 RL Token 的全新 VLA 训练架构

强化学习(RL)是赋予机器人泛化能力的关键,但试错成本高昂。该范式率先开源了 RL-Token 技术,并在公开基准 LIBERO 上完成验证,仅需极少量人类专家演示即可完成高质量训练。

该架构通过编码器将 VLA 的隐藏状态压缩至低维瓶颈空间,剔除冗余信息。采用两阶段训练方式:RL 微调阶段,VLA 主体参数被“完全冻结”,仅训练轻量级 RL 模块,计算成本仅为原来的 3.5%。同时,引入 50% 概率丢弃 VLA 参考动作的 Dropout 机制,增强机器人自主探索能力。

4. “可插拔”的世界模型架构(WA)

“世界模型”可提供虚拟化环境,让机器人在行动前预演未来。智平方提出的可插拔架构原生集成 NVIDIA Cosmos Policy 的原始预训练权重,并支持在 Meta V-JEPA、英伟达 Cosmos Predict、阿里 Wan 等三大世界模型上灵活切换。

该架构下,所有世界模型共享 DiT 动作解码器,并自动适配各家多模态文本编码器。开发者仅需修改配置文件,即可自由对比不同世界模型在相同任务上的表现。

5. 全面适配最新具身 Benchmark

为验证上述能力,智平方为整套体系适配了 LIBERO、LIBERO-plus、RoboCasa 及 RoboCasa365 等业界权威评测基准。AlphaBrain Platform 提供统一的评估入口,自动完成从推理服务启动到关闭的全流程。配合 WebSocket 推理服务与 BF16 加速,支持远程部署、跨机器评估及 VLA+VLM 联合训练,全面提升了评估效率。

让开发者站在巨人的肩膀上

过去两年,具身智能领域涌现大量开源模型,但真正“好用”的较少。开发者常面临模型运行困难、性能对比模糊、场景落地复杂等问题。

AlphaBrain Platform 不仅开源了模型,更提供了让模型“能跑起来、比得清、能落地”的全链路能力。相比硅谷 Physical Intelligence 的 Pi 模型仍处于单模型开源阶段,AlphaBrain Platform 相当于交付了一整座高度定制化的“兵工厂”,将繁杂的环境配置、接口对齐和架构适配等底层工作彻底打包解决。

在该平台上,开发者只需几行配置即可实现跨架构、跨范式的自由组合。低硬件门槛(消费级显卡可运行)与低成本微调支持,大幅缩短了从研发到落地的时间。平台统一了评估标准,方便开发者选择最适合自身任务的工具。

此次开源的最大贡献在于打破实验室围墙,让原本只存在于英伟达、Meta 等顶尖实验室的能力全面开放。这将极大推动机器人行业从“重复造轮子”转向更深层次的技术突破。

不止于开源大脑:“最像特斯拉”的中国具身智能独角兽

(此段为原文第 2/2 部分的开头,已按您的截断处理)


技术原生与持续突破:AlphaBrain 如何定义具身智能的未来

打破技术窗户纸的智平方,被业内评价为“最像特斯拉”的机器人公司。其核心在于自公司成立之初便坚持端到端大模型的技术范式。早在2023年初,全球仅有特斯拉机器人与智平方选择这条鲜有人走的技术路线。智平方自研的具身大模型 AlphaBrain 采用原创模型架构,构建了完整的数据—训练—迭代闭环体系,而非套用开源方案,实现了真正的“技术原生”。

具身智能开源社区AlphaBrain Platform上线:开源灵魂“大脑”,挑战特斯拉Optimus

快慢系统深度融合的新一代架构

2024年,智平方发布了创业公司中首个 VLA 模型,在模型规模仅为谷歌同类模型 1/20 的情况下,性能提升超过 80%。2025年,智平方推出快慢系统深度融合的新一代架构,在第三方评测中超越国际标杆模型 Pi0 达 30%。这些成果已全部融入 AlphaBrain 的迭代体系,使其始终站在行业最前沿。

当行业近期开始热议“世界模型”时,智平方在2023年下半年便率先提出:世界模型不应是 VLA 的外接模块,而应深度内生于模型之中。基于这一前瞻认知,AlphaBrain 在2025年11月吸纳了新一代架构 Video2Act 的最新成果——实现“先预测、后执行”。在第三方评测中,相较于硅谷同类标杆模型,AlphaBrain 取得了超过 30% 的性能领先,证明了环境理解与动作执行一体化路线的显著优势。

从固定模型到持续进化:NeuroVLA 的开源突破

传统 VLA 模型“训练完成即固定”,无法在部署后继续学习。智平方再次引领突破——他们开源了全球首个类脑 VLA 模型(NeuroVLA),并将其融入 AlphaBrain。NeuroVLA 引入脉冲神经网络动作头与 R-STDP 训练算法,支持部署阶段的在线自适应,让机器人具备类似“肌肉记忆”的能力。这意味着机器人第一次从“执行指令的工具”转变为“在任务中不断进化的主体”:不只是完成任务,而是在过程中变得更熟练、更稳定,接近人类的学习方式。

硬件量产与商业落地:从千台交付到全球最大订单

与此同时,智平方也构建了完整的硬件量产与商业落地能力。智平方坚持面向量产的硬件设计,其最新一代 AlphaBot 2 机器人核心部件无故障运行寿命可达 5 万小时。依托自建产线,智平方在2025年已具备千台级年产能,并在年底实现了单月百台级的真实交付。

具身智能开源社区AlphaBrain Platform上线:开源灵魂“大脑”,挑战特斯拉Optimus

在落地上,智平方率先跑通了数据 × 商业双闭环,其产品在半导体显示制造、汽车制造、公共服务等大量真实场景持续运行。他们获得了全球第三大面板厂商惠科的 1000 台订单,被摩根士坦利认定为该领域全球最大单一订单。同时,在新零售赛道,其推出的全球首个模块化具身智能服务空间“智魔方”,已在多地实现日均10小时以上的常态化、零失误自主运营。

从开源大脑到坚实的商业闭环,智平方的行动,正在定义着具身智能作为下一代先进生产力的未来。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/31380

(0)
上一篇 2026年4月22日 下午3:47
下一篇 2026年4月22日 下午3:51

相关推荐

  • SWE-Vision:让大模型用代码“看见”世界,五大视觉基准刷新SOTA

    多模态大模型在代码生成与理解方面取得了显著进展,但其在基础视觉任务上的表现却时常不尽如人意。针对这一短板,UniPat AI 提出了一个极简的视觉智能体框架——SWE-Vision。该框架的核心思想是让模型能够编写并执行 Python 代码,以此处理和验证自身的视觉判断。在五个主流视觉基准测试中,SWE-Vision 均取得了当前最优的性能。 01|模型看得…

    2026年3月16日
    49200
  • 极致极简的AI Agent内核:pi-mono凭何拿下4万Star?

    2026 年,几乎每个人都想打造一个属于自己的 AI Agent。 不需要从零开始摸索,也无需重复造轮子。 今天要推荐的这款开源项目,已经把 Agent 的底层架构打磨得异常精简。如果你想开发自己的 Agent,这个项目非常值得深入研究。 它叫 pi-mono。 OpenClaw 的核心运行时,正是基于 Pi 的 SDK 构建的。 OpenClaw 的 RE…

    2026年4月27日
    95400
  • GitHub热榜开源项目The Agency:55个AI专家角色库,打造你的虚拟AI公司

    最近,GitHub 趋势榜上出现了一个引人注目的开源项目——The Agency。它本质上是一个AI专家角色库,汇集了55个专业AI角色,并划分为9个部门,涵盖了从工程师、设计师到产品经理、增长黑客等各类常见岗位。 该项目起源于Reddit论坛上的一场讨论。作者发布想法后,短短12小时内便收到超过50位用户的资源请求,进而促成了该项目的诞生。 项目概览:它是…

    2026年3月9日
    2.0K00
  • Vibe Coding革命:从代码苦力到AI导演,GitHub神级指南引领开发新范式

    Vibe Coding 的核心,是让开发者从编写每一行代码的“苦力”中解放出来,转而扮演“导演”的角色。 开发者只需专注于把握产品的核心逻辑、用户流程、审美与交互等宏观“感觉”(Vibe),而将具体的编码实现工作交给 Cursor、Windsurf、Trae 等 AI 编程工具来完成。正如 Andrej Karpathy 所言:“我几乎不写代码了,我只负责调…

    2025年12月27日
    39200
  • 字节携手北大开源Helios视频模型:14B参数实现19.5FPS,登顶Hugging Face!

    春节期间,Seedance 2.0 的爆火将视频生成技术再次推向风口。紧随其后,字节跳动联合北京大学、安努智能及 Canva 共同开源了具备实时生成能力的视频模型系列——Helios。该系列包含 Helios-Base、Helios-Mid 与 Helios-Distilled 三个版本,全面支持文本到视频(T2V)、图像到视频(I2V)、视频到视频(V2V…

    2026年3月7日
    71600