小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行

上周,两个未署名的匿名模型悄然上架知名 API 聚合平台 OpenRouter,代号分别为“Hunter Alpha”和“Healer Alpha”。它们在没有任何官方宣传的情况下,调用量开始以异常的速度持续攀升。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行

其中,Hunter Alpha 更是多日登顶平台日榜,累计调用量突破 1T tokens,引发了社区的广泛猜测。最主流的观点认为其来自 DeepSeek,可能是 DeepSeek V4 的内测版本。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行 OpenClaw 创始人 Peter Steinberger 在 X 平台的公开询问,进一步点燃了讨论热度。

谜底很快揭晓。小米官方正式宣布,Hunter Alpha 和 Healer Alpha 均为其 MiMo-V2 系列大模型的早期内测版本。小米 MiMo 大模型负责人罗福莉也在 X 平台公开认领。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行 值得一提的是,罗福莉曾是 DeepSeek 的研究员,这在一定程度上解释了为何社区最初会将模型与 DeepSeek 联系起来。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行

此次小米一次性发布了三款模型,它们虽各有侧重,但共同指向一个核心目标:推动 AI 从“对话交互”向“任务执行”进化。

  • MiMo-V2-Pro:旗舰文本基座模型,专为高强度的智能体(Agent)工作场景设计,主打复杂推理、任务规划与工具调用能力。
  • MiMo-V2-Omni:全模态智能体基座模型,原生融合文本、视觉与音频感知,旨在打通从环境理解到自主执行的完整链路。
  • MiMo-V2-TTS:语音合成大模型,目标是为智能体赋予富有情感和表现力的声音,构成任务执行栈的最后一环。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行

MiMo-V2-Pro:强调推理与性价比

MiMo-V2-Pro 的总参数量突破 1T,激活参数为 42B。其在保持高效推理的同时,支持高达 1M 的超长上下文窗口,这为处理长程、复杂的智能体任务提供了结构优势。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行

在权威大模型综合评测榜 Artificial Analysis 上,MiMo-V2-Pro 位列全球第八。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行 在实际能力评估中,小米强调其在代码生成、通用智能体任务和工具调用等维度,与 Claude Sonnet 4.6 处于同一梯队,代码工程能力已接近 Claude Opus 4.6。

定价策略是其另一大亮点。MiMo-V2-Pro 的 API 价格约为同级别竞品的五分之一,旨在以高性价比快速吸引开发者生态。目前,其 API 服务已正式开放。

MiMo-V2-Omni:统一感知与行动的全模态模型

MiMo-V2-Omni 是小米首个在基座层面统一感知与行动的全模态模型。其音频理解能力支持超过 10 小时的连续长音频分析;图像理解在多学科推理与复杂图表分析上表现突出;视频理解则采用原生音视频联合输入架构。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行

在实操场景中,它能够完成端到端的复杂任务。例如,在测试中可操控浏览器进行信息检索、比价、与客服沟通直至完成下单。在纯文本智能体基准测试 PinchBench 上,其表现可比肩顶尖模型。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行

该模型已与金山办公合作,接入 WPS 灵犀,支持直接生成各类办公文档。其 API 也已同步开放。

MiMo-V2-TTS:为智能体注入情感化声音

MiMo-V2-TTS 基于大规模语音数据训练,旨在解决智能体的“发声”问题。它支持多粒度情感控制,能在同一句话内实现语气转折,并智能识别文本中的格式信号以转化为自然的语音表达。

模型还具备方言支持、角色扮演式风格演绎及歌声合成能力。未来,其计划与 MiMo-V2-Omni 深度融合,让智能体能“看懂”世界,更能“生动地讲述”世界。

战略意义:驱动“人车家全生态”的智能中枢

三款模型的集中发布并非偶然。罗福莉透露,团队早已布局大参数模型与混合注意力等创新架构,并对智能体范式转型抱有坚定决心。小米MiMo-V2系列模型匿名上线引猜测,三款模型齐发推动AI从对话到任务执行

这三款模型构成了一个完整的 AI 能力栈:MiMo-V2-Pro 负责推理规划,MiMo-V2-Omni 负责多模态感知与执行,MiMo-V2-TTS 负责语音交互。它们正被整合进小米的“人车家全生态”战略中。

手机端的 AI 智能体“miclaw”已接入 MiMo 大模型,具备系统级执行能力;WPS、小米浏览器等应用的接入,则表明 MiMo 正在成为嵌入各类场景的基础能力层。这标志着小米正通过 Agent 驱动的 AI,为其互联互通的硬件生态注入统一的智能中枢。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/26417

(0)
上一篇 12小时前
下一篇 2026年2月2日 下午2:35

相关推荐

  • Ilya Sutskever深度访谈:AI进入研究时代,超级智能与对齐的未来路径

    当OpenAI前首席科学家、Safe Superintelligence Inc.创始人Ilya Sutskever在最新访谈中宣告“扩展时代已经终结”,整个AI社区为之震动。这一断言不仅挑战了过去五年以算力和数据堆砌为核心的AI发展范式,更预示着人工智能领域正迎来一次根本性的战略转向。 这场由Dwarkesh Patel主持的95分钟深度对话,在X平台上线…

    2025年11月26日
    20400
  • 神经网络权重空间的柏拉图式启示:通用子空间假说如何重塑AI架构认知

    近期,约翰斯・霍普金斯大学的一项突破性研究揭示了神经网络训练中一个令人震撼的规律:超过1100个在不同数据集、不同初始化条件下训练的神经网络,其最终学到的权重都会收敛到一个共享的低维子空间。这一发现不仅挑战了传统机器学习中“数据驱动一切”的范式,更暗示着神经网络架构本身可能蕴含着某种先验的数学结构——所有训练过程本质上都是在“发现”而非“创造”这个早已存在的…

    2025年12月14日
    20000
  • 自动驾驶范式迁移:从数据闭环到训练闭环的深度技术解析

    在自动驾驶技术发展的关键转折点,行业正经历一场深刻的范式迁移。端到端架构虽曾统一技术栈并释放Scaling Law潜力,但随着数据瓶颈日益凸显,单纯依赖模仿学习已难以突破人类司机能力上限。ICCV 2025的最新动向显示,头部企业正形成共识:强化学习与云端生成式世界模型将成为下一代自动驾驶系统的核心基座。 特斯拉与理想汽车在顶会现场的实践分享,揭示了这一转型…

    2025年11月8日
    19500
  • 从虚拟生成到真实复刻:如视Argus 1.0如何用空间大模型重构物理世界

    在人工智能领域,世界模型(World Model)近期成为炙手可热的研究方向,多个顶尖实验室相继展示出仅凭单张图片或简短文字描述即可生成交互式3D虚拟世界的惊人演示。这些成果无疑彰显了AI在内容生成方面的巨大潜力,引发行业广泛关注。然而,一个根本性问题随之浮现:这些由模型“想象”出的虚拟世界,其构成元素大多源于数据训练中的模式学习与合成,缺乏对真实物理空间的…

    2025年11月19日
    20800
  • 软硬一体:讯飞星火X1.5引领国产大模型进入物理世界的新纪元

    在人工智能技术飞速发展的今天,全球科技巨头们正围绕云端算法展开激烈竞争。然而,中国科技企业科大讯飞却选择了一条截然不同的道路——通过软硬一体的创新策略,让AI真正走出数据中心,进入复杂的物理世界。这一战略的核心成果,便是基于全国产算力训练的讯飞星火X1.5大模型及其配套的硬件生态系统。 讯飞星火X1.5的发布标志着国产大模型技术的重要突破。该模型基于MoE(…

    2025年11月6日
    29100