实时交互

  • 蚂蚁开源LingBot-World世界模型:挑战谷歌Genie 3,一张图生成10分钟稳定交互视频

    蚂蚁开源世界模型,为机器人造“元宇宙训练场”。 智东西1月29日报道,蚂蚁灵波科技发布并开源了世界模型LingBot-World。该模型是一个专为交互式世界模型设计的开源框架。其核心LingBot-World-Base能够提供高保真、可控制且逻辑一致的模拟环境。 ▲LingBot-World开源页面(来源:Hugging Face) LingBot-Worl…

    4天前
    1300
  • 蚂蚁灵波开源世界模型LingBot-World:支持10分钟实时交互,媲美Genie 3

    蚂蚁灵波开源通用世界模型LingBot-World:支持10分钟实时交互,媲美Genie 3 在连续开源机器人的眼睛(LingBot-Depth)与大脑(LingBot-VLA)之后,蚂蚁灵波(Ant LingBot)团队再次发布了一项重要成果: 通用的世界模型——LingBot-World。 该模型能够支持长达10分钟的持续生成与实时交互。其视觉效果已可与…

    4天前
    2200
  • 对话式AI的情感革命:从文字交互到实时陪伴的万亿产业跃迁

    在人工智能技术快速演进的今天,一段小女孩与AI玩具告别的视频引发了广泛的社会讨论。这看似简单的场景背后,实则揭示了对话式AI技术正在突破传统交互边界,悄然融入人类情感世界的深层变革。当AI不再仅仅是冰冷的工具,而是能够承载情感连接的伙伴时,我们正站在人机关系重塑的历史节点上。 传统AI交互大多停留在“短信时代”的异步模式:用户输入问题,AI输出文字回复。这种…

    2025年11月5日
    7400
  • 美团LongCat-Flash-Omni:全模态实时交互开源模型的架构突破与产业影响

    在AI模型竞争日趋白热化的当下,美团最新开源的LongCat-Flash-Omni模型以“全模态实时交互”为核心卖点,不仅刷新了开源多模态模型的性能基准,更在架构设计层面展现了独特的技术路径。这款总参数560B、激活参数仅27B的MoE架构模型,成功实现了多模态能力与推理效率的平衡,标志着开源大模型在实用化道路上迈出了关键一步。 从性能表现来看,LongCa…

    2025年11月3日
    8300