AI前沿速递:美团LongCat与Moonshot Kimi-K2引领多模态与思考模型新突破

AI前沿速递:美团LongCat与Moonshot Kimi-K2引领多模态与思考模型新突破

11月3日

【开源】 美团发布 LongCat-Flash-Omni-FP8,这是一个拥有 5600 亿参数(激活 270 亿)的开源全模态模型,专精于实时音视频交互。该模型采用高性能捷径连接混合专家(MoE)架构,并整合了零计算专家、高效的多模态感知模块与语音重建模块。通过课程启发式渐进训练策略,它在保持强大单模态能力的同时,实现了全面的多模态理解与生成能力。

11月7日

【开源】 Moonshot 发布 Kimi-K2-Thinking,这是其最新、最强大的开源思考模型版本。该模型被构建为一个能够在动态调用工具的同时进行逐步推理的思考代理,在“人类最后的考试”(HLE)、BrowseComp 等多项基准测试中树立了新的技术水平。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/14645

(0)
上一篇 2025年11月10日 下午12:26
下一篇 2025年11月10日 下午12:50

相关推荐

  • 马斯克发布Terafab项目:年产1太瓦算力,SpaceX与Tesla联手迈向星际文明

    北京时间上午8点,埃隆·马斯克在社交平台X上预告,将直播正式发布由其旗下SpaceX和特斯拉共同推进的“Terafab”项目。 该项目的核心目标是实现每年生产超过1太瓦(Terawatt,即10¹²瓦,一万亿瓦)的计算能力,涵盖逻辑芯片、内存芯片及先进封装。根据规划,其中约80%的算力将部署于太空,剩余约20%用于地面。 1太瓦的规模意味着什么?作为对比,2…

    2026年3月23日
    31900
  • 记忆湖MemoryLake:AI第二大脑的规模化实践,引领企业智能决策新纪元

    田晏林 发自 凹非寺 量子位 | 公众号 QbitAI “Your brain is for having ideas, not holding them. ”——Tiago Forte《Building a Second Brain》 LLM是AI的“第一大脑”,记忆平台是AI的“第二大脑”。 畅销书作者Tiago Forte在《构建第二大脑》中曾分享核心…

    2026年2月5日
    37200
  • 循环语言模型Ouro:在预训练中构建推理能力的新范式

    在人工智能领域,大型语言模型(LLM)的发展正面临一个关键瓶颈:传统的训练范式通常将复杂的推理能力留待微调阶段培养,而未能充分利用预训练数据中的潜在逻辑结构。这种分离不仅限制了模型在基础阶段的认知深度,也增加了后期优化的成本和不确定性。近日,字节Seed团队联合多家研究机构推出的Ouro(循环语言模型,LoopLM),通过创新的架构设计和训练策略,成功将推理…

    2025年11月4日
    44500
  • 英伟达GTC 2026:黄仁勋揭示万亿美元蓝图,Vera Rubin系统重塑AI算力格局

    英伟达GTC 2026大会以一种不同寻常的方式开场——首席执行官黄仁勋迟到了15分钟。这场盛会汇聚了450家赞助企业、1000场技术分会、2000位演讲者以及110台机器人,其规模已远超一场普通的技术会议,更像是全球AI行业的年度朝圣。 舞台中央,身着标志性皮衣的黄仁勋,被赋予了新的称号——“Token之王”。 在本次主题演讲中,他并未急于发布新品,而是用整…

    2026年3月17日
    71200
  • LangChain创始人深度解析:AI智能体沙盒架构的两种核心模式与安全实践

    AI智能体需要执行代码、安装软件包、访问文件,这些操作必须在与主机系统隔离的工作空间中进行,以防止访问敏感凭证、文件或网络资源。沙盒提供了这种必要的隔离。 LangChain创始人Harrison Chase近期分析了AI智能体与沙盒集成的架构问题,指出目前存在两种核心架构模式:智能体在沙盒内运行,或者智能体在外部运行、将沙盒作为工具调用。 模式一:智能体在…

    2026年2月11日
    97800