AI产业动态
-
从执行到创造:百度伐谋超级智能体如何重塑AI自主优化新范式
在人工智能技术快速迭代的浪潮中,AI正从被动执行指令的工具,向主动探索解决方案的创造者转变。这一变革的核心驱动力,在于智能体技术的突破性进展。近日,百度世界大会上发布的全球首个可商用、自我演化超级智能体——百度伐谋(FM Agent),标志着AI自主优化能力迈入了全新阶段。它不仅是一个技术产品,更是一种颠覆传统问题解决范式的引擎,为复杂工业场景提供了前所未有…
-
InfinityStar:时空金字塔架构革新视频生成,自回归模型挑战DiT主导地位
在人工智能生成内容领域,视频生成技术正经历从扩散模型向自回归架构的范式转移。字节跳动商业化技术团队最新提出的InfinityStar方法,凭借其创新的时空金字塔建模框架,在NeurIPS’25 Oral论文中展示了挑战当前主流Diffusion Transformer(DiT)视频生成方案的潜力。这一突破不仅体现在生成质量上,更关键的是在计算效率方面实现了数…
-
多模态大模型决策机制深度解析:从宏观偏好到微观不确定性
多模态大语言模型(MLLMs)作为人工智能领域的前沿技术,在整合视觉、文本等多种信息源方面展现出卓越能力。然而,当不同模态呈现相互冲突的信息时(例如图像显示蓝色汽车而文本描述为红色),模型如何做出最终决策成为一个关键科学问题。传统研究通常将模型选择与某一模态保持一致的行为称为“模态跟随”,并通过数据集层面的宏观统计数据来衡量。但这种方法存在根本性缺陷:它忽略…
-
搜索革命:从信息检索到AI协同伙伴——深度解析百度猎户座如何重塑人机交互范式
在数字信息爆炸式增长的今天,传统搜索引擎的局限性日益凸显。用户不再满足于简单的关键词匹配和网页链接列表,而是渴望更智能、更人性化的信息获取体验。这一需求推动着搜索技术从“检索工具”向“智能伙伴”的深刻转型。百度最新推出的猎户座系统,正是这一转型浪潮中的标志性产物,它基于多智能体框架,整合了百度25年的搜索技术积累、行业专业能力和MCP服务生态,旨在构建一个能…
-
AI巨头混战升级:从单点突破到生态闭环的战略博弈
近日,全球科技巨头在AI应用领域的竞争态势骤然升级,阿里、谷歌、腾讯相继公布重大战略调整,标志着AI应用竞争已从技术探索阶段进入全面生态布局的实战阶段。这三家企业在同一天内释放的关键信号,看似各自为战,实则共同指向一个核心趋势:AI智能体正成为重构互联网服务生态的关键变量,而争夺端到端用户服务闭环已成为巨头们的共同战略目标。 首先聚焦阿里。据彭博社等多家权威…
-
文心5.0:原生全模态架构如何重塑AI对世界的理解范式
在2025百度世界大会上,文心新一代模型——文心5.0的发布标志着中国AI技术的一次重大突破。这款拥有2.4万亿参数的「原生全模态」模型,从底层架构上实现了深刻的变革,不仅在多模态理解、指令遵循、创意写作等40多个核心赛道表现惊艳,更在AI如何「理解世界」这一根本问题上提出了新的解决方案。 与业内主流的多模态AI不同,文心5.0的核心创新在于其「原生全模态」…
-
ICLR 2026评审危机:投稿量激增与质量滑坡背后的学术生态反思
国际表征学习大会(ICLR)2026年的评审结果近日公布,数据显示投稿量从2025年的11672篇暴增至19631篇,创下历史新高。然而,与数量增长形成鲜明对比的是论文质量的显著下滑:平均分从5.12跌至4.20,最高分也从10分降至8.5分。这一现象引发了学术界对当前AI研究生态的广泛关注与深刻反思。 从统计层面看,ICLR 2026的评分分布呈现出明显的…
-
情感AI的黎明:从理性计算到共情理解的范式转移
在人工智能技术飞速发展的当下,一个引人深思的转折点正在浮现:当模型的计算能力已接近人类认知的某些层面时,我们是否应该让它们更进一步——从纯粹的理性推理走向情感理解?这一问题的答案,或许正隐藏在Eric Zelikman离开xAI、创立Humans&的决策背后。这不仅是一位研究者的职业选择,更预示着AI产业可能迎来一次从“智能”到“智慧”的深刻变革。 …
-
文心5.0原生全模态架构深度解析:统一架构如何重塑多模态AI边界
百度文心5.0的正式发布,标志着国产大模型在原生全模态技术路线上迈出了关键一步。这一代模型的核心突破在于其“原生统一”的设计理念——从训练伊始就将语言、图像、视频、音频等多模态数据置于同一套自回归统一架构中进行联合学习,而非传统多模态模型中常见的后期特征拼接模式。这种技术路径的选择,不仅解决了跨模态语义对齐的固有难题,更在多模态理解与生成的协同效率上实现了质…
-
DemoHLM:单次演示生成海量数据,破解人形机器人移动操作三大难题
近日,北京大学与BeingBeyond的研究团队联合提出了DemoHLM框架,为人形机器人移动操作领域带来了突破性进展。该框架仅需在仿真环境中采集一次人类演示,即可自动生成海量训练数据,实现真实人形机器人在多任务场景下的泛化操作,有效解决了传统方法依赖硬编码、真实数据成本高昂、跨场景泛化能力差的核心痛点。 移动操作作为人形机器人融入人类环境的核心能力,长期面…
