AI产业动态

  • 英伟达DreamZero:140亿参数世界动作模型开启机器人零样本泛化新时代

    驱动具身智能迈向通用领域的核心挑战是什么? 我们认为,关键在于实现“跨具身迁移”。 一个完善的世界模型是具身智能执行通用复杂任务的基础。然而,许多现有的世界模型并不具备我们所期望的强大泛化与迁移能力。 具体而言,当前应用于机器人或智能汽车的世界模型,大多针对特定硬件平台进行设计和训练,其泛化能力有限,跨平台迁移往往依赖运气。 本质上,许多机器人学习到的并非“…

    2026年2月9日
    13300
  • CMU开源首个Agentic Search行为日志数据集:揭秘1400万条搜索请求背后的智能体行为模式

    在大模型驱动的 Agentic Search 日益常态化的背景下,真实环境中智能体“如何发起查询、如何改写问题、是否真正利用了检索信息”一直缺乏系统性的刻画与分析。 卡内基梅隆大学(CMU)的研究团队基于可重复检索平台 DeepResearchGym,从其统一后端半年的真实流量中整理出超过 1400 万条搜索请求,涉及约 400 万个搜索会话。在完成严格的匿…

    2026年2月9日
    8100
  • AI安全前沿:因果推理与稀疏自编码器驱动的LLM越狱攻击突破

    本期关注2026年2月9日arXiv上发布的AI安全前沿研究,核心内容如下: 🤖 CFA2框架利用因果推理和稀疏自编码器实现对LLMs的高成功率、低复杂度越狱攻击。 – Causal Front-Door Adjustment for Robust Jailbreak Attacks on LLMs (http://arxiv.org/pdf/2…

    2026年2月9日
    39400
  • 2026智算时代:GPU、AI服务器与算力架构的协同革命

    2026年,随着“东数西算”工程的深化落地、智算中心的规模化部署以及大模型技术的持续迭代,算力已成为驱动数字经济发展的核心生产要素。GPU作为释放算力的核心引擎,AI服务器作为承载算力的核心硬件,三者深度协同,共同支撑起人工智能、高性能计算(HPC)、智能制造等各类高算力需求场景。 本文基于2026年的行业现状,结合最新技术规格与市场数据,系统性地拆解算力、…

    2026年2月9日
    27700
  • 何恺明团队颠覆生成模型范式:漂移模型实现单步推理,告别迭代训练

    训练生成模型是一项复杂的任务。 从底层逻辑看,生成模型是一个逐步拟合的过程。与常见的判别模型不同,判别模型关注将单个样本映射到对应标签,而生成模型则关注从一个分布映射到另一个分布。 以大家熟悉的扩散模型为例,扩散模型及其基于流的对应方法,通常通过微分方程(随机微分方程 SDE 或常微分方程 ODE)来刻画从噪声到数据的映射。然而,训练扩散模型耗时费力,其核心…

    2026年2月8日
    10400
  • LLM重构数据准备:从规则驱动到语义驱动的范式革命

    在企业级系统中,数据团队普遍面临一个困境:模型迭代飞速,但数据准备的「老旧管道」却愈发沉重。清洗、对齐、标注……这些工作依然深陷于人工规则与专家经验的泥潭。 数据格式五花八门:正则表达式越写越多,却总有意想不到的「脏数据」出现。 跨系统表结构不一致:对齐逻辑复杂,人工映射耗时耗力。 海量数据缺少标签和语义描述:分析师「看不懂、用不好」。 这背后是数据准备这一…

    2026年2月8日
    10000
  • 扩散语言模型:从架构挑战到推理优化的深度探索

    ★ 原文链接:https://zhuanlan.zhihu.com/p/1998418717743289472 作者:王云鹤 在思考这一主题时,我首先回想起多年前一位前辈提出的问题:Transformer的下一代范式是什么? 我当时认为,Transformer是长期技术积累从量变到质变的成果,其思想(如Non-local模块)在早期视觉研究中已有体现,而卷积…

    2026年2月8日
    11000
  • IntelliFold 2:超越AlphaFold 3,开源生物基石模型树立生成式科学智能新标杆

    在生成式人工智能(GenAI)推动的“生成式科学智能”浪潮中,生物基石模型因其对生命科学的深远影响而备受瞩目。生命语言(如序列、结构)与人类语言具有相似的序列化特征,但其背后遵循着严苛的物理约束与生物演化逻辑,长期以来难以被完全解析。正因其对人类社会生产与生活的关键作用,生物基石模型被视为该领域“皇冠上的明珠”。 生物基石模型的核心价值,在于能够借助Tran…

    2026年2月8日
    9500
  • AionUi:本地开源AI协作平台,图形化整合Claude Code、Gemini CLI等多模型命令行工具

    AionUi 在 GitHub 上已经获得 12K 的 Star。 它是一个本地、免费、开源的 AI 协作平台,对标 Anthropic 的 Cowork,但完全本地可部署、免费开源。 AionUi 并非简单的浏览器聊天界面,而是一个系统级的 AI 协作工具。 其核心是为 Claude Code、Gemini CLI 等命令行 AI 智能体提供了一层统一的图…

    2026年2月7日
    22900
  • 基础设施配置如何让Agent评测分数波动6%:Anthropic揭示基准测试的隐藏变量

    摘要 :Anthropic发现,Agent编程评测中的基础设施配置差异可以导致数个百分点的分数波动——有时甚至超过排行榜上顶尖模型之间的差距。这篇文章详细分析了资源配置如何影响评测结果,并给出了具体建议。 问题的发现 SWE-bench和Terminal-Bench等Agent编程基准测试被广泛用于比较前沿模型的软件工程能力——排行榜上的顶尖位置往往只相差几…

    2026年2月7日
    12400