AI产业动态

英伟达DreamZero：140亿参数世界动作模型开启机器人零样本泛化新时代

驱动具身智能迈向通用领域的核心挑战是什么？我们认为，关键在于实现“跨具身迁移”。一个完善的世界模型是具身智能执行通用复杂任务的基础。然而，许多现有的世界模型并不具备我们所期望的强大泛化与迁移能力。具体而言，当前应用于机器人或智能汽车的世界模型，大多针对特定硬件平台进行设计和训练，其泛化能力有限，跨平台迁移往往依赖运气。本质上，许多机器人学习到的并非“…

2026年2月9日

133000

AI产业动态

CMU开源首个Agentic Search行为日志数据集：揭秘1400万条搜索请求背后的智能体行为模式

在大模型驱动的 Agentic Search 日益常态化的背景下，真实环境中智能体“如何发起查询、如何改写问题、是否真正利用了检索信息”一直缺乏系统性的刻画与分析。卡内基梅隆大学（CMU）的研究团队基于可重复检索平台 DeepResearchGym，从其统一后端半年的真实流量中整理出超过 1400 万条搜索请求，涉及约 400 万个搜索会话。在完成严格的匿…

2026年2月9日

81000

AI产业动态

AI安全前沿：因果推理与稀疏自编码器驱动的LLM越狱攻击突破

本期关注2026年2月9日arXiv上发布的AI安全前沿研究，核心内容如下： 🤖 CFA2框架利用因果推理和稀疏自编码器实现对LLMs的高成功率、低复杂度越狱攻击。 – Causal Front-Door Adjustment for Robust Jailbreak Attacks on LLMs (http://arxiv.org/pdf/2…

2026年2月9日

394000

AI产业动态

2026智算时代：GPU、AI服务器与算力架构的协同革命

2026年，随着“东数西算”工程的深化落地、智算中心的规模化部署以及大模型技术的持续迭代，算力已成为驱动数字经济发展的核心生产要素。GPU作为释放算力的核心引擎，AI服务器作为承载算力的核心硬件，三者深度协同，共同支撑起人工智能、高性能计算（HPC）、智能制造等各类高算力需求场景。本文基于2026年的行业现状，结合最新技术规格与市场数据，系统性地拆解算力、…

2026年2月9日

277000

AI产业动态

何恺明团队颠覆生成模型范式：漂移模型实现单步推理，告别迭代训练

训练生成模型是一项复杂的任务。从底层逻辑看，生成模型是一个逐步拟合的过程。与常见的判别模型不同，判别模型关注将单个样本映射到对应标签，而生成模型则关注从一个分布映射到另一个分布。以大家熟悉的扩散模型为例，扩散模型及其基于流的对应方法，通常通过微分方程（随机微分方程 SDE 或常微分方程 ODE）来刻画从噪声到数据的映射。然而，训练扩散模型耗时费力，其核心…

2026年2月8日

104000

AI产业动态

LLM重构数据准备：从规则驱动到语义驱动的范式革命

在企业级系统中，数据团队普遍面临一个困境：模型迭代飞速，但数据准备的「老旧管道」却愈发沉重。清洗、对齐、标注……这些工作依然深陷于人工规则与专家经验的泥潭。数据格式五花八门：正则表达式越写越多，却总有意想不到的「脏数据」出现。跨系统表结构不一致：对齐逻辑复杂，人工映射耗时耗力。海量数据缺少标签和语义描述：分析师「看不懂、用不好」。这背后是数据准备这一…

2026年2月8日

100000

AI产业动态

扩散语言模型：从架构挑战到推理优化的深度探索

★ 原文链接：https://zhuanlan.zhihu.com/p/1998418717743289472 作者：王云鹤在思考这一主题时，我首先回想起多年前一位前辈提出的问题：Transformer的下一代范式是什么？我当时认为，Transformer是长期技术积累从量变到质变的成果，其思想（如Non-local模块）在早期视觉研究中已有体现，而卷积…

2026年2月8日

110000

AI产业动态

IntelliFold 2：超越AlphaFold 3，开源生物基石模型树立生成式科学智能新标杆

在生成式人工智能（GenAI）推动的“生成式科学智能”浪潮中，生物基石模型因其对生命科学的深远影响而备受瞩目。生命语言（如序列、结构）与人类语言具有相似的序列化特征，但其背后遵循着严苛的物理约束与生物演化逻辑，长期以来难以被完全解析。正因其对人类社会生产与生活的关键作用，生物基石模型被视为该领域“皇冠上的明珠”。生物基石模型的核心价值，在于能够借助Tran…

2026年2月8日

95000

AI产业动态

AionUi：本地开源AI协作平台，图形化整合Claude Code、Gemini CLI等多模型命令行工具

AionUi 在 GitHub 上已经获得 12K 的 Star。它是一个本地、免费、开源的 AI 协作平台，对标 Anthropic 的 Cowork，但完全本地可部署、免费开源。 AionUi 并非简单的浏览器聊天界面，而是一个系统级的 AI 协作工具。其核心是为 Claude Code、Gemini CLI 等命令行 AI 智能体提供了一层统一的图…

2026年2月7日

229000

AI产业动态

基础设施配置如何让Agent评测分数波动6%：Anthropic揭示基准测试的隐藏变量

摘要：Anthropic发现，Agent编程评测中的基础设施配置差异可以导致数个百分点的分数波动——有时甚至超过排行榜上顶尖模型之间的差距。这篇文章详细分析了资源配置如何影响评测结果，并给出了具体建议。问题的发现 SWE-bench和Terminal-Bench等Agent编程基准测试被广泛用于比较前沿模型的软件工程能力——排行榜上的顶尖位置往往只相差几…

2026年2月7日

124000