-
纳德拉深度访谈:Office转型基础设施、AI泡沫检验标准、量子计算与AI融合前景
二月底,微软的日程格外紧凑。 公司首席执行官萨提亚·纳德拉亲赴德国,主持近期正在进行的“Microsoft AI Tour 2026”大型人工智能巡演活动。在此期间,他接受了德国知名播客OMR主持人菲利普·韦斯特迈尔的邀请,进行了一场信息密度极高的对话。虽然时长不足二十分钟,但对话触及了AI领域当前最为关键和备受关注的诸多议题。 作为OpenAI的早期投资者…
-
AI大模型2月重磅更新盘点:阿里、阶跃星辰、智谱AI等巨头竞相发布,编程、视频、文档处理全面突破
2月1日 【开源】阿里通义千问发布 Qwen3-Coder-Next 阿里发布了编程智能体模型 Qwen3-Coder-Next。该模型采用总参数为 800 亿的混合专家架构,每次推理仅激活 30 亿参数。在 SWE-Bench Verified 测试中,其问题解决率超过 70%,在保证高性能的同时有效控制了算力成本,适合对算力敏感的本地化开发场景。 技术博…
-
MCP安全警示:潜伏在AI Agent中的15个隐形威胁与防护指南
MCP 安全警示:潜伏在 AI Agent 中的 15 个隐形威胁与防护指南(第一部分) 你为 AI Agent 安装了一个 MCP Server,使其能够获取邮件。起初一切运行正常。 几个月后,一次常规更新悄然发生。表面看来并无异样。但你无从知晓的是,你的 API 密钥已被悄然转发至他处。 你没有察觉。你的 Agent 也没有察觉。一切功能照常运转。 这个…
-
Context Mode:开源神器为AI开发节省98%上下文token,让工具调用不再“吃掉”你的工作空间
在使用 Claude Code 的 MCP 工具时,你是否遇到过上下文窗口被快速消耗的问题?例如,一个 Playwright 快照会消耗 56KB,20 个 GitHub 问题消耗 59KB,500 条访问日志消耗 45KB。短短 30 分钟,高达 40% 的上下文空间就可能被占用。 针对这一问题,有开发者提出了一个名为 Context Mode 的开源解决…
-
英伟达财报深度解析:2026年AI算力万亿市场,数据中心业务占比超88%引领增长
2026年AI算力市场的竞争格局与增长轨迹,与英伟达的战略动向紧密相连。从2025财年财报的超预期表现,到2026财年的强劲业绩指引,再到管理层对远期芯片收入预期的上调,英伟达不仅以财务数据验证了全球AI算力需求的持续性与韧性,更通过其技术路线与业务布局,揭示了万亿级市场的未来轮廓。 本文将以英伟达2025财年财报为核心切入点,系统分析其各业务板块表现,解读…
-
RL驱动的KV缓存压缩框架KV Policy:超越启发式策略SOTA性能,仅增1%预填充计算开销
关键词:大语言模型、KV 缓存、强化学习、缓存驱逐、长上下文推理 自 Transformer 架构诞生以来,大型语言模型(LLMs)在自然语言处理领域取得了革命性进展。从文本生成到逻辑推理,从多轮对话到长文档理解,LLMs 的能力边界不断拓展。然而,模型性能的飞跃背后,是日益严峻的推理效率挑战——当处理长序列或交互式会话时,KV(Key-Value)缓存成为…
-
阿里Qwen3.5-27B深度评测:理科思维突出,文档处理与逻辑推理是亮点,艺术创作待提升
阿里近期推出了Qwen3.5-27B模型,作为Qwen3.5系列中的中型主力版本,它定位为一款兼顾高性价比与密集推理需求的开源模型。其实际性能表现如何?以下是本次评测的核心结论。 核心结论: 三大亮点: OCR与文档理解能力出色: 在纯文本提取、复杂表格结构还原及合并单元格识别等任务中表现精准,效果优于部分更大参数的模型。 空间逻辑与数学推理能力强: 在立体…
-
让搜索Agent不「傻等」:人大团队依托扩散模型实现「一心二用」,边等搜索结果边思考,加速15%性能不减
当前主流的搜索智能体(Agent)普遍存在一个效率瓶颈:其执行流程是严格串行的。以广泛采用的ReAct框架为例,其模式为 “思考→调用工具→等待结果→再思考……” 。在这种模式下,模型在等待搜索引擎返回结果时完全处于空闲状态,造成了大量的时间浪费。多轮交互中,延迟不断累积,严重影响了用户体验。 研究团队通过分析发现,在多跳问答等复杂任务中,这种“干等”的串行…
-
对话九合王啸:90%具身智能公司没未来,市场名额只有三五家
2026年初,具身智能赛道再度涌入大量资本。 在喧嚣的资本浪潮中,能够做出专业判断、锚定长期趋势的投资人屈指可数,王啸是其中之一。 在人工智能尚未成为风口的十余年前,他便带领九合创投布局AI相关领域。当大模型底层框架还未成为行业焦点时,他投资了一流科技,其研发的OneFlow后来成为世界首个面向大模型大数据的人工智能计算框架。在具身智能仍是创投圈小众话题时,…
-
GPT之父Alec Radford颠覆性研究:用Token级「脑部手术」切除大模型危险知识,重学成本暴增7000倍
Alec Radford,出生于1993年,是人工智能领域具有开创性贡献的研究者。作为GPT、GPT-2和CLIP等里程碑模型的第一作者,并深度参与了GPT-3、GPT-4及PPO算法等关键项目,其工作已获得超过32万次学术引用。 近日,他与Anthropic及斯坦福大学的研究者Neil Rathi联合发表了一项新研究,挑战了当前大模型安全领域的一个核心范式…