KV Cache

智谱Scaling Pain揭秘：高负载下的隐形Bug与避坑指南

Scaling即正义？智谱对此只能无奈摇头——过程极其痛苦，压力山大。智谱最新发布的一篇技术博客画风突变，不再一味输出硬核技术，而是大倒苦水，详细披露了从GLM-5以来遭遇的各种奇葩踩坑经历，官方将其称为「Scaling Pain」。我们的推理基础设施正承受着前所未有的压力，每天需处理数亿次Coding Agent调用。过去几周，部分用户在使用GLM…

2026年5月2日

207000

大模型推理

DeepSeek新框架DualPath：用闲置网卡加速智能体推理，突破I/O瓶颈实现近2倍性能提升

DeepSeek新框架DualPath：用闲置网卡加速智能体推理，突破I/O瓶颈实现近2倍性能提升当业界普遍关注DeepSeek下一代模型V4的进展时，其研究团队与北京大学、清华大学的研究人员在ArXiv上联合发表了一篇论文，提出了一个全新的智能体推理框架：DualPath。该框架旨在解决智能体长文本推理场景中的关键I/O瓶颈问题。其核心创新在于优化从外…

2026年2月27日

356000

大模型推理

DeepSeek联手清北发布DualPath框架：用闲置网卡打破Agent推理瓶颈，性能提升近2倍

DeepSeek 联合北大清华发布 DualPath 框架：利用闲置网卡突破 Agent 推理 I/O 瓶颈，性能提升近 2 倍当业界广泛关注 DeepSeek 的 GitHub 仓库，期待其下一代模型发布时，DeepSeek 与北京大学、清华大学的研究团队在 arXiv 上悄然发布了一篇论文，提出了一个全新的智能体推理框架：DualPath。该框架的核…

2026年2月27日

361000

AI产业动态

华为MindScale算法架构升级：行业Agent实现工作流自进化与提示词自动化，KV Cache优化提升5.7倍效率

华为MindScale算法架构升级：行业Agent实现工作流自进化与提示词自动化，KV Cache优化提升5.7倍效率在大模型的多种应用形态中，执行专业功能的行业Agent，无疑是提升生产效率、实现价值创造的利器。然而，千行百业包含着大量的私域知识、专家经验和工具使用逻辑，使得智能体的行业应用构建存在各类门槛。为了提升开发效率，业界提出了诸如Skill…

2026年2月12日

310000