低延迟 - 鲸林向海

谷歌AI教父Jeff Dean预言：未来工程师将管理50个智能体实习生，写需求比写代码更重要

Jeff Dean预言：未来工程师将管理50个智能体，写需求比写代码更重要谷歌首席AI科学家、传奇工程师Jeff Dean在最新访谈中提出了一个引人注目的预言：未来每位工程师可能会管理多达50个智能体实习生，以并行处理大量任务，且沟通效率将超越人类协作。他同时指出，未来最重要的技能将是“清晰地定义需求”，因为智能体的输出质量完全取决于人类如何描述和限定问…

2026年3月10日

302000

AI产业动态

TileRT v0.1.3 发布：GLM-5 支持上线，推理速度高达 600 tokens/s，引领千亿模型毫秒级响应新时代

关键词： TileRT、大语言模型、推理引擎、低延迟、编译器副标题： 600 tokens/s！TileRT 让千亿参数模型推理进入毫秒时代 TileRT v0.1.3 是一次里程碑式的发布，标志着 TileRT 从仅支持 DeepSeek-V3.2 单一模型扩展为多模型架构支持。本版本新增了对最新 GLM-5 模型的完整推理支持，并在 8× NVIDIA…

2026年2月14日

1.0K000

AI产业动态

Cursor 2.0 正式发布：自研模型 Composer 与多智能体协作界面同步上线

Cursor 2.0 正式发布，推出自研编码模型 Composer 及多智能体并行协作界面。Composer 在编码智能上达到前沿水平，生成速度达每秒 250 个 token，为同类模型的四倍，支持低延迟交互式编程。新版本界面以智能体为中心，支持多任务并行处理，并优化了代码评审与测试流程。此次更新标志着 Cursor 从依赖第三方模型的“AI 外壳”转型为“AI 原生平台”。

2025年10月30日

1.3K000