Agent Infra：驾驭不确定性，开启智能体工程化落地新纪元

毋庸置疑，2025年堪称「Agent元年」。

从年初到年末，Agent的热度持续攀升——从Manus到近期的豆包手机，Agent已成为全行业关注的焦点。回顾这一年，也是Agent从技术萌芽走向工程化落地的关键一年。

为此，量子位邀请到两位行业专家——Dify开源生态负责人郑立与腾讯云云原生产品副总经理于广游，共同探讨Agent落地过程中的挑战、机遇与未来。核心观点包括：

Agent的发展正从年初硅谷的宏大叙事，转向充满务实精神的落地探索。
行业认可Agent，关键在于其能真正解决问题、创造价值。
Agent的真正落地，需要依靠确定性的工程方法来驾驭其不确定性的复杂系统本质。
Agent Infra旨在解决企业面临的偶然复杂度问题，而非本质复杂度。
对于中小公司或个人开发者而言，最大的门槛有时并非技术，而是迈出第一步的勇气。

两位嘉宾给出了一个高度一致的判断：

在智能体落地过程中，Agent Infra是关键一环。

接下来，让我们跟随对话，深入了解他们的见解。

回顾Agent元年：从技术探索到工程实践

量子位：首先从Agent这个概念聊起。站在年末这个时间点，二位如何总结这一年Agent的整体发展？

于广游：我最大的感受是，Agent在今年已经从技术萌芽期，进入了真正的工程化落地阶段。我观察到三种标志性的实践：

面向企业内部的Agent：例如Dify这类产品，通过提供确定性的框架和工具，帮助企业驾驭Agent的不确定性，实现内部效率的提升。
面向大众的Agent：如Manus和豆包，它们以新的交互形态激发了用户对Agent的广泛想象和兴趣。
新范式Agent：像Claude Code这样的产品，通过强化学习（RL）和工具调用，显著拓宽了Agent自身的能力边界。

我个人印象最深的应用是AI代码工具。它不再局限于解决代码问题，正逐渐成为Agent连接与操作现实世界的通用接口。其次，AI代码工具切实改变了软件工程范式。在我们内部，也进行了从AI Coding到AISE（AI软件工程师）的全面调整，涉及研发模式、组织管理和角色职责等方面。

郑立：这一年Agent的发展，我能感受到“大传统”与“小传统”之间鲜明的张力。

“大传统”源自硅谷的宏大叙事，许诺用全自动智能体取代白领，逻辑完美但落地时易水土不服。“小传统”则充满烟火气，例如义乌商家用AI自动回复客户，或独立开发者利用工作流进行代码评审。

总结来说，这是趣味盎然且走向务实的一年。年初，一个简单的Demo就能吸引资本关注，可类比为“立法阶段”；年末，我们则进入了“司法阶段”，开始处理具体、琐碎的执行层面问题。这种进步并非线性，更像是根茎状的蔓延。

我们看到秩序的逐步建立，并非完全依赖基座模型的升级，更多是依靠那些“胶水”技术——如产品工程、提示词工程、RAG、Pipeline和工具调用等。它们或许不够优雅，却能有效维持数字社会的运转。

量子位：正如两位所说，从年初的Demo惊艳到年末的工程化，进程非常快。Agent为何能如此迅速地成为行业共识？

于广游：首要原因在于它能够真正解决问题。过去的生产力工具主要延伸人类的手脚，但工作中存在大量无法通过精确语言或编程描述的任务，这正是Agent的用武之地。

其次，是落地过程中对工程方法的探索。今年，一系列工程方法快速成型，包括Agent Infra、Agent Runtime、不同的Agent架构范式、内容工程等，这些技术切实推动了Agent的落地。

郑立：我基本认同。在我看来，这种共识也反映了资本在寻求新的组织方式。互联网时代的红利已见顶，App的边际效用递减。而Agent承诺的是交互成本的坍塌，体现了权力从“指令式计算”向“异度式计算”的转移。

量子位：两位都提到了关键词的变化，例如从AI Infra到Agent Infra。Agent落地与传统的AI落地有哪些核心区别？在工作流和Infra需求上有何差异？

郑立：范式转移非常明显。我们从传统的、基于if/else的确定性逻辑判断，转向了Agent基于概率的目标规划。

过去，机器必须严格执行下一行代码；现在，开发者更像老师，通过Prompt、RAG和原则设定，赋予模型自由处理的空间。

核心区别在于引入了大量不确定性。在传统软件工程中，Bug是对既定规则的违反；而在Agent工程中，失败往往是对意图的误解或概率上的漂移。我们无法像修复Bug一样直接“修复”Agent，而需要像教育孩子一样去约束或引导它。

这不仅是工作流的变化，也是交付物的变化。以前我们交付确定的功能，现在交付的是一种概率性的能力，很难用绝对的正确与否来定义。

于广游：是的，不确定性非常关键。我们内部观察认为，Agent是一个不确定性的复杂系统。

首先，Agent的效果通常由多个因素共同决定（如模型本身、架构范式、Prompt、内容、工具选择和参数等），这些子部件相互影响，关系复杂，因此Agent本身是一个复杂系统。

其次，对于同一问题，在不同时间输入，Agent的输出也可能不同，这就是其不确定性。这与传统的确定性微服务系统截然不同。

因此，工程师的工作方式需要两点思维转变：

1. 从工程思维转向科学实验思维：不能仅依赖预先规划，而需建立评测体系，将环环相扣的复杂系统分解为子系统，通过控制变量进行科学实验，逐步驾驭Agent。

2. 从Day One思维转向Day Two思维：过去，Day One代表代码上线并提供服务；现在，Day One仅代表Agent能运行，效果的持续优化（Day Two）才是真正的开始。

所以，Agent落地不能仅靠几个巧妙范式，而需要通过确定性的工程方法，循序渐进地驾驭不确定性的复杂系统，这将带来基础设施（Infra）的重塑。

智能体落地：Agent Infra是关键一环

量子位：于老师提到了工具和Infra的重塑。从基础设施角度，腾讯云为加速Agent落地提供了哪些具体支持？

于广游：如前所述，Agent是不确定性的复杂系统。上线时，我们首先要解决的最大问题是其自主运行可能带来的破坏性风险。

因此，我们团队选择“从后往前”解决问题。首先解决Agent的安全问题，我们在Agent Infra中推出了Agent安全沙箱，为Agent提供独立的执行环境，隔离风险。

接着，我们着手驾驭Agent的不确定性和复杂性，为此提供了一系列可观测性工具与评估工具。

再进一步，我们聚焦于效果的持续提升，优化Agent的记忆与学习能力。例如，腾讯云“元宝”已进入这一阶段。在积累相关经验后，我们也会将相应的能力以服务形式提供。

量子位：您提到的Agent Runtime、安全沙箱等Infra产品，与市面上各类Agent平台之间是什么关系？腾讯云Infra当前重点关注哪些方向？

于广游：首先我们要厘清一个概念——Agent Infra到底是什么。我们可以先把企业问题划分为本质复杂度和偶然复杂度两种，前者是必须要解决的问题，后者会随着工具和方法选择存在一定的偶然性。

因此，Infra层其实就是解决企业在问题处理过程中遇到的偶然复杂问题。但这个问题并非一成不变，对于不同的场景，要面临的偶然复杂度完全不同，具体要解决什么也要视情况而定。

不过无论解决什么问题，这里都有一个共性问题，这也是我们团队正在做的，就是去构建偶然复杂度问题的最大公共子集，包括：安全、执行环境、工具、记忆和观测。

而这些问题或多或少都有解决方案，其中我们认为最突出的一个问题就是Agent的自主运行。

所以我们团队做的安全沙箱，并不是简单的隔离环境，而是一个多层次、全链路的Agent运行安全体系。

郑立：就我们自身而言，核心模块还是选择自研。我们认为如果使用第三方组件，势必会导致核心组件不可控、给用户的服务质量无法保证。其它的部分，我们会选择一些合适的开源或闭源方案。

对于开源，我们的看法是：AI时代的基础模型可以是黑箱，但Infra必须是白箱。因为开发者需要看到底层代码，以了解Agent的行为逻辑。而且我们观察到，初创公司和创新者往往会选择开源，因为这能提供低成本和灵活性。

相反，那些大企业则更倾向于选择开源的商业版本或闭源版本，因为闭源实际上为大企业提供了责任转移与兜底服务。

于广游：根据我们接触用户的经验，他们在选择Agent Infra产品时，首先对核心的业务逻辑层，用户还是在意它是否开源，因为这样他们就可以围绕自己的业务进行任意修改，也会感觉更透明、更可控。

具体到Infra层上，用户更在意体验是否极致、能否降低开发成本。而在实际使用时，用户就更在意Agent的稳定性和效率。在这种情况下，我觉得闭源有非常好的优势。

郑立：对于开发者而言，这种简化其实是非常激进的。它会将基础设施的认知负荷降到最低，然后你就可以把全部精力集中在Prompt和数据治理上。这其实会让我们逼近AI开发的Excel时刻。

于广游：我补充一下，我们腾讯云的Infra产品更偏向于专业开发者，他们会有非常多的复杂度问题需要治理。所以我们主要还是面向Agent原生企业和AI原生企业，去帮助他们加速Agent落地过程。

于广游：关于技术趋势，我还是想提AI Coding，我对这个事情印象非常深刻。

过去一年里，我能看到代码不仅是大模型抽象能力的来源，也正在成为Agent驾驭不确定性、连接世界的工具。以AI Coding为例，它带来的是开发模式的颠覆性改变，能够让我们团队里的每一个开发者，在分钟级就能拉起一个独立的全套开发环境。我认为任何一个工程师或Agent从业者，都绝不能小觑Coding的影响。

郑立：就我们而言，过去一年的技术进展主要集中在补齐短板。我们也看到一个比较清晰的趋势，就是技术正在从开发者向非开发者移动。

郑立：如果要用三个词来概括Agent Infra为何是智能体落地应用的关键环节，我认为是：
* 秩序：首先它会让混乱的模型变得可控；
* 连接：其次我们需要打通Agent孤岛，让AI真正融入到业务中去；
* 自动：接下来就是将简单繁琐的任务变得自动化。

于广游：我想到的是这三点：
* 安全高效：第一个是我们去落地Agent的关键，就是让它能够安全高效地跑起来；
* 智能进化：第二步就是我们去优化Agent本身的能力，无论是通过知识库、记忆还是Agent RL来进化它；
* 人机协同：要实现Agent的进化，就需要人类作为老师去教Agent。

Agent Infra的下一步

于广游：对我们而言，最关注的是Agent Infra如何服务好Agent，确保其安全可靠运行。

我认为Agent Infra和AI Infra是交叉的关系。当我们把Agent运行好后，就会发现它的一些不足，然后我们再将产生的数据进行利用，就能对Agent本身和Agent模型进行持续优化。

当前的Infra体系，更多地是服务于基础大模型本身能力和智力的进化，而非业务可用性。所以我认为Agent Infra的下一步，一定是从服务好Agent的运行，构建到服务好Agent的智能进化。

郑立：我这边会更加关注Agent Infra的可调试性，也就是看清楚是哪一步Agent理解错误，需要去做推理链的可视化调试。

然后是记忆管理，不仅仅是基于向量的搜索，还要关注语义化的情景记忆和可计算的时间观。我理解中，Agent的记忆不能是简单的常量存储，而应该是一种变量。Agent的目标在执行过程中可能会被重写、降级，所以我们需要对目标进行一些置信度处理。

于广游：对于中小公司和个人开发者来说，最大的门槛我感觉既不是技术也不是成本，而是商业模式。

既然是中小公司，那肯定是要赚钱的。但是现在AI Agent还没有到改变整个社会商业模式的程度，此时产生的新消费和新的生产力变革还只发生在小领域。所以如果希望把它应用到公司产品中，创业者更需要回到实际问题中去解决，同时也可以尝试将自己的商业模式和形态进行一个巨大的转变。

郑立：我也觉得技术不是问题，比方说现在大模型智力本身已经过剩了。真正最大的困难，我觉得在于企业数据的壁垒和缺乏开始的勇气。

于广游：关于Agent成为主流后对移动开发生态的影响，我认为可以从应用交互形态和开发方式两个角度去讨论。

首先，对于形态，移动端（iOS/Android）形态未来会如何，目前没有人能给出确切答案。

在Agent形态之外，我们会立刻面临两个问题：
* APP集成Agent能力：第一个问题是公司会希望你在APP中集成一些Agent能力，这时开发者就需要将思维从工程转向科学实验，我觉得这个转型是非常巨大的。
* 利用AI Coding工具开发APP：第二是你所在的公司可能会让你使用AI Coding去开发，那么开发者就不能只用它来生成代码，更要用它来改变你们的协同模式和工具体系。

我相信，只有与AI工具为伍、改造研发流程，并用科学实验思维驾驭不确定性的人，才能抓住未来Agent形态转移的机遇。

关注“鲸栖”小程序，掌握最新AI资讯

本文来自网络搜集，不代表鲸林向海立场，如有侵权，联系删除。转载请注明出处：http://www.itsolotime.com/archives/14888

Agent Infra：驾驭不确定性，开启智能体工程化落地新纪元

回顾Agent元年：从技术探索到工程实践

智能体落地：Agent Infra是关键一环

Agent Infra的下一步

相关推荐

DualCamCtrl：双分支扩散模型革新视频生成，几何感知让相机运动误差降低40%

GitHub开源30+真实OpenClaw应用案例：从信息聚合到自动化运维的实战指南

构建真正会“思考”的AI：Agentic RAG全面指南

LangGraph实战：单智能体与多智能体系统的性能对比与架构解析

构建智能数据库对话助手：基于RAG的Text-to-SQL聊天机器人实战