Agent Infra:驾驭不确定性,开启智能体工程化落地新纪元

毋庸置疑,2025年堪称「Agent元年」。

从年初到年末,Agent的热度持续攀升——从Manus到近期的豆包手机,Agent已成为全行业关注的焦点。回顾这一年,也是Agent从技术萌芽走向工程化落地的关键一年

Agent Infra:驾驭不确定性,开启智能体工程化落地新纪元

为此,量子位邀请到两位行业专家——Dify开源生态负责人郑立与腾讯云云原生产品副总经理于广游,共同探讨Agent落地过程中的挑战、机遇与未来。核心观点包括:

  • Agent的发展正从年初硅谷的宏大叙事,转向充满务实精神的落地探索。
  • 行业认可Agent,关键在于其能真正解决问题、创造价值。
  • Agent的真正落地,需要依靠确定性的工程方法来驾驭其不确定性的复杂系统本质。
  • Agent Infra旨在解决企业面临的偶然复杂度问题,而非本质复杂度。
  • 对于中小公司或个人开发者而言,最大的门槛有时并非技术,而是迈出第一步的勇气。

两位嘉宾给出了一个高度一致的判断:

在智能体落地过程中,Agent Infra是关键一环。

接下来,让我们跟随对话,深入了解他们的见解。

回顾Agent元年:从技术探索到工程实践

量子位:首先从Agent这个概念聊起。站在年末这个时间点,二位如何总结这一年Agent的整体发展?

于广游:我最大的感受是,Agent在今年已经从技术萌芽期,进入了真正的工程化落地阶段。我观察到三种标志性的实践:

  • 面向企业内部的Agent:例如Dify这类产品,通过提供确定性的框架和工具,帮助企业驾驭Agent的不确定性,实现内部效率的提升。
  • 面向大众的Agent:如Manus和豆包,它们以新的交互形态激发了用户对Agent的广泛想象和兴趣。
  • 新范式Agent:像Claude Code这样的产品,通过强化学习(RL)和工具调用,显著拓宽了Agent自身的能力边界。

我个人印象最深的应用是AI代码工具。它不再局限于解决代码问题,正逐渐成为Agent连接与操作现实世界的通用接口。其次,AI代码工具切实改变了软件工程范式。在我们内部,也进行了从AI Coding到AISE(AI软件工程师)的全面调整,涉及研发模式、组织管理和角色职责等方面。

郑立:这一年Agent的发展,我能感受到“大传统”与“小传统”之间鲜明的张力

“大传统”源自硅谷的宏大叙事,许诺用全自动智能体取代白领,逻辑完美但落地时易水土不服。“小传统”则充满烟火气,例如义乌商家用AI自动回复客户,或独立开发者利用工作流进行代码评审。

总结来说,这是趣味盎然且走向务实的一年。年初,一个简单的Demo就能吸引资本关注,可类比为“立法阶段”;年末,我们则进入了“司法阶段”,开始处理具体、琐碎的执行层面问题。这种进步并非线性,更像是根茎状的蔓延。

我们看到秩序的逐步建立,并非完全依赖基座模型的升级,更多是依靠那些“胶水”技术——如产品工程、提示词工程、RAG、Pipeline和工具调用等。它们或许不够优雅,却能有效维持数字社会的运转。

量子位:正如两位所说,从年初的Demo惊艳到年末的工程化,进程非常快。Agent为何能如此迅速地成为行业共识?

于广游:首要原因在于它能够真正解决问题。过去的生产力工具主要延伸人类的手脚,但工作中存在大量无法通过精确语言或编程描述的任务,这正是Agent的用武之地。

其次,是落地过程中对工程方法的探索。今年,一系列工程方法快速成型,包括Agent Infra、Agent Runtime、不同的Agent架构范式、内容工程等,这些技术切实推动了Agent的落地。

郑立:我基本认同。在我看来,这种共识也反映了资本在寻求新的组织方式。互联网时代的红利已见顶,App的边际效用递减。而Agent承诺的是交互成本的坍塌,体现了权力从“指令式计算”向“异度式计算”的转移。

量子位:两位都提到了关键词的变化,例如从AI Infra到Agent Infra。Agent落地与传统的AI落地有哪些核心区别?在工作流和Infra需求上有何差异?

郑立:范式转移非常明显。我们从传统的、基于if/else的确定性逻辑判断,转向了Agent基于概率的目标规划。

过去,机器必须严格执行下一行代码;现在,开发者更像老师,通过Prompt、RAG和原则设定,赋予模型自由处理的空间。

Agent Infra:驾驭不确定性,开启智能体工程化落地新纪元

核心区别在于引入了大量不确定性。在传统软件工程中,Bug是对既定规则的违反;而在Agent工程中,失败往往是对意图的误解或概率上的漂移。我们无法像修复Bug一样直接“修复”Agent,而需要像教育孩子一样去约束或引导它。

这不仅是工作流的变化,也是交付物的变化。以前我们交付确定的功能,现在交付的是一种概率性的能力,很难用绝对的正确与否来定义。

于广游:是的,不确定性非常关键。我们内部观察认为,Agent是一个不确定性的复杂系统。

首先,Agent的效果通常由多个因素共同决定(如模型本身、架构范式、Prompt、内容、工具选择和参数等),这些子部件相互影响,关系复杂,因此Agent本身是一个复杂系统。

其次,对于同一问题,在不同时间输入,Agent的输出也可能不同,这就是其不确定性。这与传统的确定性微服务系统截然不同。

因此,工程师的工作方式需要两点思维转变:

1. 从工程思维转向科学实验思维:不能仅依赖预先规划,而需建立评测体系,将环环相扣的复杂系统分解为子系统,通过控制变量进行科学实验,逐步驾驭Agent。

2. 从Day One思维转向Day Two思维:过去,Day One代表代码上线并提供服务;现在,Day One仅代表Agent能运行,效果的持续优化(Day Two)才是真正的开始。

所以,Agent落地不能仅靠几个巧妙范式,而需要通过确定性的工程方法,循序渐进地驾驭不确定性的复杂系统,这将带来基础设施(Infra)的重塑。

智能体落地:Agent Infra是关键一环

量子位:于老师提到了工具和Infra的重塑。从基础设施角度,腾讯云为加速Agent落地提供了哪些具体支持?

于广游:如前所述,Agent是不确定性的复杂系统。上线时,我们首先要解决的最大问题是其自主运行可能带来的破坏性风险。

因此,我们团队选择“从后往前”解决问题。首先解决Agent的安全问题,我们在Agent Infra中推出了Agent安全沙箱,为Agent提供独立的执行环境,隔离风险。

接着,我们着手驾驭Agent的不确定性和复杂性,为此提供了一系列可观测性工具评估工具

再进一步,我们聚焦于效果的持续提升,优化Agent的记忆与学习能力。例如,腾讯云“元宝”已进入这一阶段。在积累相关经验后,我们也会将相应的能力以服务形式提供。

量子位:您提到的Agent Runtime、安全沙箱等Infra产品,与市面上各类Agent平台之间是什么关系?腾讯云Infra当前重点关注哪些方向?

于广游:首先我们要厘清一个概念——Agent Infra到底是什么。我们可以先把企业问题划分为本质复杂度和偶然复杂度两种,前者是必须要解决的问题,后者会随着工具和方法选择存在一定的偶然性。

因此,Infra层其实就是解决企业在问题处理过程中遇到的偶然复杂问题。但这个问题并非一成不变,对于不同的场景,要面临的偶然复杂度完全不同,具体要解决什么也要视情况而定。

不过无论解决什么问题,这里都有一个共性问题,这也是我们团队正在做的,就是去构建偶然复杂度问题的最大公共子集,包括:安全、执行环境、工具、记忆和观测。

Agent Infra:驾驭不确定性,开启智能体工程化落地新纪元

而这些问题或多或少都有解决方案,其中我们认为最突出的一个问题就是Agent的自主运行

所以我们团队做的安全沙箱,并不是简单的隔离环境,而是一个多层次、全链路的Agent运行安全体系。

郑立:就我们自身而言,核心模块还是选择自研。我们认为如果使用第三方组件,势必会导致核心组件不可控、给用户的服务质量无法保证。其它的部分,我们会选择一些合适的开源或闭源方案。

对于开源,我们的看法是:AI时代的基础模型可以是黑箱,但Infra必须是白箱。因为开发者需要看到底层代码,以了解Agent的行为逻辑。而且我们观察到,初创公司和创新者往往会选择开源,因为这能提供低成本和灵活性。

相反,那些大企业则更倾向于选择开源的商业版本或闭源版本,因为闭源实际上为大企业提供了责任转移与兜底服务。

于广游:根据我们接触用户的经验,他们在选择Agent Infra产品时,首先对核心的业务逻辑层,用户还是在意它是否开源,因为这样他们就可以围绕自己的业务进行任意修改,也会感觉更透明、更可控。

具体到Infra层上,用户更在意体验是否极致、能否降低开发成本。而在实际使用时,用户就更在意Agent的稳定性和效率。在这种情况下,我觉得闭源有非常好的优势。

郑立:对于开发者而言,这种简化其实是非常激进的。它会将基础设施的认知负荷降到最低,然后你就可以把全部精力集中在Prompt和数据治理上。这其实会让我们逼近AI开发的Excel时刻

Agent Infra:驾驭不确定性,开启智能体工程化落地新纪元

于广游:我补充一下,我们腾讯云的Infra产品更偏向于专业开发者,他们会有非常多的复杂度问题需要治理。所以我们主要还是面向Agent原生企业和AI原生企业,去帮助他们加速Agent落地过程。

于广游:关于技术趋势,我还是想提AI Coding,我对这个事情印象非常深刻。

过去一年里,我能看到代码不仅是大模型抽象能力的来源,也正在成为Agent驾驭不确定性、连接世界的工具。以AI Coding为例,它带来的是开发模式的颠覆性改变,能够让我们团队里的每一个开发者,在分钟级就能拉起一个独立的全套开发环境。我认为任何一个工程师或Agent从业者,都绝不能小觑Coding的影响。

郑立:就我们而言,过去一年的技术进展主要集中在补齐短板。我们也看到一个比较清晰的趋势,就是技术正在从开发者向非开发者移动。

郑立:如果要用三个词来概括Agent Infra为何是智能体落地应用的关键环节,我认为是:
* 秩序:首先它会让混乱的模型变得可控;
* 连接:其次我们需要打通Agent孤岛,让AI真正融入到业务中去;
* 自动:接下来就是将简单繁琐的任务变得自动化。

于广游:我想到的是这三点:
* 安全高效:第一个是我们去落地Agent的关键,就是让它能够安全高效地跑起来;
* 智能进化:第二步就是我们去优化Agent本身的能力,无论是通过知识库、记忆还是Agent RL来进化它;
* 人机协同:要实现Agent的进化,就需要人类作为老师去教Agent。

Agent Infra的下一步

于广游:对我们而言,最关注的是Agent Infra如何服务好Agent,确保其安全可靠运行

我认为Agent Infra和AI Infra是交叉的关系。当我们把Agent运行好后,就会发现它的一些不足,然后我们再将产生的数据进行利用,就能对Agent本身和Agent模型进行持续优化。

Agent Infra:驾驭不确定性,开启智能体工程化落地新纪元

当前的Infra体系,更多地是服务于基础大模型本身能力和智力的进化,而非业务可用性。所以我认为Agent Infra的下一步,一定是从服务好Agent的运行,构建到服务好Agent的智能进化。

郑立:我这边会更加关注Agent Infra的可调试性,也就是看清楚是哪一步Agent理解错误,需要去做推理链的可视化调试。

然后是记忆管理,不仅仅是基于向量的搜索,还要关注语义化的情景记忆和可计算的时间观。我理解中,Agent的记忆不能是简单的常量存储,而应该是一种变量。Agent的目标在执行过程中可能会被重写、降级,所以我们需要对目标进行一些置信度处理。

于广游:对于中小公司和个人开发者来说,最大的门槛我感觉既不是技术也不是成本,而是商业模式

既然是中小公司,那肯定是要赚钱的。但是现在AI Agent还没有到改变整个社会商业模式的程度,此时产生的新消费和新的生产力变革还只发生在小领域。所以如果希望把它应用到公司产品中,创业者更需要回到实际问题中去解决,同时也可以尝试将自己的商业模式和形态进行一个巨大的转变。

郑立:我也觉得技术不是问题,比方说现在大模型智力本身已经过剩了。真正最大的困难,我觉得在于企业数据的壁垒缺乏开始的勇气

Agent Infra:驾驭不确定性,开启智能体工程化落地新纪元

于广游:关于Agent成为主流后对移动开发生态的影响,我认为可以从应用交互形态和开发方式两个角度去讨论。

首先,对于形态,移动端(iOS/Android)形态未来会如何,目前没有人能给出确切答案。

在Agent形态之外,我们会立刻面临两个问题:
* APP集成Agent能力:第一个问题是公司会希望你在APP中集成一些Agent能力,这时开发者就需要将思维从工程转向科学实验,我觉得这个转型是非常巨大的。
* 利用AI Coding工具开发APP:第二是你所在的公司可能会让你使用AI Coding去开发,那么开发者就不能只用它来生成代码,更要用它来改变你们的协同模式和工具体系。

我相信,只有与AI工具为伍、改造研发流程,并用科学实验思维驾驭不确定性的人,才能抓住未来Agent形态转移的机遇


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/14888

(0)
上一篇 2025年12月23日 下午12:13
下一篇 2025年12月23日 下午12:13

相关推荐

  • DualCamCtrl:双分支扩散模型革新视频生成,几何感知让相机运动误差降低40%

    本研究的共同第一作者是来自香港科技大学(广州)EnVision Research 的张鸿飞(研究助理)和陈康豪(博士研究生),两位研究者均师从陈颖聪教授。 你的生成模型真的「懂几何」吗? 当前众多视频生成模型虽宣称具备「相机运动控制」能力,但其控制信号通常仅依赖于相机位姿。近期工作虽通过逐像素射线方向(Ray Condition)编码了运动信息,但由于模型仍…

    2025年12月21日
    20100
  • GitHub开源30+真实OpenClaw应用案例:从信息聚合到自动化运维的实战指南

    最近在 GitHub 发现了一个有趣的仓库,专门收集 OpenClaw 的真实应用案例。 许多用户在安装 OpenClaw 后,往往会陷入一个循环:不断添加各种 Skill,在 ClawHub 中寻找新功能,今天安装天气查询,明天添加股票分析,后天又集成翻译助手。 然而,安装了大量 Skill 后,日常使用却仍停留在信息搜索和简单记录上。技能装了一百个,生活…

    2026年2月22日
    27100
  • 构建真正会“思考”的AI:Agentic RAG全面指南

    注:本文为技术内容,诸如 RAG、Agentic、Vector Database、SQL、Embedding、Cross-Encoder、LLM 等专业术语均保留英文原文,以保证准确性与可检索性。 🤔 问题:为何多数 AI 助手显得“笨拙” 设想你向一位财务分析师提问:“我们公司表现如何?” 一位初级分析师可能会匆忙给出几个数字。而一位资深专家则会先停下来,…

    2025年11月28日
    18500
  • LangGraph实战:单智能体与多智能体系统的性能对比与架构解析

    在 LangGraph 中基于结构化数据源构建 在 LangGraph 中构建不同的 agent 系统 | Image by author 对于希望构建不同智能体系统的开发者而言,一个有效的切入点是深入比较单智能体工作流与多智能体工作流,这本质上是评估系统设计的灵活性与可控性之间的权衡。 本文旨在阐明 Agentic AI 的核心概念,并演示如何利用 Lan…

    2025年11月2日
    20300
  • 构建智能数据库对话助手:基于RAG的Text-to-SQL聊天机器人实战

    本项目构建了一个由 AI 驱动的聊天机器人,能够将自然语言问题转换为 SQL 查询,并直接从 SQLite 数据库中检索答案。该应用结合了 LangChain、Hugging Face Embeddings 和 Chroma 向量存储,通过检索增强生成(RAG)工作流,将非结构化的用户输入与结构化数据库连接起来,并配备了 FastAPI 后端与 Stream…

    2025年11月4日
    21800