最近,复旦大学肖仰华教授的朋友圈引起了热议。其团队在研发测试的AI智能体通过自主学习,掌握了操作微信的能力,不仅能在朋友圈发布消息,还能与好友在评论区自主互动。这种自然的互动方式,甚至让一些好友开始要求“证明你真的是肖老师,而不是他的AI”。

这种“分不清真人与AI”的错觉,源于A3实验室(Advantage AI Agent实验室,由深圳夸夸菁领科技有限公司与复旦大学知识工场实验室联合成立的科研团队)研发的新型智能体:GenericAgent。
它不同于安装繁琐、能力受限、难以迁移的传统智能体,而是下一代具备自组织、自学习、自进化能力的通用智能体。其设计目标是成为一个拥有“生命感”,能够在用户调教下快速学习与成长的数字生命。该系统已于2026年1月11日开源。
01 自学习、自进化:AGI的可能形态
达到AGI水平的智能体不应仅能执行预设脚本,而应能在环境交互中不断学习成长。它需要理解并操作复杂环境(如社交平台),学习有效的问题解决策略,并能沉淀经验,最终演变为专家能手或贴心助手。这种自进化特性主要体现在三个维度:
- 自组织记忆:拒绝信息的简单堆砌。它具备记忆分层组织与持续精炼的能力,能有效提升记忆检索效率和交互稳定性。甚至能在“过夜”时自主整理杂乱的记忆,确保长期运行效率。

- 自适应学习:具备极强的环境适应性,在交互过程中会自主记住合理的步骤与策略,从而变得越来越“聪明”。

- 自主成长进步:遇到新问题时,它会通过“Fork”模式尝试复制自身,采用多样策略进行尝试,并用更优策略更新自己。在闲置时间,可通过“探索模式”自主培养未知能力,持续拓展能力边界。

实现这种“自进化”的背后,依赖于三个核心原则:极简架构、极强执行、极致迁移。
02 极简架构:用极致工程实现便捷落地
极简特点体现在架构、开销与部署三个层面。
- 极简架构:代码总量仅3000多行(核心模块仅数百行),实现了传统架构数十万行代码才能具备的能力,易于开发者理解和修改。
> 代码量即上下文优势:全代码约8000 tokens,仅占200K上下文的4%。这意味着LLM每轮对话都能全量理解自身源码,它自己就是最好的文档、社区和工程化工具。 - 极低开销:核心理念是“信息密度越大,效果越好”。
- 通过记忆的分层索引和按需加载,大幅压缩系统提示(System Prompt),极大节省了Token开销。
- 全部特殊提示词与核心记忆的总量,小于传统项目的一个
AGENTS.md文件。 - 绝不重复传输信息,大量代码逻辑用于确保上下文(context)中不包含任何冗余信息。
- 极简部署:告别复杂的安装指导。只要具备Python和Requests库的环境就能运行,真正实现了“只要有电有网就能进化”。
03 极强执行能力:八爪鱼般的工具触达能力
如果说自进化是GenericAgent的灵魂,那么强大的工具控制力就是它强壮的触角,确保其出色的任务完成能力。它能深入操作系统中的各类工具,适应不同复杂环境的交互。
- 原子工具撬动数字世界:拒绝提供臃肿的工具选项,仅通过
code_run(执行任意代码)、file_read/write(文件操作)、web_scan/execute_js(浏览器控制)等9个原子工具,便能操控整个PC与网络世界。 - 现场“制造”工具:当现有工具不足以解决问题时,GenericAgent会开启探索模式:现场安装Python包、现场编写脚本、现场验证方案。

- 降维打击的浏览器策略:不同于传统方案需要开启全新的、未登录的浏览器实例,它通过JS插件直接接管用户正在使用的浏览器。
- 优势:无需重新登录各类系统(如OA、企业微信),可直接在用户现有登录态下完成内容查找、表格填写、附件上传等繁琐流程,实现真正的“人机接力”。

04 极致迁移:你的智能体,随你走
GenericAgent的设计初衷是打破软硬件壁垒,让智能体不再被禁锢于特定环境。
- 不挑基座模型:无论是Claude、Gemini还是Kimi,在GenericAgent的架构加持下,对底座模型的能力依赖被缩小,确保了输出质量的稳定可靠。

- 极低的硬件门槛:只要有电、有网、有Python环境,在任何普通PC或手机上都能运行。无论在Windows、Mac还是Android系统上,都能获得一致的进化体验。



- 极致技能复用:智能体在某台设备上习得的复杂技能可以被提炼成记忆并直接移植。这意味着个人的调教成果可以被广泛共享,极大地降低了智能应用的社会成本。

GenericAgent只是一个开始。本文案所有演示动图均由智能体自主生成。
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:https://www.itsolotime.com/archives/23543
