开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈

这个名为 planning-with-files 的开源项目近期在 Agent 开发社区引发了高度关注,其核心在于通过文件系统来管理 AI 的长期记忆与复杂任务规划。项目开源仅数日,便在 GitHub 上获得了数千星标。开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈 它演示了如何利用 Claude Code Skill 实现与 Manus 产品理念相似的上下文工程工作流。开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈

Manus 的上下文工程原则

开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈 Manus 曾公开分享其产品所实践的上下文工程原则,核心可概括为以下几点:

① 文件即单一真理来源
摒弃主要依赖线性、嘈杂且包含过时纠错信息的对话历史作为 AI 记忆的传统方式,转而信任经过整理、代表当前“最新状态”的文件。AI 在每次行动前,应主要读取这些文件,而非回溯冗长的聊天记录,从而确保其决策始终基于最准确的状态。

② 状态显式化
例如,Manus 使用一个显式的 ToDo 文件来记录任务进度(如 [x] 步骤1[ ] 步骤2),这被称为外部化记忆。即使中断会话或重启系统,AI 在重新启动时读取该文件即可立刻恢复进度,实现了完美的任务可恢复性。开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈

③ 上下文窗口极简主义
避免将所有相关文件和全部历史对话一次性塞给 AI,而是只提供当前步骤所必需的信息。过长的上下文会分散 AI 的注意力。通过将信息拆分到独立的文件(如 notes.mdplan.mdoutput.md)中,AI 在执行特定步骤时仅需读取相关片段,既能保持“思维清晰”,也减少了 Token 消耗。

④ 思考与行动分离
禁止 AI 在单次回复中混合进行思考、规划和执行操作。强制其先在 Notes 文件中写下调研结果、架构思路等,经确认无误后,再去修改正式的代码文件。这种做法避免了 AI 在半途发现思路错误而导致代码库被污染的情况。

⑤ 围绕 KV-Cache 进行设计
鉴于 Agent 任务通常具有长输入、短输出的特征,若不能有效利用 KV-Cache,成本与延迟将难以承受。开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈 因此,所有 Prompt 设计都需为缓存命中率让路:
* 保持前缀稳定:避免在 System Prompt 或前置上下文中放入动态内容,以防后续所有缓存失效。
* 只追加不修改:历史交互记录一旦生成,便不再进行修剪或改写。
* 确定性序列化:确保 JSON 对象的 Key 排序固定,使得相同状态永远生成完全相同的字符串。

⑥ 掩码而非移除工具
随着 Agent 能力增强,工具库会变得庞大。直觉上动态移除当前不需要的工具描述可以节省 Token,但 Manus 认为这是错误的,因为它会破坏 KV-Cache(工具定义通常在 System Prompt 中),并可能导致模型对历史记录中调用过的“不存在”工具产生困惑。开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈
正确的做法是:始终将完整的工具集保留在上下文中,而在解码阶段通过修改 Logits(概率分布)来屏蔽当前不合法的工具调用。例如,强制模型只能选择“回复用户”而非调用“浏览器”,是通过在底层屏蔽相应 Token 实现的,而非修改 Prompt 文本。开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈

  • Manus 博客原文地址:https://manus.im/zh-cn/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus

以上实践传递了一个核心观点:对话流仅适合短暂的指令交互,而文件系统才是智能体进行长期记忆存储与复杂推理的最佳载体。

项目简介

回到 planning-with-files 项目,其核心理念同样是“使用文件进行规划”。开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈

  • 项目开源地址:https://github.com/OthmanAdi/planning-with-files

安装此 Skill 后,Claude 会自动维护三个核心文件(这也是其被称为 Manus 风格工作流的原因):

① task_plan.md
记录当前任务的目标、拆解的步骤、已完成进度以及下一步计划。其优势在于,AI 在执行每一步操作前都会先读取此文件,确保不会偏离目标。

② notes.md
用于存放调研资料、中间代码片段、临时想法或长文本。这有助于保持主对话窗口的简洁,避免因塞入过多无关细节而干扰 AI 的“思考”。

③ [deliverable].md
用于存放最终生成的纯净输出结果,如代码、文章或报告,其中不包含思考过程。开源3天斩获7000星!复刻Manus工作流的GitHub项目引爆Agent开发圈

简而言之,该项目如同一个为 AI 安装的“外挂大脑”插件。它通过强制 AI 使用本地文件来记录进度和思考过程,有效解决了大模型在长对话中容易出现的上下文丢失、目标漂移等痛点。

如何使用

该项目本质上是一个 Claude Code Skill。你需要先安装 Claude Code,然后通过以下命令安装此 Skill:

/plugin marketplace add OthmanAdi/planning-with-files/
plugin install planning-with-files@planning-with-files

在 Claude Code 中,当你要求其对任务进行规划或提及“planning”时,它便会自动创建 task_plan.md 文件,并进入这种基于文件的高效工作模式。


关注“鲸栖”小程序,掌握最新AI资讯

本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/17652

(0)
上一篇 2026年1月12日 下午12:45
下一篇 2026年1月12日 下午4:07

相关推荐

  • AMD Iris:Triton原生多GPU通信库,以Tile级抽象实现1.79倍性能飞跃,重塑计算-通信融合范式

    关键词:Iris、Triton、多 GPU 通信、计算-通信融合、对称内存抽象、tile 级编程 现代 AI 工作负载需要近乎峰值的性能以充分提取 AI 系统的效率。 然而,多 GPU 编程传统上要求开发者在性能与可编程性之间进行复杂的权衡:高性能实现通常依赖于低层 HIP/CUDA 通信库,即便实现基本的 重叠模式也需要大量工程努力;而更简单的抽象则往往牺…

    2026年1月9日
    5600
  • AI掌控安卓手机:四大开源项目深度解析与实战指南

    AI掌控安卓手机:四大开源项目深度解析与实战指南 去年11月,一篇盘点GitHub上AI操控手机开源项目的文章引发了广泛关注。文章发布仅五天后,豆包便官宣推出AI手机,紧接着智谱AI开源了AutoGLM模型。这标志着AI与移动设备交互进入了一个新的阶段。 本文将整合最新的开源项目,对当前GitHub上主流的AI控制手机方案进行一次全面的梳理和解析。 01 智…

    2025年12月15日
    10500
  • Kimi K2 Thinking开源引爆AI界:超越GPT-5的300步工具调用模型实战指南

    Kimi 最近开源了其思考模型:Kimi K2 Thinking。根据官方介绍,该模型具备“边思考,边使用工具”的能力,能够自主执行高达 300 步的工具调用流程,以解决复杂问题。在被称为“人类终极考试”的高难度推理与通用智力测试中,其表现超越了 GPT-5,达到了当前的最先进水平。 若想在 Kimi 官网体验此能力,可直接在 kimi.com 开启“长思考…

    2025年11月17日
    6200
  • OVSeg3R:革新3D实例分割,基于2D先验实现开集识别与低成本标注

    3D模型的实例分割一直受限于稀缺的训练数据与高昂的标注成本,训练效果有待提升。 近年来,利用成熟海量的2D实例分割数据来辅助实现3D实例分割成为一个极具潜力的研究方向,但实现思路不尽相同。 近日,IDEA计算机视觉与机器人研究中心(CVR,Computer Vision and Robotics)的张磊团队提出了一种名为OVSeg3R的开集3D实例分割学习新…

    2026年1月17日
    6900
  • GitHub 六大 Agent 开源项目:从零构建智能体,打破信息壁垒

    2025年,无疑是Agent(智能体)元年,GitHub作为重要的学习平台,汇聚了大量优质的开源教程与项目。 01 Hello-Agents 这是由国内社区Datawhale开源的教程,在GitHub上已获得5700+ Star。该教程不仅深入讲解底层原理,更注重实践,手把手指导你编写可运行的Agent代码。它不仅仅是一个代码仓库,更像一本互动式的教科书,旨…

    2025年12月9日
    7000