引言
如果你一直听到人们谈论“循环工程”(Loop Engineering),但仍然不确定该从哪里开始,那么本指南将为你提供一个实用的入门切入点。
循环不是让你反复编写提示词并手动检查每一步,而是让 AI Agent 按计划朝着一个小目标工作。系统可以分配任务、读取当前状态、运行 Agent、验证结果,并在需要判断时让人类重新介入。
原始报告介绍了 Cobus Greyling 的一个开源循环工程框架。在该报告发布时,该项目已经获得了约 4.5k 个 GitHub Star。由于项目持续增长,现在仓库显示的 Star 数可能已经不同。

简而言之:重点不再只是写出更好的提示词。重点是设计一个可靠的循环,让它能够在清晰边界内进行提示、检查并迭代。

什么是循环工程?
循环工程是一种设计可重复 AI Agent 工作流的方法。循环不只是一个提示词。它是围绕 Agent 构建的一个小型操作系统:它定义 Agent 何时运行、读取什么上下文、允许更改什么内容、如何检查结果,以及何时需要人类审查结果。
典型循环可用于以下任务:
- 每日项目分诊;
- 监控拉取请求;
- 清理 CI 失败;
- 扫描依赖项;
- 整理 Issue;
- 合并后的清理工作;
- 起草更新日志。
这些任务并不总是很难,但它们具有重复性。它们需要注意力、上下文和一致的标准。这正是设计良好的循环能够发挥作用的工作类型。
为什么这个框架备受关注
原文中描述的开源框架整合了实用的循环模式、入门模板和命令行工具。它面向 AI 编码 Agent 设计,并支持围绕 Claude Code、Codex、Grok 和 OpenCode 等工具的工作流。
该框架包括:
- 七种可直接使用的循环模式;
- 面向常见场景的入门模板;
- 用于搭建循环脚手架的
loop-init; - 用于估算 Token 成本的
loop-cost; - 用于检查循环就绪状态的
loop-audit; - 面向长时间运行工作流的状态文件和预算文件;
- 支持更安全的人类审查和分阶段发布。
核心信息很简单:
停止只写提示词。去设计循环。
这并不意味着提示词会消失。它意味着提示词会成为一个更大系统的一部分,这个系统可以重复执行工作、跟踪状态并验证结果。
快速开始:一条命令
最快的入门方式是在一个 Git 项目中运行 loop-init。
注意:原文的一些转载版本会使用长破折号显示命令行参数。在真实终端中,请使用下面展示的标准双连字符
--。
npx @cobusgreyling/loop-init . --pattern daily-triage --tool claude
此命令会在当前项目中生成循环结构脚手架。你可以根据想要测试的工作流,将 claude 替换为其他受支持的工具,例如 grok、codex 或 opencode。
daily-triage 模式非常适合初学者作为起点,因为与高频自动化相比,它的风险更低。它侧重于扫描当前项目状态并生成报告,然后才允许进行任何自动更改。
面向初学者的循环教程
循环工程一开始听起来可能很抽象,但该框架会将其拆解为几个具体的构建块。
五个构建块加记忆
从基础层面看,一个循环由五个主要部分构成,外加记忆和状态。

| 构建块 | 它在循环中的作用 |
|---|---|
| 自动化 / 调度 | 按一定节奏运行循环,例如每天、每小时或每隔几分钟。 |
| 工作树 | 创建隔离的工作环境,避免多个 Agent 相互覆盖彼此的工作。 |
| 技能 | 存储可复用的项目知识、规则和任务指令。 |
| 插件与连接器 | 通过 MCP、GitHub、Linear 或 Slack 等系统,将循环连接到真实工具。 |
| 子 Agent | 将执行者角色与检查者角色分离,避免同一个 Agent 审批自己的工作。 |
| 记忆 / 状态 | 将持久上下文保存在外部 |
聊天,通常通过 STATE.md 等文件进行。|
这种结构让循环更容易推理。你不是要求模型“处理所有事情”。你是在给它一个明确的环境、一个计划、一个状态文件、一条验证路径,以及一条人工交接规则。
七种可直接用于生产的模式
该框架还包含七种面向生产的模式。每种模式都有不同的节奏、风险级别和最佳使用场景。

| 模式 | 典型使用场景 | 建议起始模式 |
|---|---|---|
| 每日分诊 | 扫描项目状态、问题、CI 和提交。 | L1 仅报告 |
| PR 看护 | 在评审、CI、变基和合并过程中看护拉取请求。 | L1 监看 |
| CI 清扫 | 监看失败的检查,并提出或应用小修复。 | L2 谨慎 |
| 依赖清扫 | 检查过期依赖和安全更新。 | L2 仅补丁 |
| Issue 分诊 | 对传入问题进行去重、评分和打标签。 | L1 仅提议 |
| 合并后清理 | 合并后清理 TODO、小型技术债和后续工作。 | L1 非高峰 |
| 变更日志起草 | 根据提交和已合并的变更起草发布说明。 | L1 草稿 |
实用建议是从低风险循环开始。每日分诊通常更容易建立信任,因为它不需要立即更改代码。
交互式模式选择器
该项目还提供了一个交互式选择器。你无需手动选择模式,而是可以从痛点入手,例如“PR 总是卡住”、“CI 总是失败”或“issue 噪音太多”。
然后,选择器会推荐一个循环模式,并给出起始命令。当你知道问题是什么,但不确定应该由哪个循环来处理时,这会很有用。
运行你的第一个循环
下面是一种适合初学者的方式,用于运行第一个循环,同时控制风险。
第 1 步:选择一个模式
如果这是你第一次使用,请从 daily-triage 开始。这是一种低风险模式,也是理解循环如何读取项目状态、写入备注并为人工准备工作的好方法。
第 2 步:搭建循环
在你的 Git 项目根目录中运行初始化命令。
npx @cobusgreyling/loop-init . --pattern daily-triage --tool claude
如果你使用的是其他 AI 编程代理,可以替换工具名称。
npx @cobusgreyling/loop-init . --pattern daily-triage --tool grok
npx @cobusgreyling/loop-init . --pattern daily-triage --tool codex
npx @cobusgreyling/loop-init . --pattern daily-triage --tool opencode
了解基本流程后,也可以将 daily-triage 替换为另一个受支持的模式。
第 3 步:估算 Token 成本
高频循环可能会消耗大量 token,尤其是在使用子代理、长上下文或重复验证时。在过于频繁地运行循环之前,先估算成本。
npx @cobusgreyling/loop-cost --pattern daily-triage --level L1
早期测试时,请将循环保持在 L1,并避免激进的调度。
第 4 步:审计循环就绪情况
在信任循环之前,先运行一次审计。审计会为项目给出 0 到 100 的就绪评分,并建议改进项。
npx @cobusgreyling/loop-audit . --suggest
如果你的项目尚未准备好,请先补齐缺失部分。常见缺口包括没有状态文件、没有验证步骤、范围不清、缺少预算限制,或人工交接规则薄弱。
如果项目达到了较好的就绪水平,也可以为 README 生成一个 Loop Ready 徽章。
npx @cobusgreyling/loop-audit . --badge
第 5 步:从仅报告模式开始
几分钟搭建展示站并增长获客
输入一句想法,We0 AI 即可生成展示站、页面与 CMS。发布上线后并帮你获取客户和流量。
不要让循环在第一天就修改生产代码。先从仅报告模式开始,然后手动审查输出。
对于 Grok 风格的循环命令,第一次运行可以像这样:
/loop 1d Run loop-triage. Update STATE.md. No auto-fix in week one.
这会告诉循环进行分诊、写入状态,并在第一周避免自动修复。
第 6 步:阅读输出
打开 STATE.md,检查循环发现了什么。这个文件充当对话之外的记忆。它应该展示循环看到了什么、做了什么、跳过了什么,以及哪些内容需要人工关注。
如果输出噪音太多或有误,请在提高自主性之前先调整循环。一个有用的循环应该变得枯燥、可预测且可检查。
循环成熟度:L1 到 L3
循环工程应逐步推出。成熟度等级可以帮助你避免过早给予过多自由。
| 等级 | 含义 | 推荐用途 |
|---|---|---|
| L1 | 循环报告发现并更新状态,但不更改代码。 | 最适合首次运行和低风险采用。 |
| L2 | 循环可以在验证器和人工审查的配合下进行小规模更改。 | 适用于团队已经信任循环输出之后。 |
| L3 | 循环可以运行更长时间,并进行有限的无人值守执行。 | 仅适用于范围、安全、成本和验证都已成熟的情况。 |
一个好的首要目标不是完全自主。一个好的首要目标是一个可靠的 L1 循环,它能够在不
产生额外的清理工作。
标准循环流程
一个完整的循环具有清晰的顺序。原文将其描述为一个八步流程:
- 定时触发;
- 任务分流;
- 读取当前状态;
- 创建隔离工作区;
- 让代理执行;
- 运行验证检查;
- 连接到 Git 或工单系统;
- 必要时请求人工确认。

这就是随意提示和真正循环之间的主要区别。代理并不是简单地“做事情”。它是在一个受控流程中工作,这个流程包含状态、隔离、检查和交接。
Andrew Ng:产品开发需要三个循环
原文还将循环工程与 Andrew Ng 关于产品开发的讨论联系起来。关键点在于,使用 AI 构建软件并不只是一个循环。对于一个真正的产品而言,会有多个以不同速度运行的循环。

- 代理式编码循环
最内层的循环是编码循环。人类向代理提供产品规格和评估标准。代理编写代码、测试代码、修复问题,并持续迭代。
这个循环可以很快。在某些情况下,它可能每隔几分钟就产出一个新版本。
- 开发者反馈循环
下一层是开发者反馈循环。代理可以进行测试和修改,但开发者仍然需要检查结果是否符合预期、是否契合产品方向,以及是否解决了真实的用户问题。
这个循环更慢。它可能每隔几十分钟或每隔几小时运行一次,具体取决于产品以及变更的复杂度。
- 外部反馈循环
最外层是用户反馈循环。一旦产品触达朋友、Alpha 测试者或真实用户,团队就开始从反馈、使用数据和实验中学习。
这个循环会更慢。它可能需要数小时、数天或数周。

这三个循环共同形成了一条实用的产品构建链条:代理帮助快速产出版本,开发者决定产品应该发展成什么样,而用户则证明这个方向是否值得继续推进。
为什么人类品味仍然重要
循环工程并不会把人类从软件开发中移除。它改变的是人类的角色。
代理可以处理重复执行,但它仍然需要清晰的边界、强有力的验证以及产品判断。人类仍然理解上下文:用户需要什么,哪些权衡很重要,哪些事情不应该自动化,以及“足够好”到底意味着什么。
这就是为什么一个循环可以通过一条命令安装,但“完成”的定义仍然属于构建产品的人。
来源说明
原始来源:BAAI Hub 文章,转载自 QbitAI / 微信。文章还引用了 Loop Engineering GitHub 仓库 以及 Andrew Ng 在 X 上的公开帖子。
图片说明:源页面中的开场梗图和最后的二维码/联系方式推广横幅已被排除,因为它们对于理解本教程并非必要。其余图片仅在支持技术解释时保留。
常见问题
什么是循环工程?
循环工程是一种为 AI 代理设计可重复工作流的方法。你不需要为每个小任务手动提示代理,而是定义一个包含调度、状态、工具、验证和人工交接的循环。
如何启动一个循环工程项目?
最快的起点是在一个 Git 项目中运行 npx @cobusgreyling/loop-init . --pattern daily-triage --tool claude。对于初学者来说,daily-triage 通常比高频循环更安全,因为它可以从仅报告模式开始。
为什么循环工程使用 STATE.md?
STATE.md 为循环提供了聊天会话之外的持久记忆。它帮助循环记住先前发现、上一次操作、未解决事项以及人工覆盖指令。
什么是 Loop Ready 分数?
Loop Ready 分数是由 loop-audit 生成的审计结果。它会检查项目是否具备足够的结构、状态、验证、成本限制和安全控制,以便负责任地运行循环。
AI 代理循环可以无人值守运行吗?
它
可以,但不应一开始就这样做。更安全的路径是先采用 L1 仅报告模式,然后进入 L2 带验证的辅助修复,只有在范围、安全性和成本控制都成熟之后,才进入 L3 无人值守运行。
为什么要在运行循环之前估算 token 成本?
如果循环运行频繁、使用较长上下文,或启动多个子代理,成本可能会变得很高。loop-cost 可帮助你在高频工作流消耗预算之前预估用量。
Andrew Ng 的三循环理念与此有什么关系?
工程循环帮助代理快速构建和修改软件。开发者反馈和用户反馈是更慢的循环,用来判断产品是否有用、是否易用,以及是否值得继续推进。
相关工具
- Loop Engineering:用于设计 AI 代理循环的开源模式、启动模板和 CLI 工具。
- Loop Engineering Showcase:包含模式、基础组件和就绪度模拟器的交互式概览。
- Node.js:使用基于
npx的 CLI 工具所需的运行时。 - npm:用于通过
npx运行 Loop Engineering CLI 命令的软件包生态系统。 - Git:用于代码仓库和基于 worktree 的隔离执行的版本控制系统。
- GitHub Actions:可支持定时检查和循环验证工作流的自动化平台。
- Model Context Protocol:用于将 AI 系统连接到外部工具和数据源的协议。
相关链接
- 原始 BAAI Hub 文章:介绍面向初学者的 Loop Engineering 教程的源文章。
- Loop Engineering GitHub 仓库:包含模式、启动模板、文档和 CLI 工具的主仓库。
- Loop Engineering Showcase:用于探索该框架的官方交互式页面。
- 五个基础组件 + 记忆:对核心循环构建模块的官方说明。
- 循环设计检查清单:用于判断循环是否已准备好投入生产使用的检查清单。
- 循环安全指南:关于自动化、拒绝列表路径、人工审查和风险控制的安全说明。
- 运行循环:关于成本、日志、运行历史和运行纪律的说明。
- 循环模式 README:可用生产级循环模式概览。
总结
本指南说明了 Loop Engineering 如何将一次性的 AI 提示词转变为可重复的代理工作流。基本思路是在信任代理反复执行操作之前,先定义好调度、状态、工具、验证和人工审查流程。
对于第一次运行,daily-triage 是最安全的起点。搭建循环脚手架,估算 token 成本,审查就绪度,并在第一周保持仅报告模式。
更大的启示并不是人类会从开发中消失。代理可以在循环中更快地推进工作,但产品判断、安全边界以及“完成”的定义仍然取决于人。
最好的第一个循环不是最自主的那个,而是你能够检查、信任并持续改进的那个。



