新手友好的循环工程教程：用一条命令启动你的第一个 AI Agent 循环

本指南解释了循环工程如何将一次性的 AI 提示词转化为可重复执行的 Agent 工作流。其基本思路是：在信任 Agent 反复执行任务之前，先定义好调度、状态、工具、验证以及人工审核流程。对于首次运行，`daily-triage` 是最安全的起点。先搭建循环脚手架，估算 tok...

引言

如果你一直听到人们谈论“循环工程”（Loop Engineering），但仍然不确定该从哪里开始，那么本指南将为你提供一个实用的入门切入点。

循环不是让你反复编写提示词并手动检查每一步，而是让 AI Agent 按计划朝着一个小目标工作。系统可以分配任务、读取当前状态、运行 Agent、验证结果，并在需要判断时让人类重新介入。

原始报告介绍了 Cobus Greyling 的一个开源循环工程框架。在该报告发布时，该项目已经获得了约 4.5k 个 GitHub Star。由于项目持续增长，现在仓库显示的 Star 数可能已经不同。

图片展示的是Cobus Greyling的Loop Engineering GitHub仓库页面。页面左侧为仓库目录，包含Code、Issues、Pull requests等选项卡，以及main分支下的多个文件夹和文件，如docs、examples、patterns等。右侧是仓库简介，介绍其为AI代码设计系统提供实用模式、入门级CLI工具等，还列出了相关标签，如automation、mp等。该图片与文档中介绍Loop Engineering框架的上下文相关，直观呈现了该框架的GitHub仓库结构。

简而言之：重点不再只是写出更好的提示词。重点是设计一个可靠的循环，让它能够在清晰边界内进行提示、检查并迭代。

![图片展示了一段代码风格的文字，背景为深色。文字内容为“Stop prompting. Design the loop. Get a score.”，其中“Get a score.”以绿色突出显示。下方有“loop

init → loop
audit”及“10 → 70 → 100”的代码样式表达。该图片与上文介绍Loop Engineering的内容相关，强调从停止提示、设计循环到获取分数的流程，直观呈现了循环设计的步骤及评分变化，帮助理解循环工程的核心理念。](https://we0-cms.oss-cn-beijing.aliyuncs.com/cms-assets/image/2026/07/c3d22bdf-e875-4a83-8285-9762a5a1d64e-03-72083769-3a19-4a9a-8930-8cffb4299a3d.gif)

什么是循环工程？

循环工程是一种设计可重复 AI Agent 工作流的方法。循环不只是一个提示词。它是围绕 Agent 构建的一个小型操作系统：它定义 Agent 何时运行、读取什么上下文、允许更改什么内容、如何检查结果，以及何时需要人类审查结果。

典型循环可用于以下任务：

每日项目分诊；
监控拉取请求；
清理 CI 失败；
扫描依赖项；
整理 Issue；
合并后的清理工作；
起草更新日志。

这些任务并不总是很难，但它们具有重复性。它们需要注意力、上下文和一致的标准。这正是设计良好的循环能够发挥作用的工作类型。

为什么这个框架备受关注

原文中描述的开源框架整合了实用的循环模式、入门模板和命令行工具。它面向 AI 编码 Agent 设计，并支持围绕 Claude Code、Codex、Grok 和 OpenCode 等工具的工作流。

该框架包括：

七种可直接使用的循环模式；
面向常见场景的入门模板；
用于搭建循环脚手架的 loop-init；
用于估算 Token 成本的 loop-cost；
用于检查循环就绪状态的 loop-audit；
面向长时间运行工作流的状态文件和预算文件；
支持更安全的人类审查和分阶段发布。

核心信息很简单：

停止只写提示词。去设计循环。

这并不意味着提示词会消失。它意味着提示词会成为一个更大系统的一部分，这个系统可以重复执行工作、跟踪状态并验证结果。

快速开始：一条命令

最快的入门方式是在一个 Git 项目中运行 loop-init。

注意：原文的一些转载版本会使用长破折号显示命令行参数。在真实终端中，请使用下面展示的标准双连字符 --。

npx @cobusgreyling/loop-init . --pattern daily-triage --tool claude

此命令会在当前项目中生成循环结构脚手架。你可以根据想要测试的工作流，将 claude 替换为其他受支持的工具，例如 grok、codex 或 opencode。

daily-triage 模式非常适合初学者作为起点，因为与高频自动化相比，它的风险更低。它侧重于扫描当前项目状态并生成报告，然后才允许进行任何自动更改。

面向初学者的循环教程

循环工程一开始听起来可能很抽象，但该框架会将其拆解为几个具体的构建块。

五个构建块加记忆

从基础层面看，一个循环由五个主要部分构成，外加记忆和状态。

图片展示了Loop Engineering的五个核心构建块，分别为自动化/调度、工作树、技能、插件和连接器（MCP）、子代理（Maker/Checker），以及记忆/状态。每个构建块以图标和文字形式呈现，如自动化/调度图标为日历，工作树图标为树，技能图标为书本，子代理图标为人形，记忆/状态图标为磁盘。这些构建块通过箭头连接，共同构成一个循环系统，体现了Loop Engineering框架中各部分的相互作用与联系。

构建块	它在循环中的作用
自动化 / 调度	按一定节奏运行循环，例如每天、每小时或每隔几分钟。
工作树	创建隔离的工作环境，避免多个 Agent 相互覆盖彼此的工作。
技能	存储可复用的项目知识、规则和任务指令。
插件与连接器	通过 MCP、GitHub、Linear 或 Slack 等系统，将循环连接到真实工具。
子 Agent	将执行者角色与检查者角色分离，避免同一个 Agent 审批自己的工作。
记忆 / 状态	将持久上下文保存在外部

聊天，通常通过 STATE.md 等文件进行。|

这种结构让循环更容易推理。你不是要求模型“处理所有事情”。你是在给它一个明确的环境、一个计划、一个状态文件、一条验证路径，以及一条人工交接规则。

七种可直接用于生产的模式

该框架还包含七种面向生产的模式。每种模式都有不同的节奏、风险级别和最佳使用场景。

图片展示了 Loop 框架的 7 个生产模式。每个模式以卡片形式呈现，包含模式名称、典型应用场景、建议起始模式及风险等级。如 Daily Triage 适用于扫描项目状态、问题等，起始模式为 L1 report-only，风险等级为 LOW。PR Babysitter 适用于看护 PR，起始模式为 L1 watch，风险等级为 HIGH。右侧还有一个绿色边框的卡片，提示“Not sure? Try the interactive picker”，供不确定模式时使用交互式选择器。

模式	典型使用场景	建议起始模式
每日分诊	扫描项目状态、问题、CI 和提交。	L1 仅报告
PR 看护	在评审、CI、变基和合并过程中看护拉取请求。	L1 监看
CI 清扫	监看失败的检查，并提出或应用小修复。	L2 谨慎
依赖清扫	检查过期依赖和安全更新。	L2 仅补丁
Issue 分诊	对传入问题进行去重、评分和打标签。	L1 仅提议
合并后清理	合并后清理 TODO、小型技术债和后续工作。	L1 非高峰
变更日志起草	根据提交和已合并的变更起草发布说明。	L1 草稿

实用建议是从低风险循环开始。每日分诊通常更容易建立信任，因为它不需要立即更改代码。

交互式模式选择器

该项目还提供了一个交互式选择器。你无需手动选择模式，而是可以从痛点入手，例如“PR 总是卡住”、“CI 总是失败”或“issue 噪音太多”。

然后，选择器会推荐一个循环模式，并给出起始命令。当你知道问题是什么，但不确定应该由哪个循环来处理时，这会很有用。

运行你的第一个循环

下面是一种适合初学者的方式，用于运行第一个循环，同时控制风险。

第 1 步：选择一个模式

如果这是你第一次使用，请从 daily-triage 开始。这是一种低风险模式，也是理解循环如何读取项目状态、写入备注并为人工准备工作的好方法。

第 2 步：搭建循环

在你的 Git 项目根目录中运行初始化命令。

npx @cobusgreyling/loop-init . --pattern daily-triage --tool claude

如果你使用的是其他 AI 编程代理，可以替换工具名称。

npx @cobusgreyling/loop-init . --pattern daily-triage --tool grok
npx @cobusgreyling/loop-init . --pattern daily-triage --tool codex
npx @cobusgreyling/loop-init . --pattern daily-triage --tool opencode

了解基本流程后，也可以将 daily-triage 替换为另一个受支持的模式。

第 3 步：估算 Token 成本

高频循环可能会消耗大量 token，尤其是在使用子代理、长上下文或重复验证时。在过于频繁地运行循环之前，先估算成本。

npx @cobusgreyling/loop-cost --pattern daily-triage --level L1

早期测试时，请将循环保持在 L1，并避免激进的调度。

第 4 步：审计循环就绪情况

在信任循环之前，先运行一次审计。审计会为项目给出 0 到 100 的就绪评分，并建议改进项。

npx @cobusgreyling/loop-audit . --suggest

如果你的项目尚未准备好，请先补齐缺失部分。常见缺口包括没有状态文件、没有验证步骤、范围不清、缺少预算限制，或人工交接规则薄弱。

如果项目达到了较好的就绪水平，也可以为 README 生成一个 Loop Ready 徽章。

npx @cobusgreyling/loop-audit . --badge

第 5 步：从仅报告模式开始

Use We0 AI

几分钟搭建展示站并增长获客

输入一句想法，We0 AI 即可生成展示站、页面与 CMS。发布上线后并帮你获取客户和流量。

未命名-1

布局

填充

圆角

生成中

不要让循环在第一天就修改生产代码。先从仅报告模式开始，然后手动审查输出。

对于 Grok 风格的循环命令，第一次运行可以像这样：

/loop 1d Run loop-triage. Update STATE.md. No auto-fix in week one.

这会告诉循环进行分诊、写入状态，并在第一周避免自动修复。

第 6 步：阅读输出

打开 STATE.md，检查循环发现了什么。这个文件充当对话之外的记忆。它应该展示循环看到了什么、做了什么、跳过了什么，以及哪些内容需要人工关注。

如果输出噪音太多或有误，请在提高自主性之前先调整循环。一个有用的循环应该变得枯燥、可预测且可检查。

循环成熟度：L1 到 L3

循环工程应逐步推出。成熟度等级可以帮助你避免过早给予过多自由。

等级	含义	推荐用途
L1	循环报告发现并更新状态，但不更改代码。	最适合首次运行和低风险采用。
L2	循环可以在验证器和人工审查的配合下进行小规模更改。	适用于团队已经信任循环输出之后。
L3	循环可以运行更长时间，并进行有限的无人值守执行。	仅适用于范围、安全、成本和验证都已成熟的情况。

一个好的首要目标不是完全自主。一个好的首要目标是一个可靠的 L1 循环，它能够在不

产生额外的清理工作。

标准循环流程

一个完整的循环具有清晰的顺序。原文将其描述为一个八步流程：

定时触发；
任务分流；
读取当前状态；
创建隔离工作区；
让代理执行；
运行验证检查；
连接到 Git 或工单系统；
必要时请求人工确认。

图片展示了Loop的解剖结构，强调系统一次设计后可提示、验证和迭代。图中以流程图形式呈现，包含Schedule、Triage、STATE、Worktree、Implement、Verify、MCP/PR、Human gate等环节，各环节用不同颜色框标注，如Schedule用绿色框，Triage用蓝色框等。其中，Verify环节有勾选标识，MCP/PR环节有钥匙图标，Human gate环节有黄色框和“approve/escalate”字样。该图与上下文紧密相关，直观呈现了上文提到的八步完整循环过程。

这就是随意提示和真正循环之间的主要区别。代理并不是简单地“做事情”。它是在一个受控流程中工作，这个流程包含状态、隔离、检查和交接。

Andrew Ng：产品开发需要三个循环

原文还将循环工程与 Andrew Ng 关于产品开发的讨论联系起来。关键点在于，使用 AI 构建软件并不只是一个循环。对于一个真正的产品而言，会有多个以不同速度运行的循环。

图片为Andrew Ng的推文截图，内容提到“循环工程”在Boris Cherry和Peter Steinberger提及后迅速在社交媒体上走红，成为让AI代理迭代构建软件的关键部分。Andrew Ng在信中分享构建0到1产品时的三个关键循环，即内层的编码循环、中间的开发者反馈循环、外层的用户反馈循环，这些循环不仅指导软件构建，还决定构建何种软件。图片与上下文紧密相关，是对上下文提到的“循环工程”概念的阐述。

代理式编码循环

最内层的循环是编码循环。人类向代理提供产品规格和评估标准。代理编写代码、测试代码、修复问题，并持续迭代。

这个循环可以很快。在某些情况下，它可能每隔几分钟就产出一个新版本。

开发者反馈循环

下一层是开发者反馈循环。代理可以进行测试和修改，但开发者仍然需要检查结果是否符合预期、是否契合产品方向，以及是否解决了真实的用户问题。

这个循环更慢。它可能每隔几十分钟或每隔几小时运行一次，具体取决于产品以及变更的复杂度。

外部反馈循环

最外层是用户反馈循环。一旦产品触达朋友、Alpha 测试者或真实用户，团队就开始从反馈、使用数据和实验中学习。

这个循环会更慢。它可能需要数小时、数天或数周。

图片展示了产品开发中的三个关键循环：Agentic Coding Loop、Developer Feedback Loop、External Feedback Loop。每个循环由箭头连接，形成闭环。Agentic Coding Loop由Coding agent和Product spec/evals组成，时间周期为几分钟；Developer Feedback Loop包含Developer vision和External feedback，周期为几小时；External Feedback Loop则涉及External feedback，周期为几天。该图与上下文紧密相关，直观呈现了文中提到的三个产品开发循环及其时间特点。

这三个循环共同形成了一条实用的产品构建链条：代理帮助快速产出版本，开发者决定产品应该发展成什么样，而用户则证明这个方向是否值得继续推进。

为什么人类品味仍然重要

循环工程并不会把人类从软件开发中移除。它改变的是人类的角色。

代理可以处理重复执行，但它仍然需要清晰的边界、强有力的验证以及产品判断。人类仍然理解上下文：用户需要什么，哪些权衡很重要，哪些事情不应该自动化，以及“足够好”到底意味着什么。

这就是为什么一个循环可以通过一条命令安装，但“完成”的定义仍然属于构建产品的人。

来源说明

原始来源：BAAI Hub 文章，转载自 QbitAI / 微信。文章还引用了 Loop Engineering GitHub 仓库以及 Andrew Ng 在 X 上的公开帖子。

图片说明：源页面中的开场梗图和最后的二维码/联系方式推广横幅已被排除，因为它们对于理解本教程并非必要。其余图片仅在支持技术解释时保留。

常见问题

什么是循环工程？

循环工程是一种为 AI 代理设计可重复工作流的方法。你不需要为每个小任务手动提示代理，而是定义一个包含调度、状态、工具、验证和人工交接的循环。

如何启动一个循环工程项目？

最快的起点是在一个 Git 项目中运行 npx @cobusgreyling/loop-init . --pattern daily-triage --tool claude。对于初学者来说，daily-triage 通常比高频循环更安全，因为它可以从仅报告模式开始。

为什么循环工程使用 `STATE.md`？

STATE.md 为循环提供了聊天会话之外的持久记忆。它帮助循环记住先前发现、上一次操作、未解决事项以及人工覆盖指令。

什么是 Loop Ready 分数？

Loop Ready 分数是由 loop-audit 生成的审计结果。它会检查项目是否具备足够的结构、状态、验证、成本限制和安全控制，以便负责任地运行循环。

AI 代理循环可以无人值守运行吗？

它

可以，但不应一开始就这样做。更安全的路径是先采用 L1 仅报告模式，然后进入 L2 带验证的辅助修复，只有在范围、安全性和成本控制都成熟之后，才进入 L3 无人值守运行。

为什么要在运行循环之前估算 token 成本？

如果循环运行频繁、使用较长上下文，或启动多个子代理，成本可能会变得很高。loop-cost 可帮助你在高频工作流消耗预算之前预估用量。

Andrew Ng 的三循环理念与此有什么关系？

工程循环帮助代理快速构建和修改软件。开发者反馈和用户反馈是更慢的循环，用来判断产品是否有用、是否易用，以及是否值得继续推进。

总结

本指南说明了 Loop Engineering 如何将一次性的 AI 提示词转变为可重复的代理工作流。基本思路是在信任代理反复执行操作之前，先定义好调度、状态、工具、验证和人工审查流程。

对于第一次运行，daily-triage 是最安全的起点。搭建循环脚手架，估算 token 成本，审查就绪度，并在第一周保持仅报告模式。

更大的启示并不是人类会从开发中消失。代理可以在循环中更快地推进工作，但产品判断、安全边界以及“完成”的定义仍然取决于人。

最好的第一个循环不是最自主的那个，而是你能够检查、信任并持续改进的那个。

新手友好的循环工程教程：用一条命令启动你的第一个 AI Agent 循环

引言

什么是循环工程？

为什么这个框架备受关注

快速开始：一条命令

面向初学者的循环教程

五个构建块加记忆

七种可直接用于生产的模式

交互式模式选择器

运行你的第一个循环

第 1 步：选择一个模式

第 2 步：搭建循环

第 3 步：估算 Token 成本

第 4 步：审计循环就绪情况

第 5 步：从仅报告模式开始

几分钟搭建展示站并增长获客

第 6 步：阅读输出

循环成熟度：L1 到 L3

标准循环流程

Andrew Ng：产品开发需要三个循环

为什么人类品味仍然重要

来源说明

常见问题

什么是循环工程？

如何启动一个循环工程项目？

为什么循环工程使用 `STATE.md`？

什么是 Loop Ready 分数？

AI 代理循环可以无人值守运行吗？

为什么要在运行循环之前估算 token 成本？

Andrew Ng 的三循环理念与此有什么关系？

相关工具

相关链接

总结

推荐文章

2026 年最适合 SEO 的 AI 建站工具排名：We0 AI、10Web、Webflow、Framer 怎么选？

We0 SEO 文章最终草稿

We0 AI vs Wix vs Framer：做一个 SEO 友好的企业官网，到底该选谁？

新手友好的循环工程教程：用一条命令启动你的第一个 AI Agent 循环

引言

什么是循环工程？

为什么这个框架备受关注

快速开始：一条命令

面向初学者的循环教程

五个构建块加记忆

七种可直接用于生产的模式

交互式模式选择器

运行你的第一个循环

第 1 步：选择一个模式

第 2 步：搭建循环

第 3 步：估算 Token 成本

第 4 步：审计循环就绪情况

第 5 步：从仅报告模式开始

几分钟搭建展示站并增长获客

第 6 步：阅读输出

循环成熟度：L1 到 L3

标准循环流程

Andrew Ng：产品开发需要三个循环

为什么人类品味仍然重要

来源说明

常见问题

什么是循环工程？

如何启动一个循环工程项目？

为什么循环工程使用 STATE.md？

什么是 Loop Ready 分数？

AI 代理循环可以无人值守运行吗？

为什么要在运行循环之前估算 token 成本？

Andrew Ng 的三循环理念与此有什么关系？

相关工具

相关链接

总结

推荐文章

2026 年最适合 SEO 的 AI 建站工具排名：We0 AI、10Web、Webflow、Framer 怎么选？

We0 SEO 文章最终草稿

We0 AI vs Wix vs Framer：做一个 SEO 友好的企业官网，到底该选谁？

为什么循环工程使用 `STATE.md`？