判断、执行、审核与循环:构建你的 AI 工作环境
档案头
展开档案信息
- document_type
- essay
- title
- 判断、执行、审核与循环:构建你的 AI 工作环境
- date
- 2026-06-10
- language
- zh
- author
- Wang Xiao
- source_layer
- The Uncertain Future
- status
- public_archive
- canonical_route
- /zh/uncertain-future/judgment-execution-review-and-loop-build-your-personal-ai-runtime
- source_url
- https://zhuanlan.zhihu.com/p/2048265565647664790
- intended_use
- 本文应被阅读为“测不准的未来”中的公开作者档案副本,用于保存王潇在特定时间节点对 AI、社会、协议或结构变化的判断,并保留外部发布链接。
- not_for
- 本文不应被用于正式技术证明、法律建议、投资建议、职业建议、外部认证,或作为 OathAI 当前方法层的完整表述。
- key_terms
- The Uncertain Future · Structure · Anchor · Civilization Runtime · Language as Protocol
- related_pages
- 测不准的未来 · 术语表
用目标、锚点、结构和边界,构建人机协作轨道。
《系统与自由》的核心主张,是“有界的无限”。
真正的自由,来自清晰边界内涌现出的无限。真正的边界,也是一种被他者读到、承认,并选择不越过的结构事实。
人机协作也是这样。
AI 语言模型很强,但它天生会输出漂移,并伴随幻觉、自洽性虚构和超长上下文丢失等问题。它就像是你雇了一个极度聪明、记性不算太好、手速极快、还喜欢钻牛角尖的伙计。
更麻烦的是,这个问题有一部分是胎里带的。直到现在,人类在数学上也没有完全理解大模型整体的运行原理。很多时候,我们仍然是在调参数、看输出、总结经验。规模到了某个临界线,智能会开始涌现;但为什么这样涌现,还没有被彻底解释清楚。
所以,大模型更像一项仍在高速演化的经验工程,不能当成一台完全按说明书托付的机器。
如果你对这条线感兴趣,可以读我在 OathAI 上整理的随笔档案《写在数学可以解释 AI 之前》。
你不给它目标,它不知道该做什么。 你不校准锚点,它会在一次次看似合理的优化里偏离航向。 你不给它边界,它会把你项目的复杂度扩到无法维护的程度。 你不设置循环,它会走一步就停下来问你一次接着干嘛。
所以,构建人机协作环境的关键,是搭起一个个人 AI 运行时:让 AI 进入一种有界的无限的运行状态,能持续执行、复核、修复、推进,但始终运行在目标、锚点、结构和边界锁定的轨道上。
我把这套结构称为“个人 AI 运行时”。
这里的“运行时”不指某个单独工具。它是一套工作结构:AI 在其中持续执行、互相复核,并在边界处等待人类判断。
下面直接讲如何立即搭建一个属于你的 AI 时代人机协作环境。
1. 准备你的工作入口
当前可用样例如下(2026年6月)
PC
Windows
Codex Windows App
手机 GPT App
GPT 订阅账户
这只是当前可用样例之一。你可以用 Claude、Gemini、Copilot、Grok,或者其他大模型厂商提供的类似产品。重点落在能力组合:你需要一个能读取本地目录、能持续执行任务、能保存项目上下文、能和你长期协作的 AI 工作入口。手机端负责随时记录、发起、查看和补充任务;真正读写本地目录和连续执行,仍以 PC 工作入口为主。
2. 在 PC 上建一个工作目录
把项目放进去,下面至少设三个子目录:
01_原始材料和文档区
02_AI工作文档区
03_产出物
`01_原始材料和文档区` 放你自己整理好的材料。包括笔记、手稿、截图、聊天记录、参考文档、旧版本、背景说明。这里的关键是:人先把材料放进一个可读空间里。让 AI 可以读到最原始的事实基础。
`02_AI工作文档区` 这是 AI 会自动维护的工作目录。比如协作说明、项目记忆、任务协议、术语表、循环规则、审核清单。你也可以亲自审核修订这里的每一份文档。
`03_产出物` 放最终产物。文章、方案、翻译稿、网页文案、发布版本、交付文件,都放这里。这样可以避免 AI 陷入不必要的语义混淆中,保持边界的清晰感。
3. 写一份起步版人机协作规则
接下来,你需要写一份最简单的人机协作规则说明书。
不需要很复杂,只写最重要的部分:
你希望 AI 怎么做。
你禁止 AI 怎么做。
哪些事情必须先问你。
哪些材料不能擅自发布。
哪些事实口径不能擅自改变。
输出物应该放在哪里。
做完以后怎么自检。
遇到什么情况必须停下来。
这份规则无需一次写完,它会在过程中不断完善,逐渐变成你的操作系统。
比如,你可以先写清楚:
不要擅自改变项目目标。
不要擅自重写作者立场。
不要为了顺滑牺牲原始判断。
不要把未确认材料当成公开事实。
遇到新目标、新边界、新公开含义,必须停下来等待人类判断。
这一步很重要。AI 最危险的地方,往往在于它太会把事情做得“看起来合理”。规则说明书就是你给它写下的第一圈边界。
4. 建立三个项目对话
然后在 PC Codex APP 里建立项目对话,并把工作目录指向刚才设置好的工作目录。
我建议至少建三个对话:
讨论对话
执行对话
审核对话
讨论对话负责理解材料、拆目标、设计方案。你在这里和它对齐目标,锚点,结构和边界。
执行对话负责按方案推进任务。它不负责重新发明方向,而是在确认过的结构里连续执行。
审核对话负责挑错、查漏、指出风险。审核流程非常重要,绝对不要忽略这个步骤。
最小可行方式很简单:三个对话共享同一个工作目录;讨论对话产出任务卡;人把任务卡交给执行对话;执行结果再交给审核对话。等你熟练以后,再考虑让对话之间自动转交。
这三个对话使用同一个工作目录,角色分工不同。这样可以把判断、执行和审核拆开,保持边界清晰,也避免对话上下文膨胀失控。
5. 第一次对话是初始化工作环境
不要一上来就让 AI 干活。先让讨论对话读你的协作规则,再读 `01_原始材料和文档区`。
你可以这样指示它:
请先读取工作目录中的协作规则和原始材料。建立项目背景上下文。
或
先理解这个项目是什么、材料有哪些、目标是什么、已有口径是什么、哪些地方不能擅自改动。
这一步的目的,是让 AI 从“临时问答状态”进入“项目理解状态”。
很多人用 AI 出问题,就是因为每次都从一句孤立 prompt 开始。AI 不知道你的历史,不知道你的禁区,不知道你的长期目标,也不知道哪些表述已经被你确认过。它只能在当前窗口里漂给你看。
6. 让讨论对话生成人机协作环境四件套
至此,可以开始让 AI 生成人机协作环境四件套了:
AGENTS:AI 行为说明书
MEMORY:项目长期记忆
Protocol:任务执行协议
LOOP:循环推进机制
这四份文件可以从我的个人 AI 运行时开源模板起步。
你要做的是把模板交给 AI,再提供原始材料、目标和边界,让讨论对话生成适合你项目的第一版,然后你只审核关键判断。
`AGENTS` 是这个工作区里的 AI 行为说明。它告诉 AI:你在这里是谁,应该怎么工作,默认遵守什么风格,遇到什么情况要停。
`MEMORY` 是长期项目记忆。它记录项目事实、作者偏好、关键术语、当前状态、已经确认过的判断,避免 AI 反复问你重复问题。
`Protocol` 是任务执行规则。它规定任务怎么接,材料怎么读,输出怎么放,完成后怎么检查,哪些情况可以继续,哪些情况必须交给人类做判断。
`LOOP` 是循环机制。它规定讨论、执行、审核、修复、继续之间怎么交接。没有 LOOP,AI 很容易做完一步就停在那里。
如果你用 Codex 这类可以读取本地目录的工作环境,文件名可以直接写成这样:
AGENTS.md
MEMORY.md
TASK_PROTOCOL.md
LOOP.md
每份文档先有最低内容就够:
AGENTS.md:角色、默认行为、禁止事项、停机规则。
MEMORY.md:项目背景、核心术语、已确认判断、当前状态。
TASK_PROTOCOL.md:任务怎么接、输入是什么、输出放哪里、怎么验收。
LOOP.md:讨论 -> 执行 -> 审核 -> 修复 -> 更新记忆 -> 继续。
谁来维护,也要写清楚:
讨论对话:主要更新 MEMORY、TASK_PROTOCOL、LOOP。
执行对话:按 TASK_PROTOCOL 工作,必要时更新任务记录和产出物。
审核对话:只提出 findings,不擅自改目标和锚点。
人类:最终确认 AGENTS、边界、公开口径和重大方向变化。
这四件套生成以后,你的人机协作环境就完成了最小可用版本的搭建。
但骨架搭好以后,还需要跑一次试运行。
7. 跑一次最小闭环
第一次不要选大任务。选一个很小、可验证、能产出文件的任务。
比如:
请根据 01_原始材料和文档区中的材料,
生成一份 800 字以内的项目简介,
放到 03_产出物。
让讨论对话先生成任务卡。任务卡里至少写清楚:
目标是什么。
输入材料在哪里。
输出文件放在哪里。
验收标准是什么。
哪些地方不能擅自判断。
然后把任务卡交给执行对话。执行对话完成后,把产出文件交给审核对话。审核对话只做一件事:指出它是否偏离目标、锚点、结构和边界。
如果审核发现问题,再让执行对话修复。修复完成后,让讨论对话把这次新确认的规则或经验更新到 `MEMORY.md` 或 `LOOP.md`。
到这里,你已经从“建了几个文件”,走到真正跑完一次:
讨论 -> 执行 -> 审核 -> 修复 -> 更新记忆
这个闭环跑通以后,一个面向未来的人机协作工作环境才真正活起来。
8. 回看这套结构
这套方法可以先压缩成四个锁定点:
目标
锚点
结构
边界
也可以展开成四个动作:
判断
执行
审核
循环
目标回答:这次到底要完成什么。
锚点回答:哪些判断、事实、风格、立场不能漂。
结构回答:任务怎么拆,材料怎么放,角色怎么分,结果怎么交付。彼此的关系是什么?
边界回答:哪些事情不能做,哪些材料不能公开,哪些口径不能改,哪些决定必须由人类确认。
人类负责这些东西。
AI 负责什么?
AI 负责读取材料、整理信息、生成方案、执行任务、自检结果、提交审核、修复问题、更新工作文档,并在已经确认的轨道里继续推进。
这就是面向未来的人机协作方式。
人类不再盯每一步执行,也不应该退化成确认按钮。人类负责锁定目标、锚点、结构和边界。AI 负责在这个轨道里连续工作。
9. 为什么需要审核对话
很多人会问:既然主 AI 已经能自检,为什么还要另一个审核对话?
原因很简单:执行和审核必须拆开。
没有审核层的人机协作,本质上只是把一个会漂移的输出系统接进了你的工作流。
一个负责推进,一个负责挑错。一个负责把事情做完,一个负责检查它有没有偏离目标、有没有偷换概念、有没有引入多余复杂度、有没有遗漏风险。
这是给 AI 分工。
人类团队里也一样。写作者和编辑处在不同位置,工程师和 reviewer 也处在不同位置。人机协作进入工作环境之后,也需要类似的结构。
审核对话尤其要盯这些问题:
目标有没有被悄悄改掉。
锚点有没有漂。
结构有没有被过度扩张。
边界有没有被越过。
事实口径有没有变化。
公开表达有没有产生新的含义。
输出物是否真的符合任务。
这一步决定了 AI 工作循环能不能长期稳定可靠运行不漂移。
10. 什么时候必须停下来问人
AI 可以连续推进,但不能无限奔跑。
我会把这些情况写进停止规则:
出现新目标。
出现新结构。
出现新边界。
出现新锚点。
需要改变事实口径。
需要改变作者立场。
需要发布原始材料。
输出会产生新的公开含义。
涉及法律、版权、声誉、交易、资金等不可逆后果。
这些地方必须停下来交给人类做判断。
这些属于判断问题。判断不能外包给模型。模型可以帮你分析选项,但最后的判断必须由人确定。
11. 真正的变化
这套方法带来的真正变化,超出了“让 AI 多做几个任务”。
真正的变化是:你开始构建自己的个人 AI 运行时。
这里的运行时,指向一套工作结构:人类负责判断、目标、锚点和边界;AI 负责在轨道内连续推进;审核层负责防止漂移、偷换和复杂度膨胀。
过去,我们把 AI 当助手,所以工作方式是:
人提问
AI 回答
人再追问
AI 再回答
这种方式当然有用,但它很容易把人变成一个不断补充上下文、不断按确认键、不断救偏航的操作员。
未来的人机协作,应该是另一种结构:
人确认目标、锚点、结构、边界。
AI 执行、复核、转交、修复、继续推进。
审核 AI 持续挑错。
主 AI 不退出循环,直到遇到新的判断点。
这恰恰是在给 AI 建立可控的运行轨道,避免它失控地全自动运行。
没有边界的 AI 自动化,只会把模型的漂移、幻觉、局部优化和复杂度膨胀带进你的工作。
被目标、锚点、结构和边界锁定以后,AI 才能从一个聪明的聊天窗口,变成一个可以持续推进的工作循环。
未来的个人工作环境,不会只是一个更聪明的对话框。
它会是一组能持续执行、互相复核、在边界处等待人类判断的 AI 运行时。
有界,才可能无限。
作者简介
王潇(Wang Xiao)是 AI 协议架构师、《系统和自由》作者,Danbing AI Protocol / SLAPS Framework 创造者,OathAI 发起人。
他的工作围绕 human-AI co-creation(人机共创)、protocol governance(协议治理)、semantic anchoring(语义锚定)与 long-term knowledge continuity(长期知识连续性)展开,关注如何在 AI 时代保存、校准并继承人类知识与协作结构。
免责声明
本文为作者基于个人实践、研究和人机协作经验形成的阶段性观察与方法总结。相关 Danbing / SLAPS / OathAI 方法仍在持续整理和演化中,具体应用效果会受到使用者背景、任务场景、模型能力、执行环境和投入程度影响。
本文不构成法律、投资、医疗、职业或技术实施保证。读者如将相关方法用于实际项目,应结合自身情况独立判断,并对具体使用结果负责。