登录
注册
据 Woofun AI 消息,英伟达创始人黄仁勋近期明确提出'Nobody writes prompts anymore. The new job is to write and handle loops',宣告 Prompt 时代的终结与 Loop 新范式的崛起。
这一论断迅速引发行业震动,Peter、Boris Cherny、吴恩达等顶尖技术领袖纷纷响应,共同推动从指令式交互向系统化循环管理的根本性转变。核心逻辑在于将人类角色从流程执行者转变为规则设计者,构建能够自主运行、自我验收并持续迭代的智能系统。
这种转变并非单纯的概念炒作,而是基于当前大模型能力跃升与工程实践需求的必然演进,标志着 AI 应用进入全自动化闭环的新阶段。
要深入理解 Loop 的本质,必须首先解构过去两年 AI 编程的标准范式。传统模式下,开发者需手动编写 Prompt,等待 AI 生成代码,人工审查后若不满意则再次编写 Prompt 进行修正,如此反复拉锯,人类全程深度介入每一个环节。卡帕西曾尖锐指出'人就是瓶颈',并强调不能坐在那里等待为每一步编写 Prompt,必须将自身从流程中抽离。Loop 正是为了解决这一痛点而生,其核心机制极为简洁:人类仅需定义最终目标,AI 系统随即启动自主运行,完成代码编写后自动进行验收,若未通过则携带报错信息重新迭代,直至满足验收条件或触及预算上限才停止。在此架构下,人类不再充当'传话人',而是升级为'规则设计者',负责设定边界与标准,而非干预具体执行细节。
针对 Loop 与 Agent 概念的混淆,必须厘清二者在系统架构中的不同定位。Agent 本质上是执行具体任务的智能体,类似于干活的人;而 Loop 则是确保 Agent 能够持续、自主工作的管理机制,是让这个人无需人工盯着也能持续运转的系统。缺乏 Loop 支撑的 Agent,本质上仍是'提一句动一下'的被动工具,依赖人类指令触发;而套上 Loop 的 Agent,则进化为具备自转能力的完整系统,能够独立处理复杂任务流。
这种区别决定了 AI 系统能否真正从辅助工具跃升为自主生产力,是衡量 AI 工程化成熟度的关键指标。当前行业共识认为,真正的差距已不在模型本身,而在于上层 Loop 的编排能力与系统设计水平。
在产品落地层面,Loop 已形成'双雄对峙'的竞争格局,分别由 Claude Code 与 OpenAI Codex 代表两种不同的技术路径。Claude Code 围绕 Loop 构建了三大核心功能模块:/loop 负责定时循环执行,/goal 负责目标驱动直至验收条件满足,/schedule 负责云端定时任务以确保合上电脑也能持续运行。其中/goal 的设计尤为精妙,它体现了 Loop 最关键的原则——自己不能判自己的卷子。Claude Code 将这一原则直接写入产品架构,由大模型负责代码编写,而由独立的 Haiku 小模型负责验收,两个模型各司其职,确保验收过程具备真实约束力,避免 Agent 自我打分时的宽松倾向。OpenAI Codex 则采取了'自动化流水线 + 目标驱动 + 多个子 Agent'的组合策略,在实际开发场景中,最多可支持 8 个 Agent 同时在各自隔离的云端沙箱中并行工作,各自处理不同任务后统一汇总结果。
尽管两家实现路径存在差异,但最终呈现的系统形态高度趋同,均是将复杂任务拆解后分发给多个 Agent 并行处理,再统一整合输出。公开评测与社区反馈显示,两者在性能表现上已非常接近,进一步印证了模型能力趋同背景下,Loop 编排成为决定性因素。
Boris Cherny 作为 Claude Code 的核心推动者,其工作模式生动诠释了 Loop 的终极形态。他自述于去年 11 月彻底卸载了 IDE,并在随后一个月内未再打开,最终选择直接删除。目前他管理着数百个同时运行的微型 Agent,部分负责扫描 GitHub issue,部分读取 Slack 上的用户反馈,还有部分监控 CI 失败情况。每个 Agent 在独立的代码分支中作业,一个负责编写代码,另一个负责运行测试验收,只有遇到无法解决的问题时才会进入他的收件箱等待人工判断。据其透露,自 Opus 4.5 以来,其所有代码均由 Claude Code 生成,如今大部分开发工作甚至直接在手机上完成。整个流程中,Agent 之间通过循环互相提示,中间无需任何人工审核环节。
这种工作模式清晰表明,Loop 的终极目标是让人类不再编写代码或 Prompt,仅专注于规则制定与关键判断,其余全部交由系统自动完成。
针对如何构建高效 Loop 系统,X 平台博主 Codez 总结了一份 14 步实操路线图,其中包含若干关键原则。第一步是进行'4 条件测试',在建立 Loop 前必须确认任务是否重复发生、是否存在自动化验收手段、Token 预算是否充足、Agent 是否具备'高级工程师'级别的工具能力,四个条件全部满足才值得投入建设。第二步强调从最小可行 Loop 起步,构建包含触发器、技能、状态文件与门禁的四件套系统。触发器可采用定时或事件驱动方式,技能需将项目上下文写入 STATE.md 以避免重复解释,状态文件用 Markdown 记录进度与结果,门禁则通过测试、类型检查与构建自动拦截错误结果。执行顺序至关重要:先手动跑通一次,再封装为 Skill,随后纳入 Loop,最后才启用定时任务,跳步是导致 Loop 在生产环境失败的主要原因。第三步重申'拆卷子'原则,即代码编写与验收必须由不同模型或子 Agent 独立完成,验收方不得知晓编写方的推理过程,以防止自我评分时的宽松倾向。第四步提供避坑指南,包括设置硬停止条件以防 Token 超支、将状态持久化至文件以避免记忆丢失、避免让 Loop 处理需要人类判断的复杂决策、以及定期阅读 Diff 以维持对代码库的理解力。第五步明确衡量指标,唯一有效的标准是每个被接受改动的平均成本,若接受率低于 50%,说明 Loop 未能有效替代人工评审,反而造成资源浪费。
Loop 概念的爆发并非偶然,而是 AI 工程化演进的自然结果。回顾时间线可发现清晰的四次范式迁移:从 2023 至 2024 年的 Prompt Engineering 时代,关注点在于如何编写优质提示词以引导 AI 输出;到 2024 至 2025 年的 Context Engineering 阶段,重心转向如何提供完整背景信息以增强 AI 理解;再到 2025 至 2026 年的 Harness Engineering 时期,重点在于构建能让 AI 调用工具、执行代码、访问资源的运行环境;最终演进为当前的 Loop Engineering,核心解决 AI 能否在环境中持续自主推进任务的问题。
这一过程体现了人类对 AI 控制粒度的不断上移,从'写一句话'到'提供信息',再到'搭建系统',最终达到'设计循环',是一个逐步解放人类双手的连续演进路径。Woofun AI 整理数据显示,这一技术路线的成熟度提升速度远超预期,短短数周内已从学术概念转化为工业界主流实践。
从学术视角审视,Loop 理念早有渊源,其核心思想可追溯至姚顺雨 2022 年提出的 ReAct 框架。该工作在 ICLR 2023 获得 Oral 级别认可,并积累上万引用量,首次系统性地将'推理'与'行动'绑定为循环过程。ReAct 使大模型不再一次性输出答案,而是遵循'思考→行动→观察→再思考→再行动'的循环结构,这本质上是最早被系统化表达的'agent loop'雏形。后续研究如 Reflexion 引入从错误中学习的反馈机制,Tree of Thoughts 扩展为多路径搜索式推理,一系列 tool-use agent 工作逐步完善'规划 + 执行 + 反馈'的完整链路。这些学术成果层层递进,最终在工程界收敛为今天的 Loop 系统。因此,Loop 并非某一个人的发明,而是一条经过长期技术积累逐步收敛的演进路径,恰好在此时由华人学者站在关键节点上推动了其工业化落地。
尽管 Loop Engineering 展现出巨大潜力,但行业内部仍存在理性声音。Google 工程主管 Addy Osmani 作为该概念的命名者,在《loop Engineering》长文中明确表示'还很早期,我持保留态度',并特别强调 token 成本必须谨慎控制。卡帕西在红杉资本 AI Ascent 2026 大会上引用了一句发人深省的话:'你可以外包你的思考,但你没法外包你的理解。'这句话深刻揭示了 Loop 时代的本质矛盾:AI 可以替代人类进行方案构思与执行,但人类必须保持对问题本质的深刻理解。这或许是当前 Loop 热潮中最清醒的警示,提醒从业者在追求自动化效率的同时,不可忽视人类认知的核心价值。从 Prompt 到 Loop 的演进速度之快令人惊叹,但技术变革带来的不仅是效率提升,更是对人类角色重新定义的深刻挑战。