黄仁勋断言 Prompt 已死：Loop 如何重塑 AI 工作流

2026-06-25 22:09

据 Woofun AI 消息，英伟达创始人黄仁勋近期明确提出'Nobody writes prompts anymore. The new job is to write and handle loops'，宣告 Prompt 时代的终结与 Loop 新范式的崛起。

这一论断迅速引发行业震动，Peter、Boris Cherny、吴恩达等顶尖技术领袖纷纷响应，共同推动从指令式交互向系统化循环管理的根本性转变。核心逻辑在于将人类角色从流程执行者转变为规则设计者，构建能够自主运行、自我验收并持续迭代的智能系统。

这种转变并非单纯的概念炒作，而是基于当前大模型能力跃升与工程实践需求的必然演进，标志着 AI 应用进入全自动化闭环的新阶段。

要深入理解 Loop 的本质，必须首先解构过去两年 AI 编程的标准范式。传统模式下，开发者需手动编写 Prompt，等待 AI 生成代码，人工审查后若不满意则再次编写 Prompt 进行修正，如此反复拉锯，人类全程深度介入每一个环节。卡帕西曾尖锐指出'人就是瓶颈'，并强调不能坐在那里等待为每一步编写 Prompt，必须将自身从流程中抽离。Loop 正是为了解决这一痛点而生，其核心机制极为简洁：人类仅需定义最终目标，AI 系统随即启动自主运行，完成代码编写后自动进行验收，若未通过则携带报错信息重新迭代，直至满足验收条件或触及预算上限才停止。在此架构下，人类不再充当'传话人'，而是升级为'规则设计者'，负责设定边界与标准，而非干预具体执行细节。

针对 Loop 与 Agent 概念的混淆，必须厘清二者在系统架构中的不同定位。Agent 本质上是执行具体任务的智能体，类似于干活的人；而 Loop 则是确保 Agent 能够持续、自主工作的管理机制，是让这个人无需人工盯着也能持续运转的系统。缺乏 Loop 支撑的 Agent，本质上仍是'提一句动一下'的被动工具，依赖人类指令触发；而套上 Loop 的 Agent，则进化为具备自转能力的完整系统，能够独立处理复杂任务流。

这种区别决定了 AI 系统能否真正从辅助工具跃升为自主生产力，是衡量 AI 工程化成熟度的关键指标。当前行业共识认为，真正的差距已不在模型本身，而在于上层 Loop 的编排能力与系统设计水平。

在产品落地层面，Loop 已形成'双雄对峙'的竞争格局，分别由 Claude Code 与 OpenAI Codex 代表两种不同的技术路径。Claude Code 围绕 Loop 构建了三大核心功能模块：/loop 负责定时循环执行，/goal 负责目标驱动直至验收条件满足，/schedule 负责云端定时任务以确保合上电脑也能持续运行。其中/goal 的设计尤为精妙，它体现了 Loop 最关键的原则——自己不能判自己的卷子。Claude Code 将这一原则直接写入产品架构，由大模型负责代码编写，而由独立的 Haiku 小模型负责验收，两个模型各司其职，确保验收过程具备真实约束力，避免 Agent 自我打分时的宽松倾向。OpenAI Codex 则采取了'自动化流水线 + 目标驱动 + 多个子 Agent'的组合策略，在实际开发场景中，最多可支持 8 个 Agent 同时在各自隔离的云端沙箱中并行工作，各自处理不同任务后统一汇总结果。

尽管两家实现路径存在差异，但最终呈现的系统形态高度趋同，均是将复杂任务拆解后分发给多个 Agent 并行处理，再统一整合输出。公开评测与社区反馈显示，两者在性能表现上已非常接近，进一步印证了模型能力趋同背景下，Loop 编排成为决定性因素。

Boris Cherny 作为 Claude Code 的核心推动者，其工作模式生动诠释了 Loop 的终极形态。他自述于去年 11 月彻底卸载了 IDE，并在随后一个月内未再打开，最终选择直接删除。目前他管理着数百个同时运行的微型 Agent，部分负责扫描 GitHub issue，部分读取 Slack 上的用户反馈，还有部分监控 CI 失败情况。每个 Agent 在独立的代码分支中作业，一个负责编写代码，另一个负责运行测试验收，只有遇到无法解决的问题时才会进入他的收件箱等待人工判断。据其透露，自 Opus 4.5 以来，其所有代码均由 Claude Code 生成，如今大部分开发工作甚至直接在手机上完成。整个流程中，Agent 之间通过循环互相提示，中间无需任何人工审核环节。

这种工作模式清晰表明，Loop 的终极目标是让人类不再编写代码或 Prompt，仅专注于规则制定与关键判断，其余全部交由系统自动完成。

针对如何构建高效 Loop 系统，X 平台博主 Codez 总结了一份 14 步实操路线图，其中包含若干关键原则。第一步是进行'4 条件测试'，在建立 Loop 前必须确认任务是否重复发生、是否存在自动化验收手段、Token 预算是否充足、Agent 是否具备'高级工程师'级别的工具能力，四个条件全部满足才值得投入建设。第二步强调从最小可行 Loop 起步，构建包含触发器、技能、状态文件与门禁的四件套系统。触发器可采用定时或事件驱动方式，技能需将项目上下文写入 STATE.md 以避免重复解释，状态文件用 Markdown 记录进度与结果，门禁则通过测试、类型检查与构建自动拦截错误结果。执行顺序至关重要：先手动跑通一次，再封装为 Skill，随后纳入 Loop，最后才启用定时任务，跳步是导致 Loop 在生产环境失败的主要原因。第三步重申'拆卷子'原则，即代码编写与验收必须由不同模型或子 Agent 独立完成，验收方不得知晓编写方的推理过程，以防止自我评分时的宽松倾向。第四步提供避坑指南，包括设置硬停止条件以防 Token 超支、将状态持久化至文件以避免记忆丢失、避免让 Loop 处理需要人类判断的复杂决策、以及定期阅读 Diff 以维持对代码库的理解力。第五步明确衡量指标，唯一有效的标准是每个被接受改动的平均成本，若接受率低于 50%，说明 Loop 未能有效替代人工评审，反而造成资源浪费。

Loop 概念的爆发并非偶然，而是 AI 工程化演进的自然结果。回顾时间线可发现清晰的四次范式迁移：从 2023 至 2024 年的 Prompt Engineering 时代，关注点在于如何编写优质提示词以引导 AI 输出；到 2024 至 2025 年的 Context Engineering 阶段，重心转向如何提供完整背景信息以增强 AI 理解；再到 2025 至 2026 年的 Harness Engineering 时期，重点在于构建能让 AI 调用工具、执行代码、访问资源的运行环境；最终演进为当前的 Loop Engineering，核心解决 AI 能否在环境中持续自主推进任务的问题。

这一过程体现了人类对 AI 控制粒度的不断上移，从'写一句话'到'提供信息'，再到'搭建系统'，最终达到'设计循环'，是一个逐步解放人类双手的连续演进路径。Woofun AI 整理数据显示，这一技术路线的成熟度提升速度远超预期，短短数周内已从学术概念转化为工业界主流实践。

从学术视角审视，Loop 理念早有渊源，其核心思想可追溯至姚顺雨 2022 年提出的 ReAct 框架。该工作在 ICLR 2023 获得 Oral 级别认可，并积累上万引用量，首次系统性地将'推理'与'行动'绑定为循环过程。ReAct 使大模型不再一次性输出答案，而是遵循'思考→行动→观察→再思考→再行动'的循环结构，这本质上是最早被系统化表达的'agent loop'雏形。后续研究如 Reflexion 引入从错误中学习的反馈机制，Tree of Thoughts 扩展为多路径搜索式推理，一系列 tool-use agent 工作逐步完善'规划 + 执行 + 反馈'的完整链路。这些学术成果层层递进，最终在工程界收敛为今天的 Loop 系统。因此，Loop 并非某一个人的发明，而是一条经过长期技术积累逐步收敛的演进路径，恰好在此时由华人学者站在关键节点上推动了其工业化落地。

尽管 Loop Engineering 展现出巨大潜力，但行业内部仍存在理性声音。Google 工程主管 Addy Osmani 作为该概念的命名者，在《loop Engineering》长文中明确表示'还很早期，我持保留态度'，并特别强调 token 成本必须谨慎控制。卡帕西在红杉资本 AI Ascent 2026 大会上引用了一句发人深省的话：'你可以外包你的思考，但你没法外包你的理解。'这句话深刻揭示了 Loop 时代的本质矛盾：AI 可以替代人类进行方案构思与执行，但人类必须保持对问题本质的深刻理解。这或许是当前 Loop 热潮中最清醒的警示，提醒从业者在追求自动化效率的同时，不可忽视人类认知的核心价值。从 Prompt 到 Loop 的演进速度之快令人惊叹，但技术变革带来的不仅是效率提升，更是对人类角色重新定义的深刻挑战。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

WOOFUN.AI 你的加密智能助理。以智能技术重构加密体验，化繁为简，打破专业门槛，让每个人都能安心、聪明、快乐地拥抱数字未来。

iOS

Google Play

Android Apk

市场生态 Alpha 失乐园评级资讯快讯日历交易所钱包