登錄
註冊
據 Woofun AI 消息,英偉達創始人黃仁勳近期明確提出'Nobody writes prompts anymore. The new job is to write and handle loops',宣告 Prompt 時代的終結與 Loop 新範式的崛起。
這一論斷迅速引發行業震動,Peter、Boris Cherny、吳恩達等頂尖技術領袖紛紛響應,共同推動從指令式交互向系統化循環管理的根本性轉變。核心邏輯在於將人類角色從流程執行者轉變爲規則設計者,構建能夠自主運行、自我驗收並持續迭代的智能系統。
這種轉變並非單純的概念炒作,而是基於當前大模型能力躍升與工程實踐需求的必然演進,標誌着 AI 應用進入全自動化閉環的新階段。
要深入理解 Loop 的本質,必須首先解構過去兩年 AI 編程的標準範式。傳統模式下,開發者需手動編寫 Prompt,等待 AI 生成代碼,人工審查後若不滿意則再次編寫 Prompt 進行修正,如此反覆拉鋸,人類全程深度介入每一個環節。卡帕西曾尖銳指出'人就是瓶頸',並強調不能坐在那裏等待爲每一步編寫 Prompt,必須將自身從流程中抽離。Loop 正是爲了解決這一痛點而生,其核心機制極爲簡潔:人類僅需定義最終目標,AI 系統隨即啓動自主運行,完成代碼編寫後自動進行驗收,若未通過則攜帶報錯信息重新迭代,直至滿足驗收條件或觸及預算上限才停止。在此架構下,人類不再充當'傳話人',而是升級爲'規則設計者',負責設定邊界與標準,而非干預具體執行細節。
針對 Loop 與 Agent 概念的混淆,必須釐清二者在系統架構中的不同定位。Agent 本質上是執行具體任務的智能體,類似於幹活的人;而 Loop 則是確保 Agent 能夠持續、自主工作的管理機制,是讓這個人無需人工盯着也能持續運轉的系統。缺乏 Loop 支撐的 Agent,本質上仍是'提一句動一下'的被動工具,依賴人類指令觸發;而套上 Loop 的 Agent,則進化爲具備自轉能力的完整系統,能夠獨立處理複雜任務流。
這種區別決定了 AI 系統能否真正從輔助工具躍升爲自主生產力,是衡量 AI 工程化成熟度的關鍵指標。當前行業共識認爲,真正的差距已不在模型本身,而在於上層 Loop 的編排能力與系統設計水平。
在產品落地層面,Loop 已形成'雙雄對峙'的競爭格局,分別由 Claude Code 與 OpenAI Codex 代表兩種不同的技術路徑。Claude Code 圍繞 Loop 構建了三大核心功能模塊:/loop 負責定時循環執行,/goal 負責目標驅動直至驗收條件滿足,/schedule 負責雲端定時任務以確保合上電腦也能持續運行。其中/goal 的設計尤爲精妙,它體現了 Loop 最關鍵的原則——自己不能判自己的卷子。Claude Code 將這一原則直接寫入產品架構,由大模型負責代碼編寫,而由獨立的 Haiku 小模型負責驗收,兩個模型各司其職,確保驗收過程具備真實約束力,避免 Agent 自我打分時的寬鬆傾向。OpenAI Codex 則採取了'自動化流水線 + 目標驅動 + 多個子 Agent'的組合策略,在實際開發場景中,最多可支持 8 個 Agent 同時在各自隔離的雲端沙箱中並行工作,各自處理不同任務後統一彙總結果。
儘管兩家實現路徑存在差異,但最終呈現的系統形態高度趨同,均是將複雜任務拆解後分發給多個 Agent 並行處理,再統一整合輸出。公開評測與社區反饋顯示,兩者在性能表現上已非常接近,進一步印證了模型能力趨同背景下,Loop 編排成爲決定性因素。
Boris Cherny 作爲 Claude Code 的核心推動者,其工作模式生動詮釋了 Loop 的終極形態。他自述於去年 11 月徹底卸載了 IDE,並在隨後一個月內未再打開,最終選擇直接刪除。目前他管理着數百個同時運行的微型 Agent,部分負責掃描 GitHub issue,部分讀取 Slack 上的用戶反饋,還有部分監控 CI 失敗情況。每個 Agent 在獨立的代碼分支中作業,一個負責編寫代碼,另一個負責運行測試驗收,只有遇到無法解決的問題時纔會進入他的收件箱等待人工判斷。據其透露,自 Opus 4.5 以來,其所有代碼均由 Claude Code 生成,如今大部分開發工作甚至直接在手機上完成。整個流程中,Agent 之間通過循環互相提示,中間無需任何人工審覈環節。
這種工作模式清晰表明,Loop 的終極目標是讓人類不再編寫代碼或 Prompt,僅專注於規則制定與關鍵判斷,其餘全部交由系統自動完成。
針對如何構建高效 Loop 系統,X 平臺博主 Codez 總結了一份 14 步實操路線圖,其中包含若干關鍵原則。第一步是進行'4 條件測試',在建立 Loop 前必須確認任務是否重複發生、是否存在自動化驗收手段、Token 預算是否充足、Agent 是否具備'高級工程師'級別的工具能力,四個條件全部滿足才值得投入建設。第二步強調從最小可行 Loop 起步,構建包含觸發器、技能、狀態文件與門禁的四件套系統。觸發器可採用定時或事件驅動方式,技能需將項目上下文寫入 STATE.md 以避免重複解釋,狀態文件用 Markdown 記錄進度與結果,門禁則通過測試、類型檢查與構建自動攔截錯誤結果。執行順序至關重要:先手動跑通一次,再封裝爲 Skill,隨後納入 Loop,最後才啓用定時任務,跳步是導致 Loop 在生產環境失敗的主要原因。第三步重申'拆卷子'原則,即代碼編寫與驗收必須由不同模型或子 Agent 獨立完成,驗收方不得知曉編寫方的推理過程,以防止自我評分時的寬鬆傾向。第四步提供避坑指南,包括設置硬停止條件以防 Token 超支、將狀態持久化至文件以避免記憶丟失、避免讓 Loop 處理需要人類判斷的複雜決策、以及定期閱讀 Diff 以維持對代碼庫的理解力。第五步明確衡量指標,唯一有效的標準是每個被接受改動的平均成本,若接受率低於 50%,說明 Loop 未能有效替代人工評審,反而造成資源浪費。
Loop 概念的爆發並非偶然,而是 AI 工程化演進的自然結果。回顧時間線可發現清晰的四次範式遷移:從 2023 至 2024 年的 Prompt Engineering 時代,關注點在於如何編寫優質提示詞以引導 AI 輸出;到 2024 至 2025 年的 Context Engineering 階段,重心轉向如何提供完整背景信息以增強 AI 理解;再到 2025 至 2026 年的 Harness Engineering 時期,重點在於構建能讓 AI 調用工具、執行代碼、訪問資源的運行環境;最終演進爲當前的 Loop Engineering,核心解決 AI 能否在環境中持續自主推進任務的問題。
這一過程體現了人類對 AI 控制粒度的不斷上移,從'寫一句話'到'提供信息',再到'搭建系統',最終達到'設計循環',是一個逐步解放人類雙手的連續演進路徑。Woofun AI 整理數據顯示,這一技術路線的成熟度提升速度遠超預期,短短數週內已從學術概念轉化爲工業界主流實踐。
從學術視角審視,Loop 理念早有淵源,其核心思想可追溯至姚順雨 2022 年提出的 ReAct 框架。該工作在 ICLR 2023 獲得 Oral 級別認可,並積累上萬引用量,首次系統性地將'推理'與'行動'綁定爲循環過程。ReAct 使大模型不再一次性輸出答案,而是遵循'思考→行動→觀察→再思考→再行動'的循環結構,這本質上是最早被系統化表達的'agent loop'雛形。後續研究如 Reflexion 引入從錯誤中學習的反饋機制,Tree of Thoughts 擴展爲多路徑搜索式推理,一系列 tool-use agent 工作逐步完善'規劃 + 執行 + 反饋'的完整鏈路。這些學術成果層層遞進,最終在工程界收斂爲今天的 Loop 系統。因此,Loop 並非某一個人的發明,而是一條經過長期技術積累逐步收斂的演進路徑,恰好在此時由華人學者站在關鍵節點上推動了其工業化落地。
儘管 Loop Engineering 展現出巨大潛力,但行業內部仍存在理性聲音。Google 工程主管 Addy Osmani 作爲該概念的命名者,在《loop Engineering》長文中明確表示'還很早期,我持保留態度',並特別強調 token 成本必須謹慎控制。卡帕西在紅杉資本 AI Ascent 2026 大會上引用了一句發人深省的話:'你可以外包你的思考,但你沒法外包你的理解。'這句話深刻揭示了 Loop 時代的本質矛盾:AI 可以替代人類進行方案構思與執行,但人類必須保持對問題本質的深刻理解。這或許是當前 Loop 熱潮中最清醒的警示,提醒從業者在追求自動化效率的同時,不可忽視人類認知的核心價值。從 Prompt 到 Loop 的演進速度之快令人驚歎,但技術變革帶來的不僅是效率提升,更是對人類角色重新定義的深刻挑戰。