登錄
註冊
據 Woofun AI 消息,API7.ai 創始人溫銘在深度實踐 AI 編程後指出,當前技術瓶頸已從模型能力轉移至人類決策層面。他在 2026 年春節期間親歷了一次技術轉折:面對 Apache APISIX 中一個無法復現的棘手 bug,傳統代碼審查失效,而 AI Agent 僅憑現象描述與靜態分析,在不到 10 分鐘內精準定位問題。
這一事件確立了其核心判斷:AI 在編碼執行上已超越資深工程師,但架構設計與核心邏輯的 "Why" 仍需人類把控。近期,他個人在軟件研發中消耗了數百億 Token,這一鉅額投入並未帶來對 AI 的盲目崇拜,反而讓他確信,真正制約生產力的變量是人。溫銘強調,AI 能夠完美執行 "What" 與 "How",但在涉及技術權衡、架構抽象及核心概念判斷時,資深工程師的經驗價值不降反升。
這種認知差異直接導致了他在公司內部推行'儘量不手寫代碼'的激進策略,將 "打字" 工作完全移交 AI Agent,從而引發了一場關於工程師角色定位的深刻討論。
在組織內部推行這一策略時,阻力主要來自那些自我定位過於清晰的工程師羣體。溫銘觀察到,當工程師將自己嚴格框定在 "前端" 或 "後端" 的職能邊界內時,AI Agent 這種能夠打破邊界的工具反而成爲不適應源。以 Dashboard 開發爲例,傳統模式下需要精通前端技術、審美、性能優化、SEO 及各類框架的資深人員才能交付合格產品;而在 AI 輔助下,即使是不具備前端手寫經驗的負責人,只要清晰定義評判標準——如配色方案、CDN 資源加載策略、移動端適配要求——即可產出六七十分的產品。
這種轉變重構了產品迭代閉環:過去需要產品經理、架構師、前後端工程師多方協作數週的需求,現在由銷售或解決方案同事直接利用 AI Agent 模擬修改,在半小時內向用戶展示原型並確認需求。
這種效率的躍升並非源於工具本身,而是源於對'領地意識'的消解。溫銘建議反對者使用最強的大模型放手嘗試,以親身體驗其邊界,而非固守舊有認知。然而,反彈最強烈的羣體恰恰是最資深的工程師,他們普遍質疑 "Vibe Coding" 產出的代碼僅能作爲玩具,無法承載生產級負載。溫銘反駁稱,代碼能否上生產的關鍵不在於代碼類型,而在於指揮者是否具備清晰的架構理解、測試思維及對生產環境的敬畏之心。若缺乏對技術的追求,即便簡單的 CRUD 操作也無法通過 AI 高質量完成。
針對生產級代碼的可靠性,溫銘提出了一套嚴格的約束機制,核心原則是 "人必須參與決策"。即便 AI 的決策正確率高達 85% 至 90%,剩餘 10% 的誤差也足以導致項目質量崩塌。因此,他確立了 "看不懂的決定絕不做" 的鐵律。在名爲 AISIX 的新 AI 網關項目中,團隊重度使用 Claude Code 進行編碼,但核心概念設計、架構選型、里程碑推進及技術權衡等關鍵決策,全部保留給人類。爲了約束 AI 的輸出,團隊強制要求 AI 執行端到端測試、Dashboard 核心路徑點擊測試及完善文檔編寫。
更關鍵的是,溫銘引入了'AI 審 AI'的自動化流程:由 Claude Code 生成的代碼,會立即啓動一個全新的、獨立的 AI Agent 進行審計,形成 "寫" 與 "審" 的閉環,同時輔以 CodeRabbit 和 GitHub Copilot 進行第二層審查。
這一流程的底層邏輯在於,項目穩定性的來源並非代碼的精美程度,而是大量用戶在生產環境中的真實反饋與快速迭代。AI 的革命性在於將迭代速度推向極致:當用戶在凌晨兩點提交 Bug 時,系統首先由 AI 進行初步分析,結合版本號、場景及錯誤日誌進行靜態分析,超過一半的問題在此階段即可定位;若無法確定,AI 會自動拉起復現環境,運行對應版本的代碼與插件進行端到端測試。定位完成後,還會啓動獨立 Agent 在獨立環境中進行二次復現與 Double Check。人類工程師的角色則轉變爲優化這套自動化流程:調整提示詞、更換模型、打磨復現場景,並將經驗沉澱其中。最終拍板權仍歸人類,因爲 AI 能在 10 分鐘內完成過去需半小時至一小時的準備工作,讓人類在精力充沛時做出關鍵判斷。
Woofun AI 整理數據顯示,溫銘在使用 AI 寫軟件的過程中,經歷了從 "堆框架" 到 "扔框架" 再到 "高質量決策" 的三個演變階段。第一階段,團隊利用 ECC、Oh My OpenCode 等技能集合與提示詞集合搭建軟件工程框架,通過多個 Agent 並行推進任務,模擬指揮團隊的感覺,以此發現盲點。第二階段,隨着大模型能力的提升,團隊開始摒棄沉重的外部框架,轉而將控制權收回。此時,大模型已能自主搜索、理解並執行 "做端到端測試" 或 "優化頁面" 等指令,無需複雜的外部腳手架。溫銘認爲,此時工程師的真正價值在於將一二十年踩過的坑,沉澱爲約一百行的 agents.md 或 CLAUDE.md 文件,作爲原則與經驗庫供 AI 每次加載。
這意味着扔掉的是他人餵給的經驗,留下的是自身的核心洞察。第三階段則是從 "上癮式編碼" 轉向 "高質量決策"。在加速鍵按下後,原本每天兩三個的技術決策激增至四五十個,人類精力難以負荷。溫銘曾陷入 "上癮" 狀態:睡前佈置大任務讓 AI 整夜運行,在公司持續迭代,回家後每十幾分鍾決策一次,導致睡眠不足且決策質量下降。他最終調整節奏,將並行任務控制在五六個,僅在上午至下午三四點精力充沛時進行高質量決策,其餘時間通過閱讀、運動恢復精力,晚上與週末徹底遠離 AI。
這一調整確保了每天四五十個決策的高質量,避免了因疲勞導致的無效迭代。溫銘強調,燒掉 1 億還是 100 億 Token 並非關鍵,核心在於經驗是否沉澱進配置文件,以及高質量決策能否高效產出。
在技術架構層面,溫銘團隊基於對 AI 流量特性的深刻洞察,從零開始用 Rust 語言開發了全新的 AI 網關 AISIX,而非沿用 Apache APISIX 的 OpenResty/Lua 架構。
這一決策源於對 API 流量與 AI 流量核心概念差異的識別:API 網關關注路由、Service、Consumer 及插件,而 AI 流量的核心是 LLM Provider 與虛擬 API Key。若強行將模型合議、語義路由等 AI 特有功能套入傳統 API 網關,會顯得極不自然。AISIX 將各家大模型統一在單一 API 下,內置 Token 計量、成本控制、多模型負載均衡與 Fallback、Prompt 安全及流量可觀測性等功能,實現了處理流程的通暢。選擇 Rust 的根本原因在於 AI 流量多爲長連接的流式輸出,請求掛起時間長且併發極高,需要無 GC 停頓、單請求開銷低且延遲可預測的運行時環境,Rust 在此場景下優於傳統方案。
值得注意的是,這一痛點的發現並非源於自身需求,而是來自對行業大公司的觀察。溫銘個人使用 Claude Code Max 20 套餐,月費約 200 美金,Token 充足;但許多大公司採用 AWS Bedrock 或 Google Vertex API 按 Token 計費,月支出可達 2000 美金甚至更高。這些企業面臨的核心痛點在於成本歸屬、安全管控及流量治理。正如當年開發 Apache APISIX 一樣,產品解決的痛點往往來自對行業大批公司的洞察,而非開發者自身的直接體驗。
溫銘最後重申,同樣的模型與提示詞,不同經驗水平的決策者會導致結果天差地別:有經驗的工程師能將 AI 決策正確率從 80% 提升至 85%,而缺乏經驗者可能始終停留在 80%。在每天四五十個決策的複利效應下,1.1 的 100 次方與 1.01 的 100 次方之間的差距巨大,最終產出的軟件質量將呈現雲泥之別。