>
正文
思維機器吳麗蓮稱擴展定律未失效但傳統堆算力方法走入死衚衕
2026-06-26 13:29

據 Woofun AI 消息,思維機器聯合創始人兼首席科學家吳麗蓮發表長文探討人工智能行業的“擴展定律”。面對業界關於網絡數據耗盡導致‘數據瓶頸’的質疑,吳麗蓮認爲擴展定律本身並未失效,但單純堆疊計算資源的傳統路徑已陷入困境,亟需轉向兼顧數據限制、重複訓練及過擬合問題的精細建模方法。

吳麗蓮指出,行業已從早期依賴 Kaplan 定律增加參數,過渡至遵循 Chinchilla 定律按比例增長參數與數據量。針對高質量數據稀缺現狀,近期研究如 Muennighoff 等人證實重複訓練數據價值呈指數級下降,Lovelace 等人在2026年量化分析了模型參數與唯一數據量之比($N/U_D$)對過擬合的影響,並驗證了增強型權重衰減等正則化技術的有效性。

吳麗蓮強調,擴展定律並非物理定律,而是對工程細節敏感的經驗指南。Kaplan 與 Chinchilla 定律的估算誤差源於嵌入層參數統計差異及小規模外推的敏感性。在超大規模模型訓練中,參數校準或優化器微調均可能引發預測偏差。因此,開發過程不應盲目依賴單一公式,而需在工程實踐中嚴格擬合損失曲線,精確計算參數與唯一數據量之比,通過系統設計突破“數據瓶頸”。

免責聲明:本內容為作者獨立觀點,不代表平臺立場。未經允許不得轉載,文中內容僅供參考,不作為實際操作建議,交易風險自擔。
標簽:
Lilian Weng
Li Weng
Kaplan
Muennighoff
Lovelace
Thinking Machines
分享:
back