>
正文
微博開源VibeThinker-3B推理模型
2026-06-18 23:07

午方 AI 獲悉,新浪微博團隊近期開源了擁有 30 億參數的推理模型 VibeThinker-3B。該模型基於 Qwen2.5-Coder-3B 構建,通過 '頻譜到信號' 轉換過程及強化學習進行重新訓練,利用 64K 大規模思維空間確保推理步驟不受干擾,並在數學和編程任務中展現出接近或超越 DeepSeek V3.2、GLM-5 以及 Gemini 3 Pro 等頂級模型的性能。

開發團隊提出 '參數壓縮與覆蓋範圍假說',認爲邏輯推理具有高壓縮性,核心在於規則應用與錯誤糾正,而開放領域知識學習則依賴大量參數進行機械記憶。儘管 VibeThinker-3B 在 AIME26 數學測試中得分從 94.3 分提升至 97.1 分,但在常識性開放知識覆蓋方面仍不及大型模型。團隊強調,其目標並非以小型模型取代大型模型,而是旨在明確驗證機制下探索緊湊型模型的能力邊界。

免責聲明:本內容為作者獨立觀點,不代表平臺立場。未經允許不得轉載,文中內容僅供參考,不作為實際操作建議,交易風險自擔。
標簽:
VibeThinker-3B
DeepSeek V3.2
GLM-5
Gemini 3 Pro
Qwen2.5-Coder-3B
Sina Weibo
分享:
back