微博開源VibeThinker-3B推理模型

2026-06-18 23:07

午方 AI 獲悉，新浪微博團隊近期開源了擁有 30 億參數的推理模型 VibeThinker-3B。該模型基於 Qwen2.5-Coder-3B 構建，通過 '頻譜到信號' 轉換過程及強化學習進行重新訓練，利用 64K 大規模思維空間確保推理步驟不受干擾，並在數學和編程任務中展現出接近或超越 DeepSeek V3.2、GLM-5 以及 Gemini 3 Pro 等頂級模型的性能。

開發團隊提出 '參數壓縮與覆蓋範圍假說'，認爲邏輯推理具有高壓縮性，核心在於規則應用與錯誤糾正，而開放領域知識學習則依賴大量參數進行機械記憶。儘管 VibeThinker-3B 在 AIME26 數學測試中得分從 94.3 分提升至 97.1 分，但在常識性開放知識覆蓋方面仍不及大型模型。團隊強調，其目標並非以小型模型取代大型模型，而是旨在明確驗證機制下探索緊湊型模型的能力邊界。

免責聲明：本內容為作者獨立觀點，不代表平臺立場。未經允許不得轉載，文中內容僅供參考，不作為實際操作建議，交易風險自擔。

熱門資訊

比特幣礦工轉型 AI 需 500 億美元，IREN 缺口達 210 億

Saylor 借 AI 設計 STRC：Strategy 構建比特幣資本平臺

SpaceX IPO 10 億美元退款：散戶轉向 ORBS 與 DXYZ 佈局

Ledn 納入 Tether Gold 抵押，解鎖黃金流動性

Warsh 首秀定調鷹派：9 人預測加息，華爾街仍押注今年利率不變

標準渣打銀行預測 UNI 2030 年達 100 美元，巨鯨持倉創 7 個月新高

CZ 力挺 Hyperliquid 技術卻預警監管風險，HYPE 衝高回落

Capital B 獲批 1204 億美元融資額度加速 Bitcoin 收購

Grayscale 預測 AAVE 12 個月內飆升至 175 美元

STRC 跌至 89 美元，12.9% 收益率難抵鏈上槓杆與競爭壓力