登錄
註冊
午方 AI 獲悉,新浪微博團隊近期開源了擁有 30 億參數的推理模型 VibeThinker-3B。該模型基於 Qwen2.5-Coder-3B 構建,通過 '頻譜到信號' 轉換過程及強化學習進行重新訓練,利用 64K 大規模思維空間確保推理步驟不受干擾,並在數學和編程任務中展現出接近或超越 DeepSeek V3.2、GLM-5 以及 Gemini 3 Pro 等頂級模型的性能。
開發團隊提出 '參數壓縮與覆蓋範圍假說',認爲邏輯推理具有高壓縮性,核心在於規則應用與錯誤糾正,而開放領域知識學習則依賴大量參數進行機械記憶。儘管 VibeThinker-3B 在 AIME26 數學測試中得分從 94.3 分提升至 97.1 分,但在常識性開放知識覆蓋方面仍不及大型模型。團隊強調,其目標並非以小型模型取代大型模型,而是旨在明確驗證機制下探索緊湊型模型的能力邊界。