>
正文
微博开源VibeThinker-3B推理模型
2026-06-18 23:07

午方 AI 获悉,新浪微博团队近期开源了拥有 30 亿参数的推理模型 VibeThinker-3B。该模型基于 Qwen2.5-Coder-3B 构建,通过 '频谱到信号' 转换过程及强化学习进行重新训练,利用 64K 大规模思维空间确保推理步骤不受干扰,并在数学和编程任务中展现出接近或超越 DeepSeek V3.2、GLM-5 以及 Gemini 3 Pro 等顶级模型的性能。

开发团队提出 '参数压缩与覆盖范围假说',认为逻辑推理具有高压缩性,核心在于规则应用与错误纠正,而开放领域知识学习则依赖大量参数进行机械记忆。尽管 VibeThinker-3B 在 AIME26 数学测试中得分从 94.3 分提升至 97.1 分,但在常识性开放知识覆盖方面仍不及大型模型。团队强调,其目标并非以小型模型取代大型模型,而是旨在明确验证机制下探索紧凑型模型的能力边界。

免责声明:本内容为作者独立观点,不代表平台立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。
标签:
VibeThinker-3B
DeepSeek V3.2
GLM-5
Gemini 3 Pro
Qwen2.5-Coder-3B
Sina Weibo
分享:
back