登录
注册
午方 AI 获悉,新浪微博团队近期开源了拥有 30 亿参数的推理模型 VibeThinker-3B。该模型基于 Qwen2.5-Coder-3B 构建,通过 '频谱到信号' 转换过程及强化学习进行重新训练,利用 64K 大规模思维空间确保推理步骤不受干扰,并在数学和编程任务中展现出接近或超越 DeepSeek V3.2、GLM-5 以及 Gemini 3 Pro 等顶级模型的性能。
开发团队提出 '参数压缩与覆盖范围假说',认为逻辑推理具有高压缩性,核心在于规则应用与错误纠正,而开放领域知识学习则依赖大量参数进行机械记忆。尽管 VibeThinker-3B 在 AIME26 数学测试中得分从 94.3 分提升至 97.1 分,但在常识性开放知识覆盖方面仍不及大型模型。团队强调,其目标并非以小型模型取代大型模型,而是旨在明确验证机制下探索紧凑型模型的能力边界。