微博开源VibeThinker-3B推理模型

2026-06-18 23:07

午方 AI 获悉，新浪微博团队近期开源了拥有 30 亿参数的推理模型 VibeThinker-3B。该模型基于 Qwen2.5-Coder-3B 构建，通过 '频谱到信号' 转换过程及强化学习进行重新训练，利用 64K 大规模思维空间确保推理步骤不受干扰，并在数学和编程任务中展现出接近或超越 DeepSeek V3.2、GLM-5 以及 Gemini 3 Pro 等顶级模型的性能。

开发团队提出 '参数压缩与覆盖范围假说'，认为逻辑推理具有高压缩性，核心在于规则应用与错误纠正，而开放领域知识学习则依赖大量参数进行机械记忆。尽管 VibeThinker-3B 在 AIME26 数学测试中得分从 94.3 分提升至 97.1 分，但在常识性开放知识覆盖方面仍不及大型模型。团队强调，其目标并非以小型模型取代大型模型，而是旨在明确验证机制下探索紧凑型模型的能力边界。

免责声明：本内容为作者独立观点，不代表平台立场。未经允许不得转载，文中内容仅供参考，不作为实际操作建议，交易风险自担。

热门资讯

比特币矿工转型 AI 需 500 亿美元，IREN 缺口达 210 亿

Saylor 借 AI 设计 STRC：Strategy 构建比特币资本平台

SpaceX IPO 10 亿美元退款：散户转向 ORBS 与 DXYZ 布局

Ledn 纳入 Tether Gold 抵押，解锁黄金流动性

Warsh 首秀定调鹰派：9 人预测加息，华尔街仍押注今年利率不变

标准渣打银行预测 UNI 2030 年达 100 美元，巨鲸持仓创 7 个月新高

CZ 力挺 Hyperliquid 技术却预警监管风险，HYPE 冲高回落

Capital B 获批 1204 亿美元融资额度加速 Bitcoin 收购

Grayscale 预测 AAVE 12 个月内飙升至 175 美元

STRC 跌至 89 美元，12.9% 收益率难抵链上杠杆与竞争压力