登录
注册
据 Woofun AI 消息,美团正式开源大规模混合专家模型 LongCat-2.0。该模型拥有 1.6 万亿参数,单次激活约 4800 亿参数,支持 100 万字超长上下文处理。这是业内首个完全基于国产算力完成训练与推理的万亿级大模型。
LongCat-2.0 在由 5 万余块国产 AI 芯片组成的集群上,利用 35 万亿 token 完成预训练。其核心优化包括引入流量感知索引等机制以提升稀疏注意力效率,并整合 1350 亿参数的 5-gram 嵌入模块以增强局部上下文表征。在 SWE-bench Pro 等基准测试中,其表现可媲美主流闭源模型。