登錄
註冊
據 Woofun AI 消息,美團正式開源大規模混合專家模型 LongCat-2.0。該模型擁有 1.6 萬億參數,單次激活約 4800 億參數,支持 100 萬字超長上下文處理。這是業內首個完全基於國產算力完成訓練與推理的萬億級大模型。
LongCat-2.0 在由 5 萬餘塊國產 AI 芯片組成的集羣上,利用 35 萬億 token 完成預訓練。其核心優化包括引入流量感知索引等機制以提升稀疏注意力效率,並整合 1350 億參數的 5-gram 嵌入模塊以增強局部上下文表徵。在 SWE-bench Pro 等基準測試中,其表現可媲美主流閉源模型。