>
正文
美團開源1.6萬億參數模型LongCat-2.0
2026-06-30 14:07

據 Woofun AI 消息,美團正式開源大規模混合專家模型 LongCat-2.0。該模型擁有 1.6 萬億參數,單次激活約 4800 億參數,支持 100 萬字超長上下文處理。這是業內首個完全基於國產算力完成訓練與推理的萬億級大模型。

LongCat-2.0 在由 5 萬餘塊國產 AI 芯片組成的集羣上,利用 35 萬億 token 完成預訓練。其核心優化包括引入流量感知索引等機制以提升稀疏注意力效率,並整合 1350 億參數的 5-gram 嵌入模塊以增強局部上下文表徵。在 SWE-bench Pro 等基準測試中,其表現可媲美主流閉源模型。

免責聲明:本內容為作者獨立觀點,不代表平臺立場。未經允許不得轉載,文中內容僅供參考,不作為實際操作建議,交易風險自擔。
標簽:
LongCat-2.0
LongCat Sparse Attention
LSA
SWE-bench Pro
Meituan
分享:
back