>
正文
DeepSeek推出DSpark框架推理速度提升85%
2026-06-27 22:01

據 Woofun AI 消息,DeepSeek 聯合北京大學發佈投機性代幣採樣加速框架 DSpark 技術報告,並將全棧代碼庫 DeepSpec 開源。目前 DSpark 已應用於 DeepSeek-V4 在線服務,在確保輸出無損前提下,Flash 版本單用戶生成速度提升 60% 至 85%,Pro 版本提升 57% 至 78%。

該框架通過 DFlash 並行生成主幹網絡及輕量馬爾可夫頭部處理相鄰單詞相關性,結合基於後校準算法的置信度預測與異步調度機制,有效解決高併發下多代幣採樣導致的吞吐量下降問題。DeepSpec 代碼庫支持 Qwen3、Gemma 等模型,提供涵蓋提示詞下載、緩存重建及基準測試的完整 Python 開發工具鏈。

免責聲明:本內容為作者獨立觀點,不代表平臺立場。未經允許不得轉載,文中內容僅供參考,不作為實際操作建議,交易風險自擔。
標簽:
DeepSeek
DSpark
DeepSpec
DeepSeek-V4
MTP-1
DFlash
Qwen3
Gemma
分享:
back