登录
注册
据 Woofun AI 消息,DeepSeek 联合北京大学发布投机性代币采样加速框架 DSpark 技术报告,并将全栈代码库 DeepSpec 开源。目前 DSpark 已应用于 DeepSeek-V4 在线服务,在确保输出无损前提下,Flash 版本单用户生成速度提升 60% 至 85%,Pro 版本提升 57% 至 78%。
该框架通过 DFlash 并行生成主干网络及轻量马尔可夫头部处理相邻单词相关性,结合基于后校准算法的置信度预测与异步调度机制,有效解决高并发下多代币采样导致的吞吐量下降问题。DeepSpec 代码库支持 Qwen3、Gemma 等模型,提供涵盖提示词下载、缓存重建及基准测试的完整 Python 开发工具链。