【梁文锋署名,DeepSeek联手北大发布DSpark推测解码论文】
(1) 6月27日,即完成500亿融资后仅十余天,DeepSeek团队联合北京大学发布论文《DSpark: Confidence-Scheduled...
【梁文锋署名,DeepSeek联手北大发布DSpark推测解码论文】
(1) 6月27日,即完成500亿融资后仅十余天,DeepSeek团队联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,该研究并非新模型迭代,而是在现有DeepSeek-V4-Pro和V4-Flash基础上新增推测解码模块,侧重工程化落地优化。
(2) 论文同步开源了全栈代码库DeepSpec(MIT许可),内含数据准备工具、草稿模型实现、训练代码及评估脚本,目前已内置DSpark、DFlash和Eagle3三种推测解码实现。
(3) 值得关注的是,DeepSeek创始人梁文锋亲自位列论文作者名单——在完成首轮融资后仍深度参与技术撰写,这在AI行业中较为罕见。
编辑回复