扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型正式开源,稀疏Attention架构提升效率

时间:2025-10-03 18:00:22 来源:界面新闻 作者:界面新闻

2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源

据官方消息,DeepSeek-V3.2-Exp模型于今日正式对外发布,并同步开源其核心代码与技术文档。该模型最大的技术亮点在于引入了稀疏Attention架构,这一创新设计显著降低了模型训练与推理过程中的计算资源消耗,同时有效提升了模型的运行效率。

目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台(MaaS),成为该平台的重要技术支撑之一。针对此次部署,华为云继续采用大EP并行方案,结合稀疏Attention结构的特点,实现了长序列亲和的上下文并行策略。这一策略不仅优化了模型的时延表现,还兼顾了吞吐性能,为大规模应用提供了稳定的技术保障。

业内专家指出,DeepSeek-V3.2-Exp模型的发布标志着大模型技术在资源优化与效率提升方面取得了新的突破,未来有望在更多场景中实现高效部署与应用。