扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型发布并开源,引入稀疏Attention架构

时间:2025-09-30 17:00:30 来源:界面新闻 作者:界面新闻

2025年9月29日,AI领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式发布并同步开源,为自然语言处理技术注入全新动能。

该模型最引人注目的技术突破在于引入了稀疏Attention架构。这一创新设计通过动态聚焦关键信息,在保持模型性能的同时,显著降低了计算资源消耗,并大幅提升了推理效率。对于需要处理海量数据或对实时性要求较高的应用场景,这一特性具有重要价值。

DeepSeek-V3.2-Exp稀疏Attention架构示意图

技术落地方面,华为云大模型即服务平台(MaaS)已率先完成该模型的部署。平台采用大EP并行方案,结合稀疏Attention结构特性,实现了长序列处理能力与上下文并行策略的深度融合。这种设计不仅优化了模型时延,还确保了高吞吐性能,为大规模商业应用提供了可靠的技术支撑。

此次开源意味着全球开发者均可基于DeepSeek-V3.2-Exp进行二次开发,加速AI技术在各行业的创新应用。随着模型在华为云MaaS平台的持续优化,预计将推动自然语言处理领域进入更高效、更节能的发展阶段。