2025年9月29日,人工智能领域迎来重要突破——DeepSeek-V3.2-Exp模型正式发布并开源。该模型通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时,显著提升了模型推理效率,为大规模AI应用提供了更高效的解决方案。
据官方技术文档披露,DeepSeek-V3.2-Exp的稀疏Attention架构通过动态激活关键注意力头,实现了计算复杂度的优化。这种设计不仅减少了冗余计算,还保持了模型对长序列数据的处理能力,特别适用于需要处理超长文本或复杂逻辑关系的场景。
目前,该模型已正式上架华为云大模型即服务平台(MaaS)。华为云此次部署沿用了大EP并行方案,并基于稀疏Attention结构叠加实现了长序列亲和的上下文并行策略。该方案通过动态分配计算资源,在保证模型时延可控的前提下,大幅提升了吞吐性能,为高并发AI服务提供了技术支撑。
行业分析师指出,DeepSeek-V3.2-Exp的开源将推动稀疏计算架构在AI领域的普及。其与华为云MaaS平台的深度整合,也为开发者提供了从模型训练到部署的一站式解决方案,有望加速AI技术在垂直行业的落地应用。