2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源,标志着AI领域在计算效率与模型性能优化方面取得重要突破。该模型创新性引入稀疏Attention架构,通过动态激活关键注意力单元,显著降低计算资源消耗的同时,将模型推理效率提升30%以上,尤其适用于长文本处理场景。
目前,DeepSeek-V3.2-Exp已正式上架华为云大模型即服务平台(MaaS)。华为云采用大EP并行方案部署,结合稀疏Attention结构特性,实现长序列亲和的上下文并行策略,在保证低时延(<50ms)的前提下,吞吐量较传统方案提升2倍,可稳定支撑亿级参数规模的实时推理需求。
此次开源包含模型权重、训练代码及部署文档,开发者可通过华为云MaaS平台快速调用API或本地化部署。行业分析认为,该架构为资源受限场景下的AI应用提供了高效解决方案,有望推动智能客服、文档分析等领域的规模化落地。