DeepSeek-V3.2-Exp模型正式发布并开源:稀疏Attention架构引领技术革新
2025年9月29日,人工智能领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式对外发布并开源。该模型通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时显著提升了模型推理效率,为大规模语言模型的应用提供了更高效的解决方案。
据官方披露,DeepSeek-V3.2-Exp的核心技术突破在于其稀疏Attention架构设计。相较于传统密集Attention机制,该架构通过动态稀疏化注意力权重,在保持模型性能的前提下减少了不必要的计算开销,尤其适用于长序列文本处理场景。这一改进不仅降低了硬件资源需求,还提升了模型在实际部署中的响应速度。
目前,该模型已正式登陆华为云大模型即服务平台(MaaS),为用户提供开箱即用的AI能力。华为云此次延续了大EP并行方案部署策略,结合DeepSeek-V3.2-Exp的稀疏Attention结构,实现了长序列亲和的上下文并行处理。通过优化时延与吞吐性能的平衡,该方案可满足金融、医疗、科研等高要求场景的实时推理需求。
行业分析师指出,DeepSeek-V3.2-Exp的开源将进一步推动AI技术普惠化。其稀疏Attention架构为后续模型优化提供了可复用的技术路径,而华为云MaaS平台的集成则降低了企业应用前沿AI技术的门槛。随着模型在更多场景落地,预计将引发新一轮AI应用创新浪潮。