2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源,这一消息标志着AI领域技术迭代迈入新阶段。作为新一代大语言模型,DeepSeek-V3.2-Exp在架构设计上引入了创新的稀疏Attention机制,通过动态分配注意力权重,显著降低了模型训练与推理过程中的计算资源消耗,同时提升了长文本处理效率。
目前,该模型已正式上架华为云大模型即服务平台(MaaS),用户可通过华为云生态快速调用模型能力。在部署方案上,华为云延续了大EP并行计算架构,结合稀疏Attention的稀疏性特征,实现了针对长序列输入的上下文并行优化策略。这种设计不仅平衡了模型时延与吞吐性能,还进一步提升了复杂任务场景下的响应速度。
技术层面,稀疏Attention架构通过筛选关键信息节点,避免了传统全量Attention的高计算复杂度,尤其适用于需要处理超长文本或实时交互的场景。此次开源的DeepSeek-V3.2-Exp模型,将为开发者提供更高效的工具链,推动AI技术在金融、医疗、科研等领域的深度应用。