2025年9月29日,AI领域迎来重大突破——DeepSeek-V3.2-Exp模型正式发布并开源。作为新一代高效能AI模型,其核心创新在于引入稀疏Attention架构,该架构通过动态分配注意力权重,在保持模型精度的同时,大幅降低计算资源消耗并提升推理效率,尤其适用于长文本处理场景。
目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台(MaaS)。华为云针对该模型特性,延续大EP并行方案部署,结合稀疏Attention结构实现长序列亲和的上下文并行策略,在优化模型时延(降低延迟)的同时,显著提升吞吐性能,为大规模AI应用提供稳定支撑。
此次开源不仅为开发者提供高性价比的模型底座,更通过华为云MaaS平台的技术赋能,推动AI技术在金融、医疗、教育等长文本密集型行业的落地应用。