2025年9月29日,AI领域迎来重要突破:DeepSeek-V3.2-Exp模型正式发布并开源。这款由DeepSeek团队研发的全新大语言模型,通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时显著提升了模型推理效率,为AI技术的落地应用提供了更高效的解决方案。
据官方技术文档披露,DeepSeek-V3.2-Exp的核心突破在于其稀疏Attention架构设计。该架构通过动态筛选关键注意力权重,在保持模型性能的前提下,将传统密集Attention的计算复杂度大幅降低。实验数据显示,在相同硬件条件下,新模型的推理速度较前代提升约37%,而GPU内存占用减少近45%,特别适用于长文本处理等计算密集型场景。
目前,该模型已正式登陆华为云大模型即服务平台(MaaS),成为继DeepSeek系列后又一个入驻华为云生态的核心产品。华为云此次针对DeepSeek-V3.2-Exp的部署方案延续了其标志性的大EP并行技术,通过将稀疏Attention结构与长序列亲和的上下文并行策略相结合,在保证低时延(平均响应时间<120ms)的同时,实现了吞吐量的显著提升——在32卡集群环境下,模型可稳定支持每秒处理1.2万tokens的并发需求。
行业分析师指出,DeepSeek-V3.2-Exp的开源将推动两大技术趋势:其一,稀疏计算架构或成为下一代大模型的主流方向;其二,华为云MaaS平台通过集成此类创新模型,进一步巩固了其在企业级AI服务市场的领先地位。目前,开发者已可通过华为云官网免费获取模型代码及部署指南,快速构建基于DeepSeek-V3.2-Exp的AI应用。