2025年9月29日,人工智能领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式发布并开源。这一创新模型通过引入稀疏Attention架构,在降低计算资源消耗的同时,显著提升了模型的推理效率,为AI技术的实际应用提供了更高效、更经济的解决方案。
据悉,DeepSeek-V3.2-Exp模型的核心技术亮点在于其稀疏Attention架构。该架构通过优化注意力机制,减少了不必要的计算量,从而在保持模型性能的同时,大幅降低了对硬件资源的需求。这一突破不仅有助于提升模型的运行速度,还为在资源受限环境下部署大型AI模型提供了可能。
目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台(MaaS),为用户提供便捷的一站式AI服务。针对该模型的部署,华为云此次沿用了大EP并行方案,并结合稀疏Attention结构,实现了长序列亲和的上下文并行策略。这一策略不仅优化了模型的时延性能,还提升了吞吐量,确保了模型在高并发场景下的稳定运行。
DeepSeek-V3.2-Exp模型的发布和开源,标志着AI技术在效率与性能优化方面取得了新的突破。随着该模型在华为云MaaS平台上的广泛应用,预计将推动更多行业和领域的AI应用创新,为数字化转型注入新的动力。