2025年9月29日,人工智能领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式发布并开源。这一创新模型引入了先进的稀疏Attention架构,该架构通过优化注意力机制,有效降低了计算资源的消耗,同时显著提升了模型的推理效率,为大规模AI应用提供了更高效、更经济的解决方案。
目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台(MaaS),为开发者提供便捷的模型部署与调用服务。针对该模型的特点,华为云此次仍沿用了大EP并行方案进行部署,结合稀疏Attention结构的优势,叠加实现了长序列亲和的上下文并行策略。这一策略不仅优化了模型的时延表现,还兼顾了吞吐性能,确保了模型在复杂场景下的高效运行。
DeepSeek-V3.2-Exp模型的发布,标志着AI技术在效率与资源利用方面取得了新的突破。随着该模型在华为云MaaS平台的广泛应用,预计将推动更多行业实现智能化升级,为AI技术的普及与发展注入新的动力。