2025年9月29日,AI领域迎来了一项重要进展——DeepSeek-V3.2-Exp模型正式发布并开源,为人工智能技术的发展注入了新的活力。
此次发布的DeepSeek-V3.2-Exp模型,引入了创新的稀疏Attention架构。这一架构通过优化注意力机制,有效降低了计算资源的消耗,同时显著提升了模型的推理效率。对于需要处理大量数据和复杂任务的AI应用来说,这一改进无疑具有重大意义。
目前,DeepSeek-V3.2-Exp模型已经正式上架华为云大模型即服务平台MaaS。华为云此次针对该模型,沿用了大EP并行方案进行部署。通过结合稀疏Attention结构,华为云实现了长序列亲和的上下文并行策略,既保证了模型的时延性能,又提升了吞吐能力,为用户提供了更加高效、稳定的AI服务。
DeepSeek-V3.2-Exp模型的发布和开源,不仅展示了AI技术在模型架构优化方面的最新成果,也为广大开发者和研究者提供了宝贵的资源。随着该模型在华为云MaaS平台上的广泛应用,相信将推动更多AI应用的创新和发展。