扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型发布:开源新架构提升推理效率

时间:2025-10-01 12:00:23 来源:界面新闻 作者:界面新闻

DeepSeek-V3.2-Exp模型发布

2025年9月29日,AI领域迎来了一项重要突破——DeepSeek-V3.2-Exp模型正式发布并全面开源。这一新模型不仅为开发者提供了强大的技术支撑,更在计算资源利用和推理效率上实现了显著提升。

DeepSeek-V3.2-Exp模型的核心亮点在于其引入的稀疏Attention架构。这一创新架构通过优化注意力机制,有效降低了模型在运行过程中的计算资源消耗,同时显著提升了推理效率。这对于需要处理大量数据或进行复杂计算的AI应用来说,无疑是一个巨大的福音。

目前,DeepSeek-V3.2-Exp模型已经正式上架华为云大模型即服务平台MaaS。华为云此次针对该模型,依然沿用了其成熟的大EP并行方案进行部署。通过结合稀疏Attention结构,华为云实现了长序列亲和的上下文并行策略,进一步优化了模型的时延和吞吐性能,确保了用户在使用过程中的流畅体验。

此次DeepSeek-V3.2-Exp模型的发布和开源,不仅展示了AI技术在不断进步中的创新力量,也为广大开发者提供了更多可能性和选择。随着该模型在华为云MaaS平台上的广泛应用,我们有理由相信,AI技术将在更多领域发挥其巨大潜力,推动社会向更加智能化、高效化的方向发展。