扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型发布:开源新架构提升推理效率

时间:2025-10-02 22:00:23 来源:界面新闻 作者:界面新闻

DeepSeek-V3.2-Exp模型发布

2025年9月29日,人工智能领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式发布并全面开源。该模型通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时,显著提升了模型推理效率,为AI应用落地提供了更高效的解决方案。

据官方介绍,DeepSeek-V3.2-Exp的核心突破在于其稀疏Attention架构设计。该架构通过动态选择关键注意力路径,避免了传统全连接Attention机制的高计算复杂度,使得模型在处理长序列数据时既能保持高精度,又能大幅减少内存占用和计算时间。这一特性尤其适用于需要实时响应或资源受限的场景。

目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台(MaaS)。华为云针对该模型的特点,延续了其大EP并行方案部署策略,并基于稀疏Attention结构叠加实现了长序列亲和的上下文并行策略。这种部署方式不仅优化了模型的时延表现,还兼顾了吞吐性能,确保在复杂任务中仍能保持高效稳定运行。

行业分析师指出,DeepSeek-V3.2-Exp的开源将进一步推动AI技术的普惠化。其高效的架构设计为开发者提供了更多优化空间,而华为云MaaS平台的支持则降低了模型部署的门槛。预计该模型将在自然语言处理、智能客服、内容生成等领域引发新一轮创新应用。