扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型正式开源:稀疏Attention架构引领效率革命

时间:2025-10-06 10:00:28 来源:界面新闻 作者:界面新闻

2025年9月29日,AI领域迎来重要突破——DeepSeek-V3.2-Exp模型正式发布并开源。该模型通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时,显著提升了模型推理效率,为长序列数据处理提供了更高效的解决方案。

据官方信息,DeepSeek-V3.2-Exp模型的核心技术亮点在于其稀疏Attention结构。该架构通过动态筛选关键注意力权重,避免了传统密集Attention机制中的冗余计算,从而在保持模型性能的前提下,大幅减少了内存占用和计算开销。这一特性使其尤其适用于需要处理超长文本或复杂上下文关系的场景。

目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台(MaaS)。华为云针对该模型的特点,延续了其大EP并行方案部署策略,并结合稀疏Attention结构实现了长序列亲和的上下文并行策略。这一部署方案不仅优化了模型时延,还兼顾了吞吐性能,确保在高并发场景下仍能保持稳定运行。

行业专家指出,DeepSeek-V3.2-Exp模型的开源将进一步推动AI技术的普惠化。其稀疏Attention架构的设计理念,为后续大模型优化提供了新的思路,尤其在资源受限的环境下,具有显著的应用价值。随着该模型在华为云MaaS平台的落地,预计将吸引更多开发者参与生态共建,加速AI技术的创新与应用。