扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型正式开源,引入稀疏Attention架构

时间:2025-10-04 18:00:23 来源:界面新闻 作者:界面新闻

DeepSeek-V3.2-Exp模型发布

2025年9月29日,人工智能领域迎来重要进展——DeepSeek-V3.2-Exp模型正式发布并同步开源。该模型通过引入创新的稀疏Attention架构,在保持模型性能的同时显著降低了计算资源消耗,并大幅提升了推理效率,为大规模语言模型的应用提供了更高效的解决方案。

目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台(MaaS),用户可通过华为云平台便捷调用该模型。在部署方案上,华为云延续了其大EP并行方案,并基于稀疏Attention结构实现了长序列亲和的上下文并行策略。这一策略不仅优化了模型的时延表现,还兼顾了吞吐性能,使得模型在处理长文本时能够保持高效稳定的运行状态。

此次DeepSeek-V3.2-Exp模型的发布,标志着稀疏Attention架构在大型语言模型领域的进一步成熟,也为行业提供了新的技术参考。随着开源代码的公开,预计将有更多开发者和研究机构参与到该模型的优化与应用中,共同推动人工智能技术的发展。