2025年9月29日,DeepSeek-V3.2-Exp模型正式开源发布
据官方消息,DeepSeek团队于2025年9月29日宣布推出新一代AI模型DeepSeek-V3.2-Exp,并同步开源其核心代码。该模型的最大亮点在于引入了稀疏Attention架构,通过动态激活关键注意力头,显著降低计算资源消耗,同时提升推理效率,尤其适用于长文本处理场景。
技术层面,DeepSeek-V3.2-Exp的稀疏Attention结构与华为云MaaS平台的大EP并行方案深度结合,实现了长序列亲和的上下文并行策略。该方案通过优化数据分片与计算调度,在保证低时延的前提下,将模型吞吐量提升至行业领先水平。目前,用户可通过华为云大模型即服务平台(MaaS)直接调用该模型,无需自建复杂基础设施。
行业分析师指出,DeepSeek-V3.2-Exp的开源将推动AI技术在金融、医疗、科研等长文本密集型领域的应用落地,其资源高效利用特性也为中小企业提供了低成本部署AI的可行性方案。