扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型发布:开源新架构提升AI效率

时间:2025-10-05 22:00:34 来源:界面新闻 作者:界面新闻

DeepSeek-V3.2-Exp模型发布

2025年9月29日,人工智能领域迎来重要进展——DeepSeek-V3.2-Exp模型正式发布并全面开源。该模型通过引入创新的稀疏Attention架构,在降低计算资源消耗的同时,显著提升了模型推理效率,为AI应用落地提供了更高效的解决方案。

稀疏Attention架构:效率与性能的双重突破

DeepSeek-V3.2-Exp模型的核心创新在于其采用的稀疏Attention架构。这种架构通过动态选择关键注意力区域,避免了传统全连接Attention机制的高计算复杂度,从而在保持模型性能的前提下,大幅减少了计算资源的需求。实验数据显示,该架构可使推理效率提升最高达40%,同时降低30%以上的显存占用。

华为云MaaS平台首发部署

目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台(MaaS)。华为云针对该模型的特点,延续了大EP并行方案部署策略,并结合稀疏Attention结构实现了长序列亲和的上下文并行策略。这一部署方案不仅优化了模型时延,还显著提升了吞吐性能,确保了大规模AI应用场景下的稳定运行。

华为云MaaS平台负责人表示:"DeepSeek-V3.2-Exp模型的加入,进一步丰富了我们的AI模型生态。其高效的架构设计非常适合企业级应用,我们期待与开发者共同探索更多创新场景。"

开源生态:推动AI技术普惠化

作为开源模型,DeepSeek-V3.2-Exp的代码和预训练权重已全部公开,支持全球开发者自由使用和二次开发。这一举措不仅降低了AI技术的使用门槛,也为学术研究和产业创新提供了重要基础。目前,GitHub上的项目仓库已收获超过5000颗星标,显示出社区对该模型的高度关注。

业内专家认为,DeepSeek-V3.2-Exp模型的发布标志着AI大模型进入了一个更注重效率与可持续性的新阶段。随着稀疏计算架构的普及,未来AI应用将能够在更广泛的硬件环境中高效运行,推动人工智能技术的进一步普及。