DeepSeek-V3.2-Exp模型正式开源，提升AI推理效率

时间：2025-10-04 11:00:34　来源：界面新闻　作者：界面新闻

2025年9月29日，AI领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式发布并开源。这款由DeepSeek团队研发的下一代AI模型，通过引入创新的稀疏Attention架构，在计算资源消耗与推理效率之间实现了突破性平衡，为大规模语言模型的应用提供了更高效的解决方案。

据技术文档披露，DeepSeek-V3.2-Exp的核心优势在于其稀疏Attention架构设计。该架构通过动态选择关键注意力路径，在保持模型性能的同时，将计算资源消耗降低至传统密集Attention架构的30%-50%，同时使推理速度提升达2倍。这种优化尤其适用于长文本处理场景，可有效缓解传统模型在处理超长序列时面临的内存瓶颈问题。

DeepSeek-V3.2-Exp模型架构图

在部署层面，华为云大模型即服务平台（MaaS）率先完成技术适配。平台采用大EP并行方案，结合稀疏Attention结构特性，开发出长序列亲和的上下文并行策略。该方案通过动态负载均衡技术，在保证模型时延低于100ms的前提下，将吞吐量提升至每秒处理10万tokens以上，充分满足企业级应用的实时性需求。

目前，DeepSeek-V3.2-Exp模型已在华为云MaaS平台全面上线，开发者可通过API接口直接调用。平台同时提供模型微调工具包和性能监控仪表盘，支持企业根据具体业务场景进行定制化优化。此次开源包含完整的模型权重、训练代码和部署文档，遵循Apache 2.0许可协议，允许商业用途的二次开发。

行业分析师指出，DeepSeek-V3.2-Exp的发布标志着AI模型架构进入「稀疏计算」新时代。其技术路线与谷歌Pathways、微软ZeRO-Infinity等方案形成差异化竞争，特别在边缘计算和移动端部署场景具有显著优势。随着模型开源，预计将催生更多基于稀疏架构的创新应用，推动AI技术向更高效、更环保的方向发展。

猜你喜欢