扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型正式开源,提升AI推理效率

时间:2025-10-04 11:00:34 来源:界面新闻 作者:界面新闻

2025年9月29日,AI领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式发布并开源。这款由DeepSeek团队研发的下一代AI模型,通过引入创新的稀疏Attention架构,在计算资源消耗与推理效率之间实现了突破性平衡,为大规模语言模型的应用提供了更高效的解决方案。

据技术文档披露,DeepSeek-V3.2-Exp的核心优势在于其稀疏Attention架构设计。该架构通过动态选择关键注意力路径,在保持模型性能的同时,将计算资源消耗降低至传统密集Attention架构的30%-50%,同时使推理速度提升达2倍。这种优化尤其适用于长文本处理场景,可有效缓解传统模型在处理超长序列时面临的内存瓶颈问题。

DeepSeek-V3.2-Exp模型架构图

在部署层面,华为云大模型即服务平台(MaaS)率先完成技术适配。平台采用大EP并行方案,结合稀疏Attention结构特性,开发出长序列亲和的上下文并行策略。该方案通过动态负载均衡技术,在保证模型时延低于100ms的前提下,将吞吐量提升至每秒处理10万tokens以上,充分满足企业级应用的实时性需求。

目前,DeepSeek-V3.2-Exp模型已在华为云MaaS平台全面上线,开发者可通过API接口直接调用。平台同时提供模型微调工具包和性能监控仪表盘,支持企业根据具体业务场景进行定制化优化。此次开源包含完整的模型权重、训练代码和部署文档,遵循Apache 2.0许可协议,允许商业用途的二次开发。

行业分析师指出,DeepSeek-V3.2-Exp的发布标志着AI模型架构进入「稀疏计算」新时代。其技术路线与谷歌Pathways、微软ZeRO-Infinity等方案形成差异化竞争,特别在边缘计算和移动端部署场景具有显著优势。随着模型开源,预计将催生更多基于稀疏架构的创新应用,推动AI技术向更高效、更环保的方向发展。