DeepSeek-V3.2-Exp模型开源发布，华为云MaaS平台率先部署

时间：2025-10-04 07:00:26　来源：界面新闻　作者：界面新闻

2025年9月29日，DeepSeek-V3.2-Exp模型正式开源发布，这一消息在人工智能领域引发广泛关注。作为新一代大语言模型，DeepSeek-V3.2-Exp通过引入创新的稀疏Attention架构，实现了计算资源消耗的显著降低与推理效率的大幅提升。

据官方技术文档披露，稀疏Attention架构通过动态筛选关键信息节点，将传统Attention机制的全局计算量压缩至30%以下，同时保持98%以上的语义理解精度。这种技术突破使得模型在处理长文本时，推理速度较前代提升2.3倍，能耗降低45%。

目前，DeepSeek-V3.2-Exp已正式登陆华为云大模型即服务平台（MaaS）。华为云采用大EP并行方案进行部署，结合稀疏Attention结构特性，开发出长序列亲和的上下文并行策略。该方案通过动态负载均衡技术，在保证模型时延低于150ms的同时，将吞吐性能提升至每秒处理12万token。

DeepSeek-V3.2-Exp稀疏Attention架构图

华为云MaaS平台负责人表示，此次部署采用三重优化策略：其一，基于稀疏Attention的分层计算单元；其二，动态批处理与内存复用技术；其三，自适应时延控制算法。这些创新使得模型在金融、医疗等长文本场景中表现出色，特别是在处理超过32K token的文档时，综合效率较传统方案提升60%。

行业分析师指出，DeepSeek-V3.2-Exp的开源将推动大模型技术向轻量化、高效化方向发展。其稀疏Attention架构已被多家头部企业纳入技术路线图，预计将在2026年前形成超过50亿元的产业应用市场。

猜你喜欢