扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型开源发布,华为云MaaS平台率先部署

时间:2025-10-04 07:00:26 来源:界面新闻 作者:界面新闻

2025年9月29日,DeepSeek-V3.2-Exp模型正式开源发布,这一消息在人工智能领域引发广泛关注。作为新一代大语言模型,DeepSeek-V3.2-Exp通过引入创新的稀疏Attention架构,实现了计算资源消耗的显著降低与推理效率的大幅提升。

据官方技术文档披露,稀疏Attention架构通过动态筛选关键信息节点,将传统Attention机制的全局计算量压缩至30%以下,同时保持98%以上的语义理解精度。这种技术突破使得模型在处理长文本时,推理速度较前代提升2.3倍,能耗降低45%。

目前,DeepSeek-V3.2-Exp已正式登陆华为云大模型即服务平台(MaaS)。华为云采用大EP并行方案进行部署,结合稀疏Attention结构特性,开发出长序列亲和的上下文并行策略。该方案通过动态负载均衡技术,在保证模型时延低于150ms的同时,将吞吐性能提升至每秒处理12万token。

DeepSeek-V3.2-Exp稀疏Attention架构图

华为云MaaS平台负责人表示,此次部署采用三重优化策略:其一,基于稀疏Attention的分层计算单元;其二,动态批处理与内存复用技术;其三,自适应时延控制算法。这些创新使得模型在金融、医疗等长文本场景中表现出色,特别是在处理超过32K token的文档时,综合效率较传统方案提升60%。

行业分析师指出,DeepSeek-V3.2-Exp的开源将推动大模型技术向轻量化、高效化方向发展。其稀疏Attention架构已被多家头部企业纳入技术路线图,预计将在2026年前形成超过50亿元的产业应用市场。