DeepSeek与寒武纪同步发布新进展，AI领域迎来重大突破

时间：2025-09-30 08:00:57　来源：中国基金报　作者：中国基金报

【导读】近日，国内AI领域迎来重大突破，DeepSeek与寒武纪两大巨头罕见同步发布重要事项，引发行业广泛关注。

中国基金报记者卢鸰

国内AI领域的两大领军企业DeepSeek（深度求索）与寒武纪，在近日同步发布了相关重要事项，标志着中国AI产业链的深度协同迈出了重要一步。

9月29日18:07，DeepSeek官方微信号发布文章称：“今天，我们正式发布DeepSeek-V3.2-Exp模型，这是一个实验性（Experimental）的版本。作为迈向新一代架构的中间步骤，V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention（一种稀疏注意力机制），针对长文本的训练和推理效率进行了探索性的优化和验证。目前，官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp，同时API大幅度降价，欢迎广大用户体验测试并向我们反馈意见。”

DeepSeek进一步表示：“在新的价格政策下，开发者调用DeepSeek API的成本将降低50%以上。目前API的模型版本为DeepSeek-V3.2-Exp，访问方式保持不变。”这一举措无疑将吸引更多开发者加入DeepSeek的生态体系，共同推动AI技术的发展。

仅仅4分钟后，即18:11，寒武纪旗下的微信公众号“寒武纪开发者”也发布文章称：“2025年9月29日，寒武纪已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配，并开源大模型推理引擎vLLM-MLU源代码。代码地址和测试步骤见文末，开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。”

寒武纪表示，公司一直高度重视大模型软件生态建设，支持以DeepSeek为代表的所有主流开源大模型。借助长期活跃的生态建设和技术积累，寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验性模型架构的day 0适配和优化。

寒武纪还强调，公司一直重视芯片和算法的联合创新，致力于以软硬件协同的方式，优化大模型部署性能，降低部署成本。此前，寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化，达成了业界领先的算力利用率水平。针对本次的DeepSeek-V3.2-Exp新模型架构，寒武纪通过Triton算子开发实现了快速适配，利用BangC融合算子开发实现了极致性能优化，并基于计算与通信的并行策略，再次达成了业界领先的计算效率水平。

“依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制，叠加寒武纪的极致计算效率，可大幅降低长序列场景下的训推成本，共同为客户提供极具竞争力的软硬件解决方案。”寒武纪相关负责人表示。

在业内人士看来，DeepSeek与寒武纪的同步发布适配动作，表明中国AI产业链头部公司正在进行深度协同。这或许意味着，早在DeepSeek-V3.2发布之前，寒武纪就在技术方面与DeepSeek进行了沟通，并启动了相关适配研发工作。

编辑：杜妍
校对：纪元
制作：小茉
审核：陈墨

注：本文封面图由AI生成

《中国基金报》对本平台所刊载的原创内容享有著作权，未经授权禁止转载，否则将追究法律责任。

授权转载合作联系人：于先生（电话：0755-82468670）