DeepSeek-V3.2-Exp模型开源发布，API价格直降超50%

时间：2025-09-29 20:03:25　来源：界面新闻　作者：界面新闻

2025年9月29日，AI领域迎来重要突破——DeepSeek-V3.2-Exp实验性模型正式发布并开源，同步登陆Huggingface与魔搭社区。此次更新不仅带来技术架构革新，更通过API价格直降超50%的政策，为开发者释放显著成本红利。目前，官方App、网页端及小程序均已完成版本升级。

稀疏注意力机制：长文本处理效率的革命性突破

作为迈向新一代架构的过渡版本，DeepSeek-V3.2-Exp在V3.1-Terminus基础上引入DeepSeek Sparse Attention（DSA）稀疏注意力机制。该技术通过细粒度注意力分配策略，在保持模型输出质量的前提下，将长文本训练与推理效率提升40%以上。据官方技术文档披露，DSA机制通过动态筛选关键信息节点，减少无效计算资源消耗，特别适用于金融报告分析、法律文书处理等长文本场景。

昇腾生态快速响应：0day适配与全代码开源

华为计算团队通过「华为计算」微信公众号宣布，昇腾AI平台已基于vLLM/SGLang推理框架完成DeepSeek-V3.2-Exp的0day适配，并面向开发者开源全部推理代码与算子实现。值得关注的是，本次开源包含TileLang与CUDA双版本算子：前期使用高级语言TileLang进行快速原型开发，后期通过CUDA优化实现生产级性能。官方建议研究型开发者优先使用TileLang版本以提升调试效率。

API价格腰斩：开发者成本下降超50%

伴随模型服务成本优化，DeepSeek宣布API调用价格大幅下调。新价格体系下，开发者使用成本较前一版本降低50%以上，特别在长文本处理场景中，单位token成本下降幅度达62%。此次降价策略与模型效率提升形成协同效应，进一步降低AI技术商业化门槛。

技术演进脉络：从V3.1到Terminus的持续优化

回顾近期技术迭代，DeepSeek于8月21日发布V3.1版本，首创混合推理架构实现思考/非思考双模式切换，并通过Post-Training优化显著提升Agent能力。9月22日升级的V3.1-Terminus版本则聚焦稳定性改进，解决中英文混杂输出、异常字符生成等问题，Code Agent与Search Agent的代码生成准确率提升18%。

本次V3.2-Exp在技术验证层面采取严格对标策略，其训练配置与V3.1-Terminus完全对齐。经多领域公开评测集验证，新模型在保持输出质量稳定的同时，实现效率与成本的双重突破。据内部测试数据显示，在金融合约解析任务中，V3.2-Exp的处理速度较前代提升37%，而错误率仅增加0.3个百分点。

随着DeepSeek-V3.2-Exp的开源发布，AI社区将迎来新一轮技术探索热潮。其创新的稀疏注意力架构与开放的算子实现，不仅为长文本处理提供新范式，更通过极具竞争力的定价策略，推动AI技术普惠化进程。