扫描打开手机站
随时逛,更方便!
当前位置:首页 > 智创未来

DeepSeek-V3.2-Exp模型开源发布,API价格直降超50%

时间:2025-09-29 20:03:25 来源:界面新闻 作者:界面新闻

2025年9月29日,AI领域迎来重要突破——DeepSeek-V3.2-Exp实验性模型正式发布并开源,同步登陆Huggingface与魔搭社区。此次更新不仅带来技术架构革新,更通过API价格直降超50%的政策,为开发者释放显著成本红利。目前,官方App、网页端及小程序均已完成版本升级。

稀疏注意力机制:长文本处理效率的革命性突破

作为迈向新一代架构的过渡版本,DeepSeek-V3.2-Exp在V3.1-Terminus基础上引入DeepSeek Sparse Attention(DSA)稀疏注意力机制。该技术通过细粒度注意力分配策略,在保持模型输出质量的前提下,将长文本训练与推理效率提升40%以上。据官方技术文档披露,DSA机制通过动态筛选关键信息节点,减少无效计算资源消耗,特别适用于金融报告分析、法律文书处理等长文本场景。

昇腾生态快速响应:0day适配与全代码开源

华为计算团队通过「华为计算」微信公众号宣布,昇腾AI平台已基于vLLM/SGLang推理框架完成DeepSeek-V3.2-Exp的0day适配,并面向开发者开源全部推理代码与算子实现。值得关注的是,本次开源包含TileLang与CUDA双版本算子:前期使用高级语言TileLang进行快速原型开发,后期通过CUDA优化实现生产级性能。官方建议研究型开发者优先使用TileLang版本以提升调试效率。

API价格腰斩:开发者成本下降超50%

伴随模型服务成本优化,DeepSeek宣布API调用价格大幅下调。新价格体系下,开发者使用成本较前一版本降低50%以上,特别在长文本处理场景中,单位token成本下降幅度达62%。此次降价策略与模型效率提升形成协同效应,进一步降低AI技术商业化门槛。

技术演进脉络:从V3.1到Terminus的持续优化

回顾近期技术迭代,DeepSeek于8月21日发布V3.1版本,首创混合推理架构实现思考/非思考双模式切换,并通过Post-Training优化显著提升Agent能力。9月22日升级的V3.1-Terminus版本则聚焦稳定性改进,解决中英文混杂输出、异常字符生成等问题,Code Agent与Search Agent的代码生成准确率提升18%。

本次V3.2-Exp在技术验证层面采取严格对标策略,其训练配置与V3.1-Terminus完全对齐。经多领域公开评测集验证,新模型在保持输出质量稳定的同时,实现效率与成本的双重突破。据内部测试数据显示,在金融合约解析任务中,V3.2-Exp的处理速度较前代提升37%,而错误率仅增加0.3个百分点。

随着DeepSeek-V3.2-Exp的开源发布,AI社区将迎来新一轮技术探索热潮。其创新的稀疏注意力架构与开放的算子实现,不仅为长文本处理提供新范式,更通过极具竞争力的定价策略,推动AI技术普惠化进程。