扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型2025年正式开源,提升推理效率

时间:2025-10-01 06:00:23 来源:界面新闻 作者:界面新闻

DeepSeek-V3.2-Exp模型发布

2025年9月29日,人工智能领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式发布并开源。这一全新模型通过引入稀疏Attention架构,实现了计算资源消耗的显著降低,同时大幅提升了模型的推理效率,为AI技术的实际应用带来了新的可能性。

稀疏Attention架构作为DeepSeek-V3.2-Exp模型的核心创新点,通过优化注意力机制,减少了不必要的计算量,从而在保持模型性能的同时,降低了对硬件资源的需求。这一改进不仅使得模型在推理过程中更加高效,还为大规模部署和应用提供了有力支持。

目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台MaaS。华为云针对该模型的特点,沿用了大EP并行方案进行部署,并结合稀疏Attention结构,实现了长序列亲和的上下文并行策略。这一策略在保证模型时延和吞吐性能的同时,进一步提升了模型的处理能力和稳定性。

DeepSeek-V3.2-Exp模型的发布和开源,不仅为AI研究人员和开发者提供了强大的工具,也为各行各业的智能化升级注入了新的动力。随着该模型在华为云MaaS平台上的广泛应用,我们有理由相信,AI技术将在更多领域发挥重要作用,推动社会的智能化进程。