DeepSeek-V3.2-Exp模型发布：稀疏Attention架构助力开源新突破

时间：2025-10-02 14:00:22　来源：界面新闻　作者：界面新闻

DeepSeek-V3.2-Exp模型发布

2025年9月29日，人工智能领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式发布并开源。这一创新模型通过引入稀疏Attention架构，在降低计算资源消耗的同时，显著提升了模型的推理效率，为AI技术的实际应用提供了更高效、更经济的解决方案。

据悉，DeepSeek-V3.2-Exp模型的核心技术亮点在于其稀疏Attention架构。该架构通过优化注意力机制，减少了不必要的计算量，从而在保持模型性能的同时，大幅降低了对硬件资源的需求。这一突破不仅有助于提升模型的运行速度，还为在资源受限环境下部署大型AI模型提供了可能。

目前，DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台（MaaS），为用户提供便捷的一站式AI服务。针对该模型的部署，华为云此次沿用了大EP并行方案，并结合稀疏Attention结构，实现了长序列亲和的上下文并行策略。这一策略不仅优化了模型的时延性能，还提升了吞吐量，确保了模型在高并发场景下的稳定运行。

DeepSeek-V3.2-Exp模型的发布和开源，标志着AI技术在效率与性能优化方面取得了新的突破。随着该模型在华为云MaaS平台上的广泛应用，预计将推动更多行业和领域的AI应用创新，为数字化转型注入新的动力。

上一篇：中际旭创股价暴涨背后：股东套现与高增长逻辑能否持续？
下一篇：国庆特辑 | 长沙土菜崛起：烟火气中的餐饮新势力

猜你喜欢