扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型正式开源:稀疏Attention架构引领AI新突破

时间:2025-10-05 07:00:22 来源:界面新闻 作者:界面新闻

DeepSeek-V3.2-Exp模型发布

2025年9月29日,人工智能领域迎来重要里程碑——DeepSeek-V3.2-Exp模型正式发布并开源。这款创新模型引入了先进的稀疏Attention架构,通过优化注意力机制显著降低了计算资源的消耗,同时大幅提升了模型的推理效率,为AI技术的实际应用开辟了新的可能性。

目前,DeepSeek-V3.2-Exp模型已正式上架华为云大模型即服务平台(MaaS),为开发者提供高效、便捷的模型服务。在部署方案上,华为云继续沿用大EP并行方案,并结合稀疏Attention结构的特性,实现了长序列亲和的上下文并行策略。这一创新不仅优化了模型的时延性能,还确保了高吞吐量,满足了复杂AI应用场景的需求。

DeepSeek-V3.2-Exp模型的开源,标志着AI技术向更高效、更灵活的方向迈进。其稀疏Attention架构的设计,为处理长序列数据提供了强有力的支持,使得模型在处理大规模文本、图像等复杂数据时,能够保持高效且稳定的性能。这一突破无疑将为AI领域的研究和应用带来深远的影响。