扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

DeepSeek-V3.2-Exp模型正式开源,稀疏Attention架构引领新突破

时间:2025-10-02 03:00:20 来源:界面新闻 作者:界面新闻

DeepSeek-V3.2-Exp模型发布图

2025年9月29日,人工智能领域迎来了一项重要突破——DeepSeek-V3.2-Exp模型正式发布并开源。这一创新模型的推出,不仅为AI技术的发展注入了新的活力,更在计算资源利用和模型推理效率方面实现了显著提升。

DeepSeek-V3.2-Exp模型的核心亮点在于其引入的稀疏Attention架构。这种先进的架构设计,能够有效地降低计算资源的消耗,同时提升模型的推理效率。对于需要处理大量数据和复杂任务的AI应用来说,这一改进无疑具有重要意义。

目前,DeepSeek-V3.2-Exp模型已经正式上架华为云大模型即服务平台MaaS。华为云此次针对该模型,仍然沿用了大EP并行方案进行部署。通过基于稀疏Attention结构的叠加,实现了长序列亲和的上下文并行策略。这一策略不仅兼顾了模型的时延和吞吐性能,更为用户提供了更加高效、稳定的AI服务体验。

DeepSeek-V3.2-Exp模型的发布和开源,无疑将推动AI技术在更多领域的应用和发展。随着技术的不断进步和创新,我们有理由相信,未来的AI世界将更加精彩纷呈。