《科创板日报》29日讯,据《科创板日报》记者最新消息,备受关注的DeepSeek-V3.2-Exp模型已正式在Hugging Face平台发布并开源,这一动作标志着该模型向更广泛的开发者群体敞开了大门。
DeepSeek-V3.2-Exp模型此次引入了创新的稀疏Attention架构,这一架构的设计旨在降低计算资源的消耗,同时显著提升模型的推理效率。对于需要处理大量数据和复杂任务的场景来说,这一改进无疑将带来显著的性能提升。
值得一提的是,华为云已经完成了对DeepSeek-V3.2-Exp模型的适配工作。经过适配后,该模型在华为云平台上能够支持最大160K的长序列上下文长度,这对于需要处理长文本或复杂序列的任务来说,将提供更为强大的支持。
此次DeepSeek-V3.2-Exp模型的开源和华为云的适配,无疑将为AI领域的发展注入新的活力。随着更多开发者的参与和贡献,我们有理由期待这一模型在未来能够带来更多创新和突破。(记者 黄心怡)