智东西
作者 陈骏达
编辑 李水青
AI领域再迎重磅更新!9月22日晚间,DeepSeek在其官方API平台正式发布最新升级的DeepSeek-V3.1-Terminus模型(Terminus源自拉丁语,意为“终点”或“界限”),并同步宣布开源。此次更新不仅修复了此前版本中的关键Bug,还在编程、搜索智能体等核心能力上实现突破。
性能升级:从Bug修复到多场景优化
根据官方文档,DeepSeek-V3.1-Terminus在保留原有模型能力的基础上,重点解决了语言一致性、偶发异常字符等用户反馈的痛点问题。例如,此前版本中模型会随机输出“极”“極”“extreme”等异常字符,导致代码编译失败,这一问题在新版本中已彻底修复。此外,多语言翻译时的语言混用问题(如中、英、俄语混杂)也得到解决,测试显示小语种翻译的准确性显著提升。
基准测试数据显示,新模型在非Agent类场景中表现提升0.2%-36.5%,尤其在人类终极测试(HLE)中,专家级知识、多模态推理等能力进步明显。而在Agent测评中,网页浏览、简单问答及编程任务的表现也有小幅优化。
开源与多平台同步更新
目前,DeepSeek官方App、网页端、小程序及API模型均已升级至V3.1-Terminus版本。开发者可通过以下地址获取开源代码:
深度体验:编程与搜索能力突破
1. 编程能力:物理模拟与动画效果惊艳
在编程任务测试中,DeepSeek-V3.1-Terminus成功完成“小球弹跳”物理模拟,输出的网页不仅采用简约设计,更通过精准的重力、摩擦力计算实现逼真效果。动画轨迹与碰撞反馈自然流畅,展现出模型对编程逻辑与物理学的双重理解。
2. 搜索智能体:多条件交叉验证与信息整合
当被要求推荐“适合新手阳台盆栽、生长快、可生食且对儿童安全”的植物时,模型快速筛选出符合条件的品种,并交叉验证信息可靠性,最终答案经人工核查完全准确,且表述清晰易读。
命名寓意与未来展望
关于“Terminus”的命名,DeepSeek官方解释称,该词可能象征着V3.1系列架构的终极成熟。也有用户猜测,这或许暗示模型在编程终端场景中的表现更进一步。尽管具体寓意需官方确认,但可以预见的是,随着Agent模型研发的推进,DeepSeek的下一轮重大更新已不远。