2024年9月18日,中国人工智能领域迎来里程碑时刻——由DeepSeek(深度求索)团队研发、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,正式登上国际顶级学术期刊《自然(Nature)》封面。这一突破标志着R1成为全球首个通过严格同行评议的主流大语言模型,开创了AI基础研究学术审查的先河。
与今年1月发布的未经同行评审初版论文相比,新版论文进行了重大修订。DeepSeek团队根据评审专家意见,删除了模型拟人化描述,新增了训练数据类型、安全性机制等核心技术细节。针对外界关于“知识蒸馏”的质疑,论文明确否认使用OpenAI模型输出进行训练,强调其基座模型DeepSeek-V3 Base的数据全部源自互联网公开资源,虽可能包含GPT-4生成内容,但绝无主动蒸馏行为。
为确保基准测试公正性,团队对预训练和后训练数据实施了全面去污染措施。这一系列技术透明化举措,赢得了《自然》评审委员会的高度认可。
论文核心揭示了R1模型的革命性创新——通过“纯强化学习”机制激发推理能力。与传统模仿人类思维的模式不同,R1依靠奖励模型引导模型自主探索正确答案,实现了自动化试错学习。这一方法在补充材料中首次公开:R1训练成本仅29.4万美元,加上基础模型成本约600万美元,总投入远低于OpenAI、谷歌等巨头的训练费用。
今年1月R1发布时,其卓越的推理性能与极低开发成本曾引发全球科技股震荡。此次学术认证进一步证实了中国AI团队的技术实力。
开源后,R1在Hugging Face平台下载量突破1090万次,成为全球最受欢迎的开源推理模型。其混合推理架构支持思考/非思考双模式,最新升级的DeepSeek-V3.1版本更强化了Agent能力,实现效率与灵活性的双重提升。
《自然》杂志在评论文章中以“里程碑式论文揭示DeepSeek AI模型的秘密”、“创造历史”等表述高度评价。期刊认为,在AI技术快速普及的背景下,DeepSeek通过独立同行评审抑制行业过度炒作的做法,为全球AI治理提供了范本。
作为幻方量化孵化的杭州AI企业,DeepSeek创始团队由梁文锋领衔,汇聚顶尖高校与国际机构技术专家。此次论文发表不仅标志着中国在大模型基础研究领域的突破,更展现了技术开放与学术严谨的结合。
8月21日发布的DeepSeek-V3.1进一步体现这一理念:通过混合推理架构实现模式切换,思考效率与智能体能力显著提升。在AI行业充斥未经证实说法的当下,DeepSeek的实践为技术可信度树立了标杆。
(图注:DeepSeek-R1模型架构示意图)