当一款中国AI应用持续占据中美App Store榜单前列,当美国科技界频繁将中国初创企业列为“核心竞争者”,全球人工智能产业的话语权争夺已进入全新阶段。近日,前美国总统特朗普在共和党会议上公开警告:“DeepSeek的崛起应为美国敲响警钟”,这一表态背后,折射出中国AI技术突破对国际科技格局的深远影响。
9月29日发布的DeepSeek-V3.2-Exp模型,标志着中国AI在架构创新领域实现关键突破。作为新一代架构的实验版本,该模型首创DeepSeek Sparse Attention(DSA)细粒度稀疏注意力机制,在保持输出质量的前提下,将长文本训练与推理效率提升至行业新高度。研发团队通过严格对齐V3.1-Terminus训练设置,验证其在公开评测集上性能持平,彻底打破“效率提升必损效果”的技术魔咒。
这一架构革新迅速产生连锁反应:华为昇腾基于DSA机制叠加长序列亲和的CP并行策略,在128K长序列场景下实现TTFT低于2秒、TPOT低于30毫秒的推理速度;寒武纪通过BangC融合算子优化,将训推成本压缩至行业新低。更值得关注的是,DeepSeek同步开源TileLang与CUDA双版本GPU算子,其中TileLang版本为开发者提供灵活调试工具,成为构建国产AI技术栈的关键支撑。
从技术传承看,V3.2-Exp延续了DeepSeek家族的硬核基因。作为自研MoE模型的迭代产物,其继承前代3倍生成速度提升、代码能力仅次于OpenAI o1的优势,同时在长文本处理场景实现质的飞跃——华为云适配后已支持160K长序列上下文,相当于一次性处理3本《百年孤独》量级的文本而保持高效推理。
V3.2-Exp发布后同步登陆Hugging Face与ModelScope两大开源平台,这种“模型即开源”的姿态迅速激活国产算力生态。华为昇腾实现0day支持并开源全部推理代码,寒武纪发布适配的vLLM-MLU推理引擎,海光DCU完成深度调优,形成“模型创新-硬件适配-工具链开源”的完整闭环。
民生证券指出,这种联动彻底改变了过去“依赖英伟达CUDA生态”的被动局面。目前已有80余家企业基于昇腾部署DeepSeek系列模型,占国内市场七成份额。V3.2-Exp的API价格下调50%后,输入缓存命中仅需0.2元/百万tokens,输出成本降至3元/百万tokens,成为中小企业与开发者的首选工具。从政务服务到工业设计,从代码生成到多语言翻译,其应用场景已覆盖智慧城市、智能制造等20余个领域,广州市政务服务系统部署的V3系列模型更实现了政务服务的智能化升级。
面对DeepSeek的崛起,美国科技界反应矛盾。OpenAI CEO奥特曼先公开赞扬其技术突破,随后却向白宫提交15页提案,以“国家安全”为由要求封禁,CNN直言这种双重标准“虚伪至极”。与之形成对比的是,微软、AMD等企业纷纷与DeepSeek展开合作,AMD更将其模型集成到Instinct MI300X GPU实现性能最优配置。
中国企业用技术自主回应封锁:华为昇腾910C推理性能达英伟达H100的60%,价格仅为三分之一;寒武纪通过软硬件协同优化,达成业界领先的算力利用率。外交部发言人毛宁明确表示,中方坚决反对将科技问题政治化,而DeepSeek用V3.2-Exp的开源行动给出了最有力的回应——开放的技术生态远比封闭的技术壁垒更具生命力。
“160K上下文+半价API,这波是把AI用成‘白菜价’”,V3.2-Exp发布后迅速引爆开发者社区。有数据分析师实测:“用它处理全年财务报表,以前要等2小时,现在15分钟搞定,输出精度还没降”,调侃“OpenAI还在卡上下文长度,DeepSeek已经把长文本玩明白了”。
针对架构创新,技术博主评论直指要害:“DSA机制才是真・降本神器,以前跑长序列要搭3台服务器,现在1台寒武纪就能搞定,这就是自主架构的底气”。更有网友总结开源战略的深意:“TileLang算子开源那天,就没人再看CUDA脸色了——中国AI已经从‘跟跑’变‘定规则’了”。当开发者发现“免费能用160K长文本模型,还能自己调优”,一句热评道出真相:“特朗普该敲的不是警钟,是自己封闭的脑回路”。