界面新闻记者 | 肖芳
界面新闻编辑 | 文姝琪
2025云栖大会上,通义系列模型迎来重大升级,一口气发布7款模型的更新版本,在智能水平、Agent工具调用、Coding能力、深度推理及多模态交互等领域实现多项技术突破。这一系列动作标志着阿里云在AI大模型领域的创新速度显著提升。
今年以来,通义系列模型已多次完成多款模型的同步更新。仅在7月,就连续推出Qwen-Plus、Qwen3-Coder、通义万相2.2等系列模型。对比2024年,当前模型迭代周期大幅缩短,展现出极强的技术推进能力。
9月25日,阿里云CTO周靖人在云栖大会媒体访谈中,深入剖析了迭代加速的战略考量。他指出,AI模型发展已从技术突破期进入规模化加速期,行业竞争焦点从单点模型能力转向持续创新效率。'快速迭代能力将成为决定AI企业竞争力的核心要素。'
全球范围内,OpenAI、Anthropic、谷歌等科技巨头均在加快模型迭代步伐。Gartner最新报告将'快速创新与迭代'列为2025年全球大模型五大发展趋势之首。该机构高级分析师费天祺表示:'开源生态与开放协作环境正成为模型进化的重要催化剂。'
图片来源:通义千问
目前,通义千问生态已对外发布超300款模型,形成覆盖全球市场的技术影响力。近期,Qwen3系列四款模型正式登陆Amazon Bedrock平台,通过亚马逊云科技为全球开发者提供服务,彰显其国际化布局。
周靖人强调,当前模型竞争本质是系统能力的较量,云服务与模型研发已形成深度协同效应。'阿里云是少数实现大模型与云计算全栈自研的科技公司,这种技术整合能力是我们保持AI云领域领先地位的关键。'
本次云栖大会上,阿里云除模型更新外,还发布了全新AI基础设施体系,涵盖芯片、超节点服务器、高性能网络、分布式存储、智算集群及人工智能平台等全栈技术。其中,超90%组件为自主研发成果。
针对全栈式技术布局,周靖人解释称:'当AI竞争进入创新速度比拼阶段,技术突破已不仅是模型架构优化,更需要与系统架构、数据工程、分布式训练等环节深度融合。'
据内部人士透露,通义系列的密集更新源于系统化的研发规划。阿里云通过优先级管理实现多项目并行推进,在AI编程、视觉理解等细分领域建立技术壁垒。周靖人表示:'只有在单项技术上做到极致,才能突破模型能力的整体瓶颈。'
在技术评价体系方面,阿里云构建了覆盖模型性能、训练效率、推理成本的多维度评估框架。目前通义千问、万相等产品线均已建立完整的技术演进路径,为持续创新提供制度保障。
大会特别发布的Qwen3-Next基础架构引发行业关注。该架构采用800亿参数规模,实际激活参数仅30亿,即可达到Qwen3旗舰版2350亿参数模型的性能水平。通过混合注意力机制、高稀疏度MoE结构、多token预测(MTP)等创新,训练成本较密集模型降低超90%。
周靖人透露,Qwen3-Next仅是下一代模型研发的阶段性成果。'当创新架构推出后,整个开源社区都会围绕新范式展开适配尝试,这将推动行业技术标准的演进。'
对于模型发展路径,他强调:'技术突破需要循序渐进,在特定任务场景中做到极致优化,才能提升整体模型效能。每次发布都是通义大模型生态联合优化的组成部分,而非孤立项目。'