扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

阿里AI再添猛将:许主洪转岗通义实验室,聚焦多模态交互

时间:2025-09-30 15:08:17 来源:华尔街见闻官方 作者:华尔街见闻官方

作者| 小 猫

编辑| 硬 AI

在全球科技巨头竞相角逐人工智能领域的当下,阿里巴巴的AI战略布局再次引发行业关注。近日,阿里巴巴内部进行了一项关键人事调整,备受瞩目的AI顶尖科学家、阿里集团副总裁许主洪(Steven Hoi)从智能信息事业群首席科学家职位转岗至通义实验室,这一变动标志着阿里在AI基础模型研发上的进一步发力。



据华尔街见闻·硬AI了解,阿里方面已确认许主洪将负责多模态交互模型方向的研究,并直接向通义实验室负责人、阿里云CTO周靖人汇报。这一调整不仅体现了阿里对AI基础模型研发的高度重视,也预示着其在多模态交互这一关键领域的技术突破意图。

在吴泳铭提出的“AI驱动”核心战略下,阿里正将顶尖人才向AI基础模型研发的核心战场集结。多模态交互被视为AI下一阶段突破的关键,它要求AI能够同时理解和处理文本、图像、音频、视频等多种信息形式,实现更自然、更智能的人机交互。

对于许主洪而言,这次转岗意味着他将从更贴近C端应用的“前线阵地”转向更为核心和底层的“研发心脏”。今年2月,这位在学术界和工业界均享有盛誉的AI大牛(IEEE Fellow、斯坦福大学评选的“全球前1%的AI科学家”)正式加盟阿里,最初落脚于智能信息事业群,负责提升C端产品与AI结合的应用能力。

然而,仅仅半年多后,许主洪便调离了这个被视为阿里AI应用重要出口的事业群,转而投身于更为基础和前沿的通义实验室。这一变化背后,是阿里对AI战略优先级的再聚焦。一位接近阿里的人士分析称,这是阿里集中优势兵力,全力攻坚核心基础模型能力的体现。

阿里“亮剑”多模态交互

许主洪的新战场——通义实验室,是阿里“通义”系列大模型的“孵化器”,由阿里云CTO周靖人亲自挂帅。周靖人同样是AI领域的重量级人物,拥有哥伦比亚大学计算机博士学位,曾任微软研发合伙人,是阿里云大数据平台和人工智能研究的灵魂人物。

在周靖人的带领下,通义实验室已经构建了包括语言、视觉、语音等在内的“全尺寸”和“全模态”模型矩阵,其开源模型在全球范围内获得了巨大的影响力。而许主洪此次负责的“多模态交互模型”,正是当前全球大模型研发的前沿阵地。

无论是谷歌的Gemini、OpenAI的GPT-4o,还是阿里自身发布的Qwen-VL、Qwen-Audio等模型,都已展现出强大的多模态能力。许主洪在加入阿里之前,其研究便长期聚焦于此,尤其以“多模态预训练”领域的突破性研究闻名。他提出的低成本预训练策略,曾深刻影响全球大模型的研发进程。

此次履新,意味着阿里将整合许主洪在多模态领域的学术远见和工业界经验,与通义实验室现有的工程和研发能力相结合,意图在多模态这一核心赛道上建立起更强的技术壁垒。其未来的研究成果,不仅将为夸克、淘宝等前端应用提供更强大的AI能力支持,更有可能催生出全新的交互范式和产品形态。

“巨头”的逻辑:人才、资源与战略定力

许主洪的转岗,是阿里AI战略在“聚光灯”下的又一次微调,也折射出当前AI巨头竞争的普遍逻辑。首先,顶尖人才的流向即是战略方向的指针。从吴泳铭亲自兼任阿里云CEO,到此次将许主洪这样的战略级科学家部署到基础模型研发的一线,都显示出阿里最高层对底层技术掌控力的极度重视。

其次,资源正以前所未有的力度向核心模型集中。此次调整是“正常的集团内部转岗”,其背后逻辑是“集中资源投入基础模型能力建设”。这意味着,相较于在应用层面的多点开花,阿里当前更倾向于将宝贵的研发资源和人才投入到底层模型的“深井”中,以求获得更具颠覆性的技术突破。



最后,这体现了巨头在喧嚣的AI浪潮中寻求战略定力。AI应用的商业化路径仍在探索之中,但基础模型的代际竞争却已白热化。在这样的背景下,是否选择长期投入、夯实技术根基,考验着每一家公司的战略远见与决心。