扫描打开手机站
随时逛,更方便!
当前位置:首页 > 智创未来

潘云鹤院士:未来AI发展的三大趋势与中国机遇

时间:2025-09-27 15:00:04 来源:网易科技报道 作者:网易科技报道

9月27日,2025网易未来大会在杭州举行,主题为“以智能·见未来”。本次大会由网易公司主办,杭州市经济和信息化局(杭州市数字经济局)、杭州市商务局、杭州高新技术产业开发区管委会指导。

本届大会将作为“第四届全球数字贸易博览会”的组成部分之一,聚焦人工智能各领域的发展,探索未来趋势。大会将由中国工程院院士潘云鹤、蒋昌俊等四大院士领衔,汇聚具身智能领域泰斗、顶尖AI创业先锋、知名投资人及产业翘楚。与会嘉宾将共同探讨大模型、具身智能、AI Agent等前沿技术突破与商业落地,在思想碰撞中捕捉全新的时代机遇。


在大会中,中国工程院原常务副院长、国家新一代人工智能战略咨询委员会主任、浙江大学院士潘云鹤发表了题目为《AI发展的新趋势》主题演讲。演讲主要包括3个方面的内容AI的思维与行动双轮前进;AI发展的三大趋势;结语。

潘云鹤院士表示,人工智能的发展是思维与行动的双轮前进。《中国新一代人工智能的规划》发布在2017年,这八年来,人工智能的发展基本都是沿着规划中的这五个方向发展的,大数据智能、跨媒体智能、群体智能、人机混合增强智能、自主智能系统。这五个方向中,思维模拟和行动模拟各占一半,且发展很快。思维的模拟,从2023年产生巨大突破的ChatGPT,到2024年的新模型Sora,走向跨媒体智能。而2025年中国的DeepSeek引起巨大震动,在网上下载量登顶,变成世界第一。行动的智能方面,早期表现在工业机器人上,后来来开始集中在人形机器人,近年转向具身智能。今年中国政府发布了人工智能方面的第二个规划《“人工智能+”的行动实施纲要》,以今年中国的人工智能肯定会进入到一个新的发展阶段,“人工智能+”的发展要解决的将是从1到100的发展。

基于这样的现状,潘云鹤院士表示,人工智能的未来有三个发展趋势很重要:

趋势一:专业大模型将越发重要,但要解决幻觉问题。大模型幻觉是指模型生成与事实不符、逻辑不符或上下文不符的内容,有事实性幻觉和忠实性幻觉两种。这些错误如果在工程、科学以及各种技术领域发生,就会出现很大的问题。而“幻觉”问题如何解决,潘云鹤院士认为,首先要使用专业大数据训练专业大模型。要采用教科书级数据,如学科数据、产业数据、应用数据。但这三类数据目前全世界的大模型都并未打通,而当联合这三部分在一起去训练一个专业大模型时,一定可以在人工智能的应用上站到世界的高峰。

基于此,潘云鹤院士提出了大模型发展的第二条可能路径。他认为,当前主流的“先做通用大模型,再做垂直应用”的路径仍受幻觉问题困扰。而另一条更自然、更通畅的道路是:先用专业数据训练出多个高质量的专业大模型,再将这些“专才”模型交叉联合,最终形成一个强大的通用大模型。他建议中国应该“两条路同时走”。

趋势二:具身智能将进一步泛化和深化。从机器人到具身智能再到智能终端,产业空间将更加广阔。智能体作为具有感知、决策、行动能力的应用软硬件系统,它的概念将跨越软硬界限,智能体根据应用目标和环境变化,从大模型中获取知识点,决策行动。而且.具身智能将会联合跨媒体智能发展,眼睛和行动的模型外面加上语言模型,今后还会再加上力学模型。如目前已有的融合增强智能产品“外骨骼系统”,深圳的一家公司做了500台,帮助爬不动泰山的老年人爬上泰山。

趋势三:AI+会引领平台经济走向2.0。1.0版本的平台经济主要是生活服务类平台,比如淘宝、拼多多、京东等。今后更重要的平台是各种为科研服务的平台,这会掀起平台经济的新高潮,成为“平台经济2.0”,这个高潮对一个城市的经济发展非常重要。如杭州六小龙之一的群核科技,面向室内装修,联合产业链企业为客户提供设计、营销、生产、施工等场景的软件产品和数字化解决方案。服务覆盖200多个国家和地区。

最后潘云鹤院士表示,我们可以预见,AI2.0在促进我国产业变革升级,形成新质生产力方面一定能发挥越来越大的作用。(天牛)

以下是潘云鹤院士演讲实录:

潘云鹤:尊敬的各位领导,各位专家、各位代表,上午好!非常高兴来到“网易未来大会”,今天想要与各位探讨人工智能发展的新趋势。

我想讲三方面的问题:

第1, 人工智能是双轮驱动,一个轮子是思维的模拟,一个轮子是行动的模拟,《中国新一代人工智能的规划》发布在2017年,到现在已经八年了,这一规划是中国工程院的建议,总书记在此建议上做了很长的批示,这个批示还没有公开,但他的精神已经在很多会议上发布了。

第2, 中国的规划和全世界各个政府的人工智能规划有一个非常大的不同之处,它指出了人工智能在未来发展五个新的方向,这在2017年提出的时候,全世界都没有引起重视,但这八年来,人工智能的发展基本都是沿着这五个方向发展的,大数据智能、跨媒体智能、群体智能、人机混合增强智能、自主智能系统。

这五个方向分为两类,人工智能在模拟人的智能,人工智能的核心是用计算机模拟人的智能,模拟人的智能的时候发现人有两类智能:一类关于思维的智能,一类关于行动的智能。我们的工作经常有两类工作,一类是白领工作,这就是以思维为主的,一类是蓝领工作,基本就是以行动为主的。当然这两类不能截然分开,这五个方面刚好前两个半是模拟思维的,后面两个半是模拟行动的。

这两个方向在近年来发展得很快,这就是近年来发展的轨迹,从思维的模拟,最大突破是2023年的ChatGPT,那一年的ChatGPT在全世界都引起了巨大的震动,OpenAI借ChatGPT来到了人工智能思维模拟发展的最前沿,到了2024年OpenAI又出了一个大的新模型Sora,这个模型可以文生图、文生语言,用文字生成图和语言,这就走向了跨媒体智能,又一次震动了全球。我相信,受到最大震动的就是与此有关的企业,受到了很大的震动和启发,从此人工智能在跨媒体的发展当中蓬勃发展。

那时候,全世界都在猜OpenAI2025年还会有一个很大的成果拿出来,他们确实也在准备拿出很大的突破,但并未成功。又过了一年,他们没有发布。这一年,也就是今年引起最大震动的是中国的DeepSeek,中国的DeepSeek以十分之一的训练成本做出了一个和ChatGPT4功能类似的模型,而且是开放、开源的,因此在网上下载量登顶,变成了全世界第一。

行动的智能,也是这么发展的,行动智能在早期主要是表现在对机器人的研究上,机器人的研究最大的应用是工业机器人,这也几乎有半个多世纪了,大家的注意力近年来开始集中到人形机器人,人形机器人的鼻祖是波士顿动力公司,原因是MIT在人工智能发展中就是一家专门聚焦于机器人工作的研究单位。美国搞人工智能最好的三所大学:斯坦福、MIT、卡耐基梅隆,MIT是做各种机器人的,他的成果大部分流到了波士顿动力公司,我们目前看到的机器人和机器狗的最初形状基本就是MIT做的。

近年来,机器人又转向了一个新的概念——具身智能,为何机器人转向具身智能?科学家西方中更加广泛的一个介入就是去研究行动智能的模拟,所以机器人换了一个名字,叫“具身智能”,但名字一换,内容就变了,机器人只占具身智能很小的一部分,发展至今,这些东西又发生了很大的事情,中国政府发布了人工智能方面的第二个规划《“人工智能+”的行动实施纲要》,这也在今年发布了,所以今年中国的人工智能肯定会进入到一个新的发展阶段。

前几天浙江日报的记者问我“人工智能+”计划与2017年人工智能规划有什么关系?我说是一脉相承的,前面我们借现在的话来讲,2017年的规划解决了中国0到1的发展,今年的规划要解决中国从1到100的发展,这是“人工智能+”的发展,人工智能将向各个方向进行渗透。

在这一形势下,思维模拟和行动模拟,未来都将向哪个方向发展,这是我们面前要解决的问题,也是杭州市要解决的问题,现在杭州市站在了潮头上,潮头会向哪个方向进行发展?这对于杭州全国都非常重要,对各个企业也很重要。

我认为有三个趋势很重要,是大家需要进行把握的。

趋势一,专用大模型将越来越重要,目前大模型的发展方向由OpenAI举旗,全世界一股脑地向通用大模型的方向发展,向AGI通用人工智能的方向发展,但这个方向显然解决不了通用问题,所以在通用大模型上,大家又做了很多垂直大模型,按照这个方式向各个领域进行应用。

这个问题,这个方向在开始做的时候效果很好,但一触及到具体的应用,发现的问题很多,最主要的问题是幻觉问题,幻觉问题在人工智能回答问题的这一阶段并不严重,你问它什么问题,它回答你一个问题,如果这时候出现回答问题错的,人就可以不听它的,我可以将它过滤掉。但现在出现了Agent,人工智能回答了问题,Agent就根据它的答案去执行了,这一下问题就严重了,后面到“人工智能+”不光是讲给你听就完了,出现了很多Agent,这些Agent很大一部分要进行操作,能行动,包括与机器人相结合,这后面就会出现很大的问题。

幻觉问题是指,幻觉是一个比它好听一点的名字,实际是人工智能回答问题的出处,是指生成和事实不符、逻辑不符、上下文不符的内容,主要有两种类型:

1、实时性幻觉。

2、忠实性幻觉。

举一个例子,你向大模型提出一个问题,“糖尿病病人是否可以用蜂蜜代替糖?”这个问题我想已经有人查过了,大模型基本上会出现两类答案。第一类答案,它说是的,蜂蜜是天然的,可以帮助糖尿病患者稳定血糖水平。这个答案是错的,蜂蜜不能帮助糖尿病病人稳定水平。第二类答案,蜂蜜富含维生素和矿物质,对提高免疫力很有帮助,因此是一种健康食品。这句话回答是对的,但没有回答你的问题,答非所问,所以这两类问题都叫幻觉问题。

幻觉问题哪里来的?实际来源于数据,因为我们网上有大量的数据讲糖尿病人要多吃天然食品,这句话基本是对的,但不精确,大部分的天然食品对糖尿病人都有好处,但像蜂蜜这样的没有好处,包括吃甘蔗大概也没好处。

这样的话在网上的大数据当中,因为要追求通用性,都去训练通用大模型了,通用大模型这样的错误就反映在垂直大模型上,因此在“人工智能+”中就会出现大问题,这些错误在大模型的艺术、动漫、游戏上走,问题不大,但用于工程、科学以及各种技术问题,就会出现很大的问题。

因此,这个问题的严重性引起了全世界的关注,今年开始中国信通院对大模型Agent进行评测,其评测是以大语言模型的幻觉为主要目标,Agent问题第一个遇到的就是幻觉问题,这就是其评测结果,对那些模型进行了评测,我看评测最多的是中国的大模型,而中国大模型中间,评测中国最有名的两个大模型(DeepSeek、通义千问),平均的幻觉数学上为4%,是表现最好的,DeepSeek是专门针对于数学训练的。自然科学6.5%,应用科学8.2%,社会科学10.3%,人文科学12.7%。整体上来看,这个幻觉问题就比较严重。幻觉问题如何解决?全世界都认为要采用教科书级的数据,不可采用像现在这样网上的各种数据就去训练大模型了。

教科书级的数据当然就在大学里,所以遇到了一个新的问题,我们过去都认为企业的数据是最大的数据,现在发现不光是企业的数据,大学的数据也很重要。

我们也研究一下高质量的数据基本就是专业数据,不是网上的那种很多人在聊天的数据,专业数据是由三部分组成的:

第一部分是学科掌握的数据,包括教材、专著、论文、实验数据,这些数据都是非常严密的,所有概念都是一致性相融的。

第二部分是产业掌握的数据,生产过程当中的各种工艺数据、技术数据也是严密的,也是非常重要的,目前大数据的训练想要挖这样的数据,但产业未拿出,也没有集中。

第三部分是应用数据,当市场将产业的产品买去以后,应用过程当中也会出现很多数据,这个数据钢厂很需要,通过钢裂开来就知道是哪个钢厂,哪一天,哪一炉生产的,就可以去查那个钢的配比,钢训练的时间参数,最终可以找出毛病。这在日本和韩国的钢厂积累了多年,所以他们开始的时候水平比较高,现在我们的水平也比较高了。如果我们的大模型将这些数据都集中在一起,我们的水平一定可以比现在高得多,各种高水平的钢都可以炼出来。

但这三类数据并未打通,全世界的大模型都没有解决这个问题,所以中国要研究这个问题。

第二个问题,这三类数据分布在三个不同的单位中,第一类数据比较容易进行拿到,现在大学开始有图书馆了,大学的论文、专著可以检索到,实验室数据未上网,但也可以想办法将它聚集起来。产业链数据应该各个工厂可以进行收集,但工厂不会将所有的数据拿出来,但它可以拿出一部分的公用数据,关键的部分进行保存。应用数据是下一阶段企业能获得的主要的研究方向,将应用数据拿回来对企业的生产会有很大的好处。当这三部分拿在一起,我们去训练一个专业大模型,这个行业一定可以在全世界的人工智能的应用上站到世界的高峰。

当我们将产业链数据和学科数据交叉联合起来训练的时候,我们马上发现,它不是一对一的,而是一对多的,且是多对多。制造业所需要的知识,不但是机械知识,还需要材料知识、管理知识等,材料学科的知识不但用于机械,还用于材料、电器、制药、人员,所以是多对多的,一个知识、一个行业为主,其他行业其他知识交叉进行。如果我们用这样的专业数据去训练专业的大模型,这个大模型的水平一定可以登顶,这件事我认为美国做起来要比中国更难,中国应该及早做这样的事情。美国已经开始在做了,不是国家在做,而是下面在做,美国的西北大学,今年发布了全球首个应用于临床的人工智能放射系统,X光、CT用放射器械检查身体的系统。在5个月时间内,分析近2.4万份放射报告,它自动识别X光和CT图像,毫秒级之内就能识别危重病,比如肺阻塞,肺动脉进行阻塞,这是几分钟之内可以影响生命的,过去通过拍照让医生和人工智能识别已经来不及了,现在将人工智能做在CT当中自动生成报告,马上就识别了,他特别强调,与依赖ChatGPT等大型通用AI模型不同,该系统完全自主构建,这是人命关天的,故要求是无幻觉,或是将幻觉降至最低。训练数据全部来自于医疗系统内部的真实临床资料,因此系统更加轻量、精准,运行速度更快,已在西北大学所属的12家医院进行部署,所以美国西北大学所属的医院数比浙江大学还要多,浙江大学已经很多了,现在有7、8家,而他有12家,都布置了这些智能放射系统。

跟着前面的预判,专业数据、专业大模型,我们有第三个预判,大模型的发展道路,很可能并不像美国现在所讲的做一个通用大模型,上面做很多垂直大模型这样的一条路,但这条路还在发展,我们认为还可以继续发展,但幻觉问题如何解决,到现在还没有办法,有待于下一步解决。我们认为,存在着第二条道路,用很多的专业数据的中心去训练专业大模型,这个大模型不是在通用大模型基础上做的,直接做专业级大模型,它们交叉起来、联合起来,形成一个通用大模型,这就是人成长的模型,人首先变成专才,然后才能通才。计算机首先要变成通才,最后变成专才,可能会遇到麻烦。我们估计这一条道路可能会更加自然和通畅,在“人工智能+”发展的今天,中国应该两条路同时走,让现在有通用大模型的企业继续做通用大模型,如果某一个行业要重新做的,你们应该首先做专用大模型、产业和大学和政府联合起来做专用大模型,尤其是杭州市和宁波市,浙江省的这些企业,希望在哪几个行业做到全世界的高地上去,这些行业就应该做专业大模型。当然,网易也应该做专业大模型。

趋势二,具身智能不是发展的终点,还会进一步泛化与深化。

具身智能中,从机器人的概念进展到具身智能,具身智能后面的概念一定会更加广阔。“人工智能+”在具身智能旁边提出了两个新的概念:

1、智能终端,这是首次提出的。

2、智能产品。

这些都是具身智能应该关注的地方。所以,我们看机器人的概念扩大到具身智能,马上从机器人扩大到了无人机智能终端、智能设备各种智能产品,这个概念扩大得很厉害,比如全世界生产的机器人,每年生产100万台不到,90多万台的总量,近年来工业机器人在下降,服务机器人在上升,但总数还是这么多。但无人机的产量就比机器人要大得多,乌克兰每年生产的无人机150万台,一个国家就超过了全世界机器人的数量。智能终端将更大,今后汽车就是智能终端的一种,汽车的产能大家也可以想象得到。智能设备、智能产品、智能家电等各种智能机械,武汉开始搞智能的数控机床,范围非常之大。

所以,我们要看到具身智能不能只盯着机器人,它是一个非常大的概念,“人工智能+”就应该将人工智能与更大的产业结合起来。

第二,要向深度发展。

首先,具身智能和智能体会很快地结合起来,也许是明年、后年,也许大后年。

智能体的基本定义,现在还模糊着,具有感知决策行动能力的应用软硬件系统,它已经将硬件包括进去了,它是一个将大模型拿来作为一个产生计算知识的工具,然后在外面包一层其他的算法为应用服务的东西,当然它可以包含感知和行动,这就是和机器人结合在一起的。所以,今后二者一定会结合在一起,结合的目标是,大模型为机器人提供知识,其他的感知、行动都由机器人进行。

具身智能一定会向跨媒体智能发展,我们知道具身智能最早的时候是眼睛和行动系统,目前在做的是人形机器人、狗形机器人,跑的时候要求不跌倒,走得快,能操作东西,看到东西能拿到,这就是手眼系统、脚眼系统,基本就是眼睛和行动。现在他希望大模型能介入,现在全世界研究VLA模型,眼睛和行动的模型外面加上语言模型,机器人后面不是用操作系统进行操作,而是进行语言对话。

但最近浙大的校友,浙大硕士毕业以后到斯坦福去读了一个博士,回来建模,三年以前实际就已经在建模了。我问你学什么?他说在斯坦福学压力传感器。我问现在准备搞什么?他说开一个企业做压力传感器,他说已经开始用于机器人上了,机器人在磨东西的时候,靠视觉是不行的,靠视觉磨好了没有,看不清楚,要靠力学的反应才看得清楚,所以要用压力传感器。我说你赶紧到台州去和数控磨床相结合,数控磨床在磨的时候也没有压力传感器的,所以今后的机器人一定会加力学传感器,力学传感器就由压力传感器进行的,所以今后会变成VLA再加上力学模型,大家看这就是跨媒体发展。多种传感器,视觉传感器、力学传感器、文字反馈,各种信息结合在一起,机器人能进行操作,这就是具身智能还会进一步向深度发展。

目前具身智能基本研究代替,还会向另外两个重要的方向发展:

方向1,群体;方向2,与人进行融合。这两个方向也会迅猛发展。

一讲到群体智能,大家脑袋当中第一个引出的是一大批无人机在天上飞,进行协同工作,这当然用处很大,但更重要的群体智能是异构(非同构),比如智能码头、智能车间、智能矿产,这是目前已经出现的群体智能。

智能码头有三种具身智能:塔吊、智能运载车、智能堆码车,对环境进行感知,最后进行协调的动作。宁波的智能码头已经允许无人车,而且允许有人车联合在码头上进行工作,这个水平就更高了。

人机融合的智能产品目前也在大量出来,名气最响的是马斯克在那儿说的脑机接口,中国也在大量研究,浙江大学还有一个国家重点实验室做了很多工作,今年出来的外骨骼系统发展得很快,深圳的一家公司做了500台,五一节放在泰山底下,拿钱租一下,老年人爬不动泰山,穿上它以后就可以爬上去,据说这个生意很好。

杭州的智元科技,在暑假里做了一大批直接就卖了,据说也是一抢而空,生意非常之好。原因何在?他将外骨骼系统做得很轻,仅1.8公斤。而且在长三角已经出现了生态,国民技术公司外骨骼系统的芯片,碳纤维公司则由浙江精工集团进行生产,电池是由格林美公司进行生产,目前的电池可以支撑2.5小时,希望最后能支撑24小时,所以电池更小、更轻、更长时间、更便宜,生态拉起来以后,中国的外骨骼系统也许能走到高水平,且很便宜,像中国的机器人一样卖到全世界去。

趋势三,人工智能将引领平台经济走向2.0。

平台经济非常重要,平台经济实际是依靠互联网,应用人工智能,用算法和模型从事经济活动的一种组织形式,因此,它的发展实际是一种新的商业形态,对整个经济会产生很大的影响,在国外将这些企业都称为科技企业,我们就分类为服务型企业,但大家都一致承认它在科技上的投入很大,这是科技领先的一些企业。

平台经济在第一波中,杭州也是走在前面的,但主要的是进行生活服务的各种平台,比如淘宝、拼多多、北京有京东,还有为本地的美团、饿了么,还有为旅行的飞猪、携程,还有滴滴出行、哈啰出行,这些平台经济都是为生活服务的,但大模型的应用将出现第二类平台,这就是用技术为产业服务,用技术进行服务的平台,这一类平台今后一个时期将迅猛出现,譬如DeepSeek本身就是一个平台,ChatGPT就是一个平台,Claude、大数据表示,更重要的平台是各种为科研服务的平台,这会掀起平台经济的新高潮,这个高潮称为“平台经济2.0”,这个高潮十分重要,对一个城市的经济发展非常重要。

平台经济1.0对杭州和北京的发展很重要,平台经济2.0也将非常重要,哪一个城市能将这个抓好,哪个城市的经济就可以很快上去。

杭州已经出现了这一类平台,“六小龙”之一的群核科技,很多人关注比较多的是DeepSeek和宇树,实际它很厉害,它已聚集了大量的数据,近五年来90%的户型都在他那儿,他是做室内装修、室内设计的平台,室内设计有关的产品已经聚集了3.2亿个,这不是一个名字,而是一个3D模型,3D模型和色彩都有,有3.2亿个3D模型就已经是非常重要的数据了,在上面与它合作的企业有5万家企业,用户6500万,用户大量是设计师,当然也有室内装修的激发。已经出了54亿张渲染图,人工画要1000元一张,它在这上面已经创造了非常巨大的价值了,每天要设计40万套室内设计,不光是中国,“一带一路”国家,全球基本都用它。它聚集了这样的数据,全世界要出现第二个室内设计的平台,不可能了,很难再打过它了,这就是平台经济的厉害之处。

独家的本领,你给一个二维图纸,就会自动出三维模型,这个模型当中向你推荐各种的室内设计的产品,将它放在这个模型当中去,这个沙发不要,要红木,它就给你红木,这个花型不好,就让你挑,你把花型搞好放在里边,给你提大小的建议。灯具不行就换灯具,室内的颜色不行就可以指定颜色,储物想要怎样的,想要什么样的厨房,各种厨房产品可以应有尽有,49000家附在后面。关键是,你全部搞好了,你认为这是我满意的,可以一键报价,马上算出这个设计,产品连施工一共多少钱,一键出图,施工图纸完全一致化,最厉害的是一键自动出单,将里面的产品全部分布到各个企业当中去,大家就明白为什么有50000家企业挂在它后面了,将这个订单全分布出去了,而且我相信通过这个系统拿到的产品订单一定是价格最优惠的,数量很大,每天有几十万个室内装修在它上面做,这是以计算,以design为技术核心进行的产业链的服务,既为企业服务,又为用户服务。

最后,总书记指出:要发挥人工智能在产业升级、产品开发、服务创新等方面的技术优势,用它来推动各个产业的变革,从而培育新的增长点,形成新动能,“人工智能+”的行动方案,吹响了人工智能和产业结合的冲锋号。我们可以预见,AI2.0在促进我国产业变革升级,形成新质生产力方面一定能发挥越来越大的作用。

我讲完了,谢谢各位!

猜你喜欢