《科创板日报》9月21日讯(记者 黄心怡)随着生成式AI和大模型技术的飞速发展,人工智能正深度融入材料科学领域,为材料的发现、设计、优化及性能预测开辟了全新的路径。这一融合不仅加速了新材料研发进程,更推动了材料科学的创新突破。
在由中国科学院上海硅酸盐所承办的2025浦江创新论坛之“AI For Material Science”专题论坛上,多位专家学者齐聚一堂,共同探讨了AI驱动材料科学的最新思考与研究进展。
中国工程院院士谢建新在《新材料大数据中心建设思考》的主旨演讲中指出,当前,伴随着大规模高效计算、颠覆性实验技术、大数据/大模型的蓬勃发展,数据驱动已成为新材料研发的新范式。这一范式不仅有助于新材料的发现,更能助力材料成分设计、工艺优化、性能及质量提升,从而加速新材料、新工艺的研发与应用。
全球范围内,材料数据库的发展势头迅猛。据统计,全球知名数据库已从2010年的16个激增至今天的近50个。我国也在加快材料数据库的建设步伐。2024年10月16日,工业和信息化部、财政部、国家数据局联合印发《新材料大数据中心总体建设方案》,全面部署新材料大数据中心建设。该方案旨在通过建设公益性、权威性、国际化、可持续的新材料领域可信数据空间,解决当前材料数据存在的“孤岛化”现象,以及数据流转共享不通畅、开发利用不深入、潜值释放不充分等问题。
谢建新介绍,新材料大数据中心将构建“1个主平台+N个数据资源节点”的架构。主平台将打造可信数据空间,有机联系数据提供方、应用方、服务方和可信数据运用方四方,通过数据可信管控和资源互联互通,促进数据价值的实现。
然而,新材料可信数据空间的构建也面临着诸多挑战。谢建新表示,一方面是关键技术层面,包括材料数据自动采集处理技术、多源异构材料数据关联、融合和集成技术,以及基于语言大模型的材料数据管理和应用服务技术等都有待进一步探索;另一方面是生态层面,包括材料大数据应用与赋能生态、供给与共享生态、市场与交易生态都有待持续完善。
今年7月,中国科学院自动化研究所副所长曾大军发布了由中国科学院联合团队研发的“磐石·科学基础大模型”。据曾大军介绍,“磐石·科学基础大模型”是采用专业科学知识和数据进行训练、服务于科学任务的智能底座。该模型实现了对波、谱、场等多种科学模态数据的深入理解,具备科学文献萃取融合、科学知识表征推理和科学工具编排规划等核心能力,堪称“AI+科学”的“操作系统”。
在核心架构设计方面,“磐石·科学基础大模型”采用异构混合专家架构。在国产开源大模型基础上,面向科学领域进行深度定制,集成了自主研发的一系列面向共性科学数据模态的专用模型,并融合了AlphaFold、MatterGen等领域专业模型的能力。该模型在化学合成实验效率提升、分子结构预测准确性改善、天文观测智能化资源调度与分析等方面发挥着重要作用。
曾大军透露,通过使用磐石大模型,自动化所中一个原本对材料科学涉足不多的团队,在上海硅酸盐所合作者的指导下,成功地完成了高熵合金(HEA)催化剂的设计工作。他表示,如更多专业的材料科学家能够使用该工具,或将激发出这一模型更多更大的潜力。
上海交通大学教授曾小勤表示,AI赋能材料设计可以分为三个阶段:数据驱动、大模型驱动,再走向智能体驱动。目前,大模型已广泛应用于材料科学研究,包括辅助预测材料性能、结构化数据提取、高通量智能化实验以及材料智能体构建等。
曾小勤透露,目前已开发了基于主动学习的不锈镁合金高通量设计技术,实现不锈镁合金的快速筛选,研制周期大幅减少。同时,设计了一种生成式可解释双模态耐腐蚀合金预测框架,性能优于传统纯数值预测模型,并具有强模型可解释性。此外,基于通义大模型等建立多层级智能体和自动化实验室的材料研发框架,有效解决了合金数据量小、数据复杂的问题。
西安交通大学教授薛德祯也分享了生成式AI在合金设计中的应用。他表示,通过建立预测模型来生成所有可能的合金“池”,并对其进行排序,虽然在小池子时有效,但池子较大时不确定性很高。而生成式AI能够更好地解决合金设计所存在的挑战,比如通过强化学习优化材料性能。
南方科技大学教授张文清则尝试通过数学方面来让AI理解材料。他介绍道:“我们把材料的物性变成一个数学场,以此所有的表达都可以拥有在神经网络中的对应设计。”张文清认为,面向材料科学的人工智能需要理解材料的数学结构。目前材料特性场(MPF)的概念已经成熟,并且MPF确实融入了一些材料数学,特别是全局普适尺度化属性。MPF实现了自下而上的设计,包括材料特定的原子间势能、人工神经网络和特性公式,所有这些都具有通用缩放、超小参数化和超线性特性。SUS2-MLIP和PC-AGNN展现出卓越的物理可扩展性和效率,能够支持数百万原子数的模拟。
不过,张文清也指出,材料科学与AI的融合发展同样面临算力和数据的挑战。未来,随着技术的不断进步和数据的不断积累,AI与材料科学的深度融合将有望催生更多突破性的成果。