(华南师范大学物理学院) 本文选自《物理》2024年第7期 摘要 近年来,计算机算力的飞速提升推动了科学计算和人工智能领域的突破性进展。这两个领域深度融合,共同催生了数据驱动的变革性科学研究范式。作为人工智能技术的代表,机器学习为材料的计算设计带来了前所未有的发展机遇,当前的应用方向主要包括性质预测、合成预测、知识发现、生成式逆向设计等。文章将简要介绍该领域的研究进展,并展望未来发展方向与挑战。 关键词 机器学习,材料设计,材料合成,生成模型 长久以来,新材料的研发主要依赖试错法,这种传统的研究范式不仅耗时费力,而且成本高昂。20世纪中叶起,随着蒙特卡罗方法、分子动力学和密度泛函理论(DFT)等计算物理方法的发展及其在不同材料体系中的应用,计算材料学逐渐成型,并广泛应用于信息技术、能源、化工、生物医药、航空航天等领域,成为探索物质世界、研发新材料的重要工具。近年来,随着计算材料学和人工智能(AI)快速发展,基于机器学习的材料设计逐渐成为可能[1]。机器学习算法能够处理复杂的非线性关系,发现高维数据中的模式和规律,自动从数据中提取隐藏的关键特征,并且具备较强的泛化能力和迭代优化能力。这些优势与材料研究天然匹配,有望解决材料科学中设计空间巨大、构效关系复杂等关键共性难题。 自机器学习被应用于物质科学研究以来,该技术就被广泛用于预测晶体材料的各种性质,如形成能[4—12]、力学性质[5,9,12—15]、热学性质[12—14,16]、能隙[5,6,9,10,12,17]、超导电性[6,18,19]、磁学性质[10,20—23]等。 与预测材料性质相比,预测材料的可合成性、合成路径、合成条件更具挑战性[30—32]。多年来,计算材料学家预测了大量的新材料,然而最终能够被实验成功合成的比例并不高。 材料研究涉及大量的文献、专利和技术报告,其中包含着丰富的知识和数据。然而,这些信息往往以自然语言形式分散在各种来源中,这使得传统的信息检索和数据分析方法难以高效地整合和挖掘这些信息。作为机器学习的一个重要分支,自然语言处理(NLP)模型能够理解和处理复杂的语言结构,帮助材料科学家自动提取文献中的关键信息,包括材料的性质、合成方法、实验条件等,从而加速材料研发的进程[33—38]。 以功能为导向的材料逆向设计,始终是材料研究者们孜孜以求的目标。当前,AI算法的发展正在从传统的“决策式模型”逐步演进为更具创新性的“生成式模型”。关于生成式模型的基本概念,可以参考本刊上一期王磊、张潘老师撰写的《写给物理学家的生成模型》[39]。在近两年里,生成式语言大模型GPT-4和视频大模型Sora的卓越表现,彰显了生成式AI模型的无限潜力,进一步鼓舞了研究者探索材料科学领域的生成式模型[40—48]。 图5 面向光电应用的直接窄禁带半导体的逆向设计工作流程。流程始于在MP数据库上训练一个通用的循环神经网络(RNN),以学习SLICES的语法,之后通过使用直接窄禁带半导体数据集对通用RNN进行调整来训练一个专门的RNN。然后,利用专门的RNN生成了约1000万个SLICES字符串,这些字符串被重建成约340万个晶体结构。这些晶体结构经过筛选,以识别新的直接窄禁带半导体[43] 毫无疑问,数据驱动的机器学习技术正在为材料科学领域带来前所未有的创新活力。尽管在材料设计上已经取得了较大的进展,但仍然存在以下几方面的问题有待于深入研究。 [1] Song Z,Chen X,Meng F et al. Chin. Phys. B,2020,29(11):116103 [2] 张林峰,王涵. 物理,2024,53(7):431 [3] 徐勇. 物理,2024,53(7):442 [4] Ward L,Liu R,Krishna A et al. Phys. Rev. B,2017,96:024104 [5] Xie T,Grossman J C. Phys. Rev. Lett.,2018,120:145301 [6] Zeng S,Zhao Y,Li G et al. npj Comput. Mater.,2019,5:84 [7] Goodall R E A,Lee A A. Nat. Commun.,2020,11:6280 [8] Schmidt J,Pettersson L,Verdozzi C et al. Sci. Adv.,2021,7(49):eabi7948 [9] Chen C,Ong S P. npj Comput. Mater.,2021,7:173 [10] Choudhary K,DeCost B. npj Comput. Mater.,2021,7:185 [11] Davariashtiyani A,Kadkhodaei S. Commun. Mater.,2023,4:105 [12] Yang H,Hu C,Zhou Y et al. 2024,arXiv:2405.04967v2 [13] Isayev O,Oses C,Toher C et al. Nat. Commun.,2017,8(1):15679 [14] Zhang Y,Ling C. npj Comput. Mater.,2018,4:25 [15] Tehrani A M,Oliynyk A O,Parry M et al. J. Am. Chem. Soc.,2018,140:9844 [16] Seko A,Maekawa T,Tsuda K et al. Phys. Rev. B,2014,89:054303 [17] Li X,Blaiszik B,Schwarting M E et al. J. Chem. Phys.,2021,155:154702 [18] Stanev V,Oses C,Kusne A G et al. npj Comput. Mater.,2018,4:29 [19] Choudhary K,Garrity K. npj Comput. Mater.,2022,8:244 [20] Katsikas G,Sarafidis C,Kioseoglou J. Phys. Status Solidi (b),2021,258:2000600 [21] Sanvito S,Oses C,Xue J et al. Sci. Adv.,2017,3(4):e1602241 [22] Lu S,Zhou Q,Guo Y et al. Adv. Mater.,2020,32:2002658 [23] Wang P,Xing J,Jiang X et al. ACS Appl. Mater. Interfaces,2022,14:33726 [24] Saal J E,Kirklin S,Aykol M et al. JOM,2013,65:1501 [25] Jain A,Ong S P,Hautier G et al. APL Materials,2013,1:011002 [26] Curtarolo S,Setyawan W,Har G L W et al. Comput. Mater. Sci.,2012,58:218 [27] https://mdr.nims./collections/5712mb227 [28] Bergerhoff G,Hundt R,Sievers R. J. Chem. Inf. Model.,1983,23:66 [29] Choudhary K,Garrity K F,Reid A C E et al. npj Comput. Mater.,2020,6:173 [30] Yao T S,Tang C Y,Yang M et al. Chin. Phys. Lett.,2019,36:068101 [31] Aykol M,Montoya J H,Hummelshøj J. J. Am. Chem. Soc.,2021,143:9244 [32] Antoniuk E R,Cheon G,Wang G et al. npj Comput. Mater.,2023,9:155 [33] Kim E,Huang K,Tomala A et al. Scientific data,2017,4(1):1 [34] Kim E,Huang K,Saunders A et al. Chem. Mater.,2017,29:9436 [35] Kim E,Jensen Z,van Grootel A et al. J. Chem. Inf. Model.,2020,60:1194 [36] Kononova O,Huo H,He T et al. Sci. Data,2019,6:203 [37] Chen Z,Xie F,Wan M et al. Chin. Phys. B,2023,32:118104 [38] AI4Science M R. 2023,arXiv:2311.07361v2 [39] 王磊,张潘. 物理,2024,53(6):368 [40] Noh J,Kim J,Stein H S et al. Matter,2019,1(5):1370 [41] Court C J,Yildirim B,Jain A et al. J. Chem. Inf. Model.,2020,60:4518 [42] Kim S,Noh J,Gu G H et al. ACS Cent. Sci.,2020,6:1412 [43] Xiao H,Li R,Shi X et al. Nat. Commun.,2023,14:7027 [44] Zhao Y,Siriwardane E M D,Wu Z et al. npj Comput. Mater.,2023,9:38 [45] Yang S,Cho K,Merchant A et al. 2023,arXiv:2311.09235v2 [46] Zeni C,Pinsler R,Zügner D et al. 2024,arXiv:2312.03687v2 [47] Ye C,Weng H,Wu Q. 2024,arXiv:2403.12478v1 [48] Xie T,Fu X,Ganea O E et al. 2021,arXiv:2110.06197 [49] Szymanski N J,Rendy B,Fei Y et al. Nature,2023,624:86 (参考文献可上下滑动查看) 物理与人工智能专题 |
|