2025/03/14 新闻发布会 开发利用AI使化学反应理解自动化的结构 通过深层学习更容易弄清反应机制 (冈崎集团等) 推特 重点 深层学习※2对决定化学反应成败的迁移状态※1的预测有效,但由于深层学习模型的构建本身非常繁杂,适用范围有限 成功实现了深层学习模型的自动化,在大量溶剂分子存在下的反应中也成功高效地预测了迁移状态 人工智能在阐明酶反应等复杂化学反应中的应用,期待通过深层学习深化物性预测分子设计理论 概要 将化学反应反应物和产物隔开的跃迁状态是决定反应成败的重要状态。 转变状态的预测对于反应控制很重要,但从多个原子、多个结构的候补中正确预测转变状态一直以来都很难。 近年来,利用AI的迁移状态预测非常盛行,其中深层学习是以图像识别为首的取得了很多成功的有力方法,但是决定深层学习模型的形状(节点数等体系结构)很麻烦,是应用于化学反应的一大障碍。 这次,九州大学、大阪大学以及分子科学研究所的共同研究小组开发了自动决定深层学习模式,实现化学反应迁移状态预测的方法。 此外,世界上首次表明,设计良好的深层学习模式能够正确捕捉迁移状态的特征,而不依赖于任何体系结构。 九州大学先导物质化学研究所的川岛恭平助教、佐藤拓海先生(综合合理工学府博士前期课程结业)、森俊文副教授与大阪大学研究生院基础工程研究科的金钢副教授、松林伸幸教授、分子科学研究所/综合研究研究生院大学的冈崎圭一副教授一起,开发了自动构筑预测化学反应迁移状态的深层学习的方法,并将其应用于 并且,通过调查各种深层学习模型,明确了即使模型的形状不同,得到的迁移状态的特征也不会改变。 此次发现是通过深层学习实现广泛化学反应迁移状态预测的重要一步,有望为使用AI的化学反应设计和使用深层学习解决各种课题的效率化做出贡献。 本研究成果将于2025年3月14日(星期五)凌晨2点30分(日本时间)刊登在美国物理学协会发行的APL Machine Learning杂志上。 另外,作为特别值得关注的论文,也被选为Editor's Pick。 图1:(上)深层学习模式概述。 需要事先指定连接输入变量和输出变量的中间层的数量、各层中的节点(圆)的数量等。 (中央)超参数※3的自动搜索过程。 通过贝叶斯优化调整层数、每层节点数等。 (下)用优化深层学习模型预测的水中反应的迁移状态结构。 明确了即使是有很多原子参与的反应也能恰当地预测迁移状态。 【研究的背景和经过】 化学反应在从反应前的反应物到反应后的生成物的过程中经过一种叫做过渡状态的活化状态。 跃迁状态是决定反应成败的重要状态,但它是能量不稳定的过渡状态,特别是在溶剂等大量原子分子存在的情况下很难找到跃迁状态。 另外,跃迁状态不仅对化学反应很重要,对理解蛋白质折叠等状态之间的跃迁过程也很重要。 因此,从众多可能的结构中发现和预测跃迁状态是一个重要的课题。 近年来,利用机器学习找到迁移状态的方法的开发非常盛行,我们也到目前为止提出了使用深层学习的方法。 特别是深层学习是在从图像·语音识别到自动翻译·自动驾驶等各个领域取得划时代成果的有力方法。 在深层学习中,通过改变被称为超参数的多个参数,可以构建各种各样的模型,发挥高性能。 但是,超参数需要事先确定,存在着进行该选择工作需要大量的工作时间的课题。 并且,深层学习模型的精度对超参数的依赖程度也不清楚,一直以来都是深层学习应用于迁移状态预测的障碍。 【研究内容和成果】 此次联合研究小组开发了自动化深层学习繁杂的超参数决定过程的方法,并将其展开为化学反应的模拟分析,证实了即使是在含有大量溶剂分子的环境下的反应也可以预测迁移状态。 在研究中,首先通过被称为分子动力学模拟的计算机模拟,收集了很多沿着多肽链※4的异构化反应过程的分子结构。 另外,通过模拟分别求出能够从这些结构到达生成物的“概率”。 其次,以分子的坐标为输入变量,以到达生成物的概率为输出变量,构建学习两者关系的深层学习模型(图1上)。 以前,需要在这里指定深层学习模型的超级参数,但这次我们开发了使用称为贝叶斯优化的优化方法自动确定最佳超级参数的方法(图1中央)。 由此,实现了能够最好地再现到达迁移状态的概率的深层学习模型的自动确定。 通过该方法求解了预测多肽链异构化反应迁移状态的深层学习模型,由于初始条件的不同,得到了相同精度的各种不同超参数的深层学习模型。 为了调查这些深层学习模式的差异,利用被称为“可说明的ai”※5的人工智能技术,确定了什么样的输入变量(分子结构坐标)有助于反应成败的决定。 结果表明,即使深层学习模型的形式不同,重要的输入变量也不会改变。 由此,利用深层学习成功地理解了异构化反应的机理和预测了跃迁状态。 并且,将其应用于以水分子为溶剂存在大量水分子的环境下的异构化反应时,也成功地确定了迄今为止几乎没有成功案例的溶剂存在下的反应坐标(图1下)。 【今后的发展】 本研究成果是通过自动化深层学习繁杂的模型制作,证实了即使是复杂系统中的化学反应也能够预测迁移状态的例子。 迁移状态的预测直接关系到化学反应选择性效率的提高和新反应的设计。 另外,还可以应用于酶反应和生物分子的功能表达等更复杂的状态变化机制的阐明。 而且,深层学习不仅可以用于化学反应,还可以期待得到广泛的利用,如果应用这次的研究成果,可以期待对使用深层学习的物性预测分子设计理论的深化,以及使用机器学习的各种课题解决的效率化做出贡献。 【用语解说】 (※1 )转移状态 是指在化学反应中从反应物向生成物过渡的过程中的不稳定的活化状态。 跃迁状态理论中相当于势能曲面的鞍点。 (※2 )深层学习 模拟基于生物突触连接的神经回路网的机器学习模型被称为人工神经网络。 并且,在输入层和输出层之间准备多个中间层,使各层学习数据中包含的特征的模型称为深层学习或深度学习。 (※3 )超参数 是决定深层学习模式形式的变量群,包括深层学习模式层数、每层存在的变量数等,是进行深层学习时需要事先确定的变量。 与此相对,深层学习模型在学习过程中进行优化的权重简称为参数,以区别于超参数。 (※4 )多肽链 氨基酸聚合形成多肽链,构成蛋白质一级结构的序列。 多肽链中,空间位阻决定了主链二面角的可取范围。 了解多肽链主链二面角异构化反应的跃迁状态是理解蛋白质折叠的基本课题。 (※5 )可解释的AI 深层学习的发展使得图像、文本、语音的识别更加先进,但深层学习是一种黑匣子式的学习模式,难以理解为什么内部会做出这样的预测。 因此,对学习结果赋予说明性的“可说明的人工智能( Explainable AI: XAI )”的技术备受瞩目。 本研究采用了XAI中给出局部描述性的lime (局部互操作模型扩展)和shap ( Shapley additive explanations )两种方法 【谢辞】 本研究涉及JSPS科研经费( JP22H02035、JP23K23303、JP23KK0254、JP24K21756、JP22H02595、JP22K03550、JP23H02622、JP23K23858、JP23K27313 另外,在本研究的计算机模拟中,记载了自然科学研究机构冈崎共同研究设施设计计算科学研究中心( 23-IMS-c111、24-IMS-c051、24-IMS-c105、24-IMS-c198 )和筑波大学计算科学研究中心 【论文信息】 刊登杂志: APL Machine Learning 标题: investigating the hyperparameter space of deep neural network models for reaction coordinates 作者名称: Kyohei Kawashima,Takumi Sato,Kei-ichi Okazaki,Kang Kim,Nobuyuki Matubayasi,Toshifumi Mori DOI:10.1063/5.0252631 |
|