分享

【机器学习】机器学习发现酶驱动反应性的化学特征

 GoDesign 2022-08-17 发布于北京

酶能够高效的催化生物化学反应,因此在工业应用上非常重要。但由于还不完全清楚其启动高效催化的关键因素,因而限制了改造具有新的功能和新的酶的应用的发展。来自MIT的生物工程学院Bruce Tidor所领导的研究组最近发表在JACS期刊上题为“Machine learning identifies chemical characteristics that promote enzyme catalysis”文章,提出一种结合机器学习和统计力学的方法去发现酶催化的关键因素。他们通过学习工业上重要的酶的速率控制步发现仅仅是构象描述符就足够预测酶的反应性,并且推测改造酶只要能包括促进反应性的区域的构象空间就有可能显著的提高其催化的能力。

—— 背景 ——

酶工程改造需要更好的了解酶反应性的驱动,而一些假设是其动态性而非结构性的特征。目前研究的方法包括直接进化,催化抗体和计算酶设计,后两者关注点在于紧密结合的转化状态(transition states)。这些通过直接进化的方法取得了一些进展,但还不能成为普遍性的工具。本文通过酶-底物复合物在没有其转化状态的信息的情况下研究酶催化反应的两个根本性的问题,一是发现其化学反应性的驱动力,二是找出酶-底物复合物中更具有反应性的区域的构象空间。

—— 正文 ——

本文通过研究酶-底物复合物细微的构象效应去找出能够预测其反应性的特征。所采用的模型系统是KARI,一种广泛存在于植物和微生物的酶参与催化分支链氨基酸合成。KARI参与两步反应,第一步反应是速率限制的异构化反应,包括alkyl migration和一个快速的还原反应。其在工业的应用是参与生产异丁醇,由于是速率限制的一步,因此提高其特异的活性能够大大提高异丁醇产品的生产。本文研究KARI与工业相关的速率限制反应,也就是从2S-乙酰乳酸(AL)到2R-2,3-二羟基-3-异戊酸的反应。运用基于QM/MM转化面采样的方法(Transition interface sampling,TIS)模拟野生型的菠菜KARI和对两个数据集总共27条模拟轨迹进行数据分析,一个数据集是反应性的(reactive),另一个数据集是接近反应性(almost reactive),如图一。

图一

作者选择了代表活性位点局部构象的68个几何参数包括原子对的距离,三原子间的平面角,二面角等。这些特征的选择是基于力学假设,包括底物的内在矩阵,底物相对于环境的位置和朝向,尤其是那些能够稳定底物结合和转化态的参数,以及环境的构象的参数。然后用机器学习的方法去选择出代表驱动反应性的特征描述符和建立一个预测模型能够准确的从接近反应性的轨迹中区分出反应性的构象。作者除了通过计算AUC(area under the curve of the receiver operating characteristic)评估单个描述符的表现之外,也运用了线性分类模型LASSO方法为每个时间点的轨迹找出有顺序性的描述符并对优化出一组能够区分反应性构象的描述符。最终由LASSO选择的十个构象描述符建立的模型不仅能够准确的预测反应性,且对训练集外的轨迹也能够准确的预测,对测试集的预测AUC达到90%,准确率大于85%。通过机器学习得到的能够预测反应性的特征包括量化底物构象,底物键极化,金属配位几何参数和其促进底物反应性作用的特征描述符。重要的是,发现的这些构象描述符不仅仅可以判断反应是否发生,更是能够引导和增强其反应性。本文也证明了强化这些代表反应性的特征会大大的增加轨迹到达产物状态的概率。同时,作者提出发现具有促进反应性几何特征的突变体而使酶-底物复合物多呆在具有高反应性的构象而促进其反应活性可能是一个有效的改造酶的方法。

—— 小结 ——

这篇文章作者运用了path-sampling结合QM/MM的方法为机器学习预测酶的反应性形成有效的数据集。本文与之前的研究的不同之处在于,作者定义反应性是根据时间点的相对进程上的催化能力而不仅仅纯粹的看转化状态。本文目前仅运用基于转化面TIS的采样方法形成了两个不同类型的数据集,包括反应性和接近反应性,而TIS的方法可以形成更多不同类型的数据集,结合机器学习的方法可以预测超过两个状态。尽管这篇文章发现的描述符可以预测反应性,但还不能解释这些结构性的和潜在电子效应的特征是怎么协作而促进反应性的。也许更多的量化分析可以帮助更好的理解酶的催化驱动及酶工程改造。  

参考文献:

Bonk, Brian M., et al. "Machine leaning identifies chemical characteristics that promote enzyme catalysis." J. Am. Chem. Soc, 2019, 141 (9), 4108-4118. DOI:10.1021/jacs.8b13879.

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多