昨天我们介绍了MaSIF-NeoSurf的算法原理(点击可跳转),今天我们继续来看作者展示的具体案例与实验验证。 ——具体案例—— 作者对三对复合物进行了配体设计:Venetoclax-Bcl2、孕酮-孕酮抗体DB3以及actinonin-PDF1(图6)。思路如下:首先选择蛋白-小分子二元复合物中形成PPI概率大的区域,然后在小分子结合位置附近的溶剂可及区中挑选1-3个patch,然后在蛋白质数据库中对这些patch进行搜索匹配。选择排名靠前的seed(约100-120个),提取并嫁接到多个支架蛋白上,最终为每对复合物选取约2000条序列。MaSIF生成的序列具有多样性(图6c)。 ![]() 图6. b)图中圈出的部分为可能的PPI界面;c)对生成的配体聚类 小分子存在时,MaSIF生成的序列在预测的结合能(Computed binding energy)、埋藏小分子的溶剂可及表面积(Buried ligand SASA)和原子接触数(Atom contace)等指标上表现优于无小分子的纯蛋白(图7)。 ![]() 图7. 分别从计算结合能(a),互作原子数(b)以及埋藏小分子的SASA(c)三个指标进行表征 ——实验验证—— 设计的序列通过酵母展示实验筛选,两轮分选以后,对富集的克隆进行测序。图8展示了预测的三元复合物结构。小分子不存在时,最优配体不与二元复合物结合;小分子存在时,配体与二元复合物有中等或高的结合力(图8b),这符合分子胶的作用范式。与未结合小分子的纯蛋白相比,二元复合物中小分子贡献了约10-12%的预测目标掩埋表面积,而界面的预测结合能提高了17.0-27.7%,该结果表明小分子对结合事件的小而关键的贡献。作者还对设计配体的特异性进行了实验验证。首先,配体界面上的热点残基的点突变体丧失了与目标复合物的结合;其次,用于稳定的支架蛋白也并不与二元复合物结合(图8c);最后,小分子被替换后(仍可与靶标蛋白形成二元复合物),设计的配体也丧失了结合能力(图8d)。这些实验共同确认了目标复合物上的正确界面具有高配体特异性。 ![]() 图8. 三个案例展示,从左到右分别是Venetoclax-Bcl2、孕酮-孕酮抗体DB3以及actinonin-PDF1;a)展示三元复合物结合界面及热点残基;b)小分子存在时,配体才会与目标蛋白结合;c)配体界面上热点残基突变会导致结合丧失;d)更换小分子后,配体结合也会丧失。 作者对生成的配体进行了位点饱和突变实验(site-saturation mutagenesis,SSM),并通过计算每个突变的平均富集分数来判断突变对结合的影响。从结果来看,预计出现在结合界面上的残基的对单点突变十分敏感,而远离结合位点的残基则对单点突变有相当好的容忍度。 ![]() 图9. 配体结合界面上的残基对点突变的耐受程度,红色表示该位置对突变敏感,而蓝色表示该位置更能容忍突变。目标蛋白以灰色显示。 作者将第一轮设计的蛋白表达纯化,并进行进一步的生物物理表征。设计的配体都是单体的、折叠的并且在溶液中稳定存在。针对所选的三对靶蛋白,设计的配体都有相当的结合力(图10a)。actinonin-PDF1的配体DBAct553_1 KD = 542 nM,Venetoclax-Bcl2的配体DBVen1619_1 KD = 4 μM,孕酮-孕酮抗体DB3的配体DBPro1156_1 KD > 10 μM。值得注意的是,在Venetoclax-Bcl2及孕酮-孕酮抗体DB3这两个例子上,小分子不存在时,配体与目标蛋白也有一定的结合。 于此同时,位点饱和突变实验还揭示了一些增强结合的突变,如Venetoclax-Bcl2配体的M3L及I3K突变;孕酮-孕酮抗体DB3配体的Y12W和S16G突变;actinonin-PDF1配体的R7N及A8R突变。作者接着对配体进行优化以提高KD。 ![]() 图10. a)第一轮计算设计的配体对靶标Venetoclax-Bcl2、孕酮-孕酮抗体DB3以及actinonin-PDF1的结合;b)第一轮计算设计的配体上有益结合的突变(此处发现作者绘图失误,应为S12G,而不是S12)。 Venetoclax-Bcl2:由于配体DBVen1619_1有大量有益的突变候选,作者创建了一个涵盖六个残基的组合库,对由SSM确定的一组有利氨基酸进行采样。六个位置中的三个收敛为单一突变(K1Q、M3L、I13K),而其余三个残基没有收敛。作者设计了一个携带三个有益突变的变体DBVen1619_2,并在酵母展示中证实了结合的提高。在有利突变中,Bcl2–Venetoclax与DBVen1619_2界面核心处的M3L起到了关键作用。亮氨酸的构象刚性可能比甲硫氨酸的旋转异构体灵活性更受青睐,从而降低了结合相互作用的熵损失。另一方面,第二个有益突变(I13K)可能与附近的谷氨酸提供有利的静电相互作用。总体而言,三个突变的引入使亲和力提高了42倍(KD = 96nM,图11b)。 孕酮-孕酮抗体DB3:对于配体DBPro1156_1,SSM实验确定了四个有利的突变,其中两个单点突变(Y12W和S16G)提升了结合,而同时引入这两个突变会显著改善结合(DBPro1156_2)。对DBPro1156_2的建模表明Y12W增加了界面堆积,S16G减少了空间位阻。DBPro1156_2的KD为18 nM,仅通过两个突变就将KD提高了三个数量级(图11b)。 actinonin-PDF1:对于配体DBAct553_1,SSM实验发现了几个轻微提升结合的残基,其中大多数突变(例如R7N和A8R)可能会在界面上形成更复杂的氢键网络。但I3E与R7N双突对结合不利,可能是因为这些在空间上相邻的突变会导致侧链构象发生重大变化。将有益的突变(R7N和A8R)组合起来得到了DBAct553_2,它与actinonin-PDF1的KD为446nM(图11b)。 作者解析了DBAct553_1-actinonin-PDF1的三元复合物晶体结构(PDB:8S1X,图11c)。晶体结构与计算模型非常相似,Cα均方根偏差(r.m.s.d.)为2.33 A,全原子界面均方根偏差(i.r.m.s.d.)为2.26 A。与初始模型的偏差在很大程度上是由于设计支架模型中一个错位的残基(Y2),这导致了N末端螺旋的轻微偏移。在修正该问题后,模型的Cα均方根偏差与实验结构相差0.93 A。值得注意的是, AlphaFold2预测的配体结构与作者计算的结构完全一致,Cα均方根偏差为0.49埃,且残基Y2置朝向正确。总体而言,更多地使用深度学习工具如AlphaFold可以显著提高模型准确性,从而提高成功率。作者还解析了DBPro1156_2-孕酮-孕酮抗体DB3三元复合物的冷冻电镜结构(3.23 A局部分辨率),证实了设计的结合模式以及与小分子的界面结合(图11d)。尽管其余设计没有结构数据,但通过SSM评估的突变敏感性(图9)以及与小分子类似物没有结合(图8d)表明,配体大概率以预想的方式与二元复合物结合。 ![]() 图11. b)通过BLI测定DBVen1619_2、DBPro1156_2和DBAct553_2的KD,其中橙色表示对应的小分子存在,蓝色表示小分子不存在;c)DBAct553_1-actinonin-PDF1(PDB8S1X)三元复合物中DBAct553_1的晶体结构。计算模型(浅粉色)与晶体结构(洋红色)对齐;d)DBPro1156_2-孕酮-孕酮抗体DB3三元复合物的冷冻电镜结构。计算模型(浅蓝色)与冷冻电镜结构(深蓝色)对齐。 ——应用—— 化学小分子控制的生命过程在合成生物学上有重要应用,作者在cell-free system或细胞上测试了设计的配体是否能在复杂环境中被小分子的诱导与目标蛋白形成三元复合物,进而开启下游生物学事件(化学诱导邻近CIP、化学诱导二聚CID在生物学上已经有丰富的应用,包括:开启特定信号通路,控制蛋白质亚细胞定位等)。 孕酮-孕酮抗体DB-DBPro1156_2:将DB3与转录因子ZF438融合,DBPro1156_2与T7 RNA聚合酶融合,在无细胞体系中测试小分子是否能够诱导二聚。在孕酮存在的情况下,异源二聚化促使T7 RNA聚合酶与转录因子之间的距离接近,从而导致报告DNA的转录,并将其翻译为红色荧光蛋白(mCherry)。在没有孕酮的情况下仅观察到基线荧光,而在加入孕酮后荧光增强了15.8倍(图12b)。同样,孕酮滴定显示出剂量依赖性,表明它可能作为一种新的无细胞生物传感器使用。 ![]() 图12. a)孕酮控制的靶基因表达示意图;b)孕酮加入前后荧光变化;c)孕酮滴定实验 作者还在细胞上测试了actinonin-PDF1-DBAct553_2系统,使用小分子开启IL-6R通路并表达下游目的基因或使用小分子开启纳米荧光酶。作者还将Venetoclax-Bcl2-DBVen1619_2系统用于控制CAR-T细胞,简单的说就是在Venetoclax的情况下,CAR-T细胞才会杀伤肿瘤细胞。 考虑到设计任务的难度,实验成功率仍然不高(2000个设计中只有一个配体)。将AlphaFold2作为过滤步骤是提高设计成功率的一种有前景的方法,因为很大一部分设计的序列并不能折叠(图13)。作者接着使用LigandMPNN优化了针对每个蛋白质-小分子复合物的2000条设计的序列,结果显示LigandMPNN优化后的序列,折叠成功率明显提升。重复上文描述的过程,进行第二轮配体筛选,为每个目标复合物选择前500个设计(排除已知的配体),然后进行酵母展示实验。最终为Bcl2-venetoclax筛选并分离出1个新的配体,为PDF1-actinonin筛选并分离出12个新的配体,与原始方法相比,成功率分别提高了4倍和52倍。因此,新型序列设计工具与MaSIF-neosurf方法在复杂的设计任务中会有很有良好的协同作用。 ![]() 图13. 针对每个蛋白质-小分子复合物生成的~2000个设计的AlphaFold单体预测结果。使用原始设计池(a)或使用LigandMPNN(b)优化后进行预测。绘制计算模型的预测置信度(pLDDT)和均方根偏差(RMSD)。将通过严格过滤(RMSD≤1埃和pLDDT≥87)的设计用绿色表示,而过滤失败的设计用红色表示。实验验证过的配体用橙色表示。使用LigandMPNN优化后实验验证过的配体用黑色c-d表示。在LigandMPNN优化之前(c)和之后(d)失败(红色)或通过(绿色)严格AlphaFold2过滤的生成设计的百分比。e.使用原始设计池(第1轮,每个设计约2000个,橙色)获得实验成功率,使用LigandMPNN-优化后的设计池(第2轮,每个设计500个,蓝色)和所有验证过的配体的总和(第1+2轮,每个设计500个,粉色)。 大多数基于深度学习的蛋白质设计方法主要以天然氨基酸库为条件,因此在涉及小分子的相互作用设计方面缺乏通用性。这一差距主要是由于蛋白质-配体结构数据的稀缺,特别是对于三元复合物,在基于蛋白质数据库(PDB)的训练集中,此类结构很少见。基于分子表面物理和化学特征的几何深度学习方法可以克服这些限制,并为蛋白质和小分子复合物提供联合表示。由此产生的新表面捕获并呈现可推广的分子特征,使得设计针对这些混合界面的蛋白质结合剂这一具有挑战性的任务成为可能。值得注意的是,MaSIF的流程捕获了小分子在诱导蛋白质相互作用中细微但关键的贡献(仅占掩埋的可及溶剂表面积的10-12%)。与设计蛋白质的配体工作相比,设计靶向蛋白质-小分子界面的配体的复杂性就在于此。 参考文献 ![]() |
|