炎症性肠病(IBD),包括了克罗恩病(CD)和溃疡性结肠炎(UC),是一种多因子胃肠道慢性疾病。IBD的病变过程与肠道菌群的显著变化密切相关,特别是肠道代谢组水平的变化——即宿主与微生物组之间分子层面变化原因还未阐明。为了解决这一问题,我们从发现队列(n=155),以及验证组(n=65)中,挑取具有CD,UC特征以及未患IBD的对照组病人,并选取其中的典型代表,采用非靶向代谢组学和鸟枪法宏基因组学对其粪便样本进行分析,发现代谢组学和宏基因组学上的特征变化与粪便中的钙网蛋白(一种肠道炎症测试指标)变化水平具有显著相关性。在超过8000种特征代谢物中,我们发现IBD患者的某些特征物丰度较对照存在差异,包括鞘脂类和胆酸浓度变化,以及三酰基甘油和四吡咯的下降。然而,超过50%丰度差异特征代谢物难以鉴定,其余的可以通过代谢组学“连坐”(已知代谢物相关变异)假定推测为某种物质。宏基因组分析发现,菌群种类及功能存在差异,反映出IBD肠道中对氧化应激的适应情况,这与之前的研究结果相一致。进一步将这些数据整合分析,在丰度差异菌群种类和差异特征明显的丰富代谢物之间,共鉴定出122种明确的关联,表明在IBD中可能存在某些机械性关系进而导致了对肠道的扰乱。最后发现,对IBD的特征,采用代谢组学和宏基因组学为基础分类分析,其结果具有高度精确性,像大多数个性化验证的趋势,此方法可以推广于个体独立验证。我们的研究对于理解IBD中微生物组学——代谢组学表层扰乱现象的原因给出了更进一步的解释,包括多种潜在诊断和治疗靶点鉴定。 论文ID 原名:Gut microbiome structure and metabolic activity in inflammatory bowel disease 译名:炎症性肠病中肠道菌群结构及代谢活动变化 期刊:Nature Microbiology IF:14.174 发表时间:2018.12.10 通信作者:Curtis Huttenhower;Ramnik J. Xavier 通信作者单位:麻省理工学院,哈佛大学 背 景 炎症性肠病(IBD)是一种胃肠道慢性疾病,由肠道微生物和肠道免疫系统交互作用的变更所引起。溃疡性结肠炎(UC)和克罗恩病(CD)是IBD中常见的亚型代表,分别于大肠和小肠处发作,同时具有独特的微生物群落特征。之前的研究已表明,IBD患者的肠道菌群结构发生了显著变化。同时,菌群结构能够通过代谢物的方式改变结肠生态环境,而这些代谢物可以对机体信号通路、免疫系统调节或者抗菌活性起到影响作用。然而,特定的微生物和它们所调控的小分子,与引发、维持、缓解或者炎症的预测如IBD之间的相互作用关系并不清楚。 大体上,肠道代谢物的特征由饮食,人体代谢物以及微生物代谢物共同决定,而这些物质能够塑造微生物群与宿主之间的相互作用关系。例如,通过肠道细菌消化分解的膳食纤维,能够转化为短链脂肪酸(SCFAs),如丁酸、乙酸和丙酸。SCFAs能够通过调节组蛋白脱乙酰酶抑制活性、基因表达、细胞增殖以及免疫应答来影响宿主细胞。此外,丁酸可以通过调控Treg细胞产量以及增强巨噬细胞抗菌活性来抑制结肠炎症。IBD患者粪便中的丁酸含量显著下降,对应的丁酸产生菌数量也在下降,这说明SCFA在调节系统免疫功能中具有重要作用。 共生微生物也可以通过对可利用代谢物进行改变,进而调整宿主产生的信号分子。无菌小鼠的非靶向血清代谢组学相比于传统小鼠表现出更多血清代谢物水平的上升,这是因为共生微生物的作用。例如,色氨酸代谢水平受到肠道微生物的显著影响,通过微生物的色氨酸脱羧酶作用,食物中的色氨酸转变为色胺和其他小分子。微生物衍生的色氨酸代谢物不但能够通过降低色氨酸的利用率(这会导致血清素产量的紊乱),而且还会产生吲哚类衍生物来激活芳烃受体,进而改变宿主生理学功能。有研究表明,CD患者的微生物组样本中,与色氨酸代谢有关的基因表达水平均有所下降。最近的一项小鼠实验研究表明,缺乏了IBD敏感性基因中的一个基因CARD9,可以改变小鼠色氨酸的微生物代谢方式,进而使其更容易感染结肠炎。 不少研究表明IBD患者的粪便代谢物各有差异。然而,这些研究都是以小部分或者简单的16S rRNA扩增子测序为基础来解析IBD相关的微生物群特征(也就是说,缺乏鸟枪宏基因组信息)。有研究表明,16S rRNA微生物组测序与非靶向粪便代谢组学结合起来,分析效果要优于靶向代谢组学。在一项非活跃性儿科IBD研究中发现,与IBD相关的菌群种类和代谢物表型之间存在高度相关性。同样的研究发现,健康的直系血亲,其微生物组和代谢物表型与具有非活动性疾病的其他亲属相似。与健康个体肠道菌群多样性相比,CD和UC患者的肠道微生物组群均表现出菌群多样性的下降,主要伴随着厚壁菌门中门水平的下降以及变形菌门中门水平的上升。CD患者的菌群,尤其是梭菌属比例的变更:毛螺菌科和疣微菌科中罗氏菌属和粪杆菌属比例的下降,而活泼瘤胃球菌比例上升。综合来看,目前的这些研究结果表明肠道代谢组还没有特征性的分子关联着炎症和最终的IBD,而这些分子可能主要是微生物衍生的或者修饰下的产物。 本研究,我们采用客观公正的方法来鉴定IBD患者和非IBD健康对照中肠道代谢物,微生物种类以及微生物酶的差异。采用非靶向LC-MS代谢组学分析方法和鸟枪法宏基因组测序技术来解析来自于由155位组成的发现队列,和65位组成的验证组的粪便样本,且每一组对于UC、CD以及正常对照病人均有截面采样指标测试。宏基因组学分析结果和以往的大多数研究相一致,代谢组学分析发现IBD中有超过2700个差异丰富的代谢物,包括了224种代谢物(UC和CD组)水平显著升高。与IBD相关的升高代谢物,如鞘脂类和胆酸类,以及很多特征不明显的代谢物的富集很可能是源于微生物。的确,许多差异丰富的代谢产物与差异丰富的微生物群和酶类密切关联,这也暗示了它们之间的生物学机制与丰度关系。最后,对来自发现队列和验证组的绝大部分IBD进行多次重复试验,可以确定,通过微生物组和代谢扰动对IBD进行分析,是一种行之有效的方法。 实验结果 为了解析IBD患者肠道代谢物及菌群结构的特征,我们收集了已登记的患者粪便,并进行分析。155例病人中:68例患有CD,53例患有UC,34例IBD对照(Fig.1a)。每份粪便样本在做完宏基因组分析后,随后进行菌群结构种类组成和功能性分析。此外,采用四种LC-MS方法对样品中的极性代谢物、脂质、游离脂肪酸和胆酸进行测定。非靶向模式中,采用高灵敏性高分辨率质谱仪进行LC-MS代谢组学分析,可以捕获大量已知和未知代谢物,包括那些很可能源自于微生物代谢所产生的物质。 图1. IBD个体的肠道多组学特征变化。a,两组IBD中粪便宏基因组和代谢组分析:含有155例的发现队列(PRISM)和含有65例的验证组。b,以肠道代谢组学特性(Bray–Curtis 距离)为基础进行PRISM队列中个体的PCoA分析。c,相同个体在肠道宏基因组物种特性之间的Bray–Curtis距离。d,e,患者粪便中钙网蛋白水平(μg g−1)分别对应b,c中的第一个PCoA轴线。注:钙网蛋白的测定并未包含所有患者。 以人类代谢组数据库(HMDB)中的数据为比对基础,对检测出的3829种代谢物特征(占总比43%)进行推断比对定性。通过与内部化合物数据库所产生的参考资料进行比对,确定并标注了466种特征(代表346种独特化合物)为标准物质。对鸟枪法宏基因组学和代谢组学数据进行分析,(1)鉴定IBD-与其亚型疾病患者的微生物及代谢物变化特征,(2)描述微生物特征和代谢物特征之间的关联性,(3)总体评估这些特性指标是否能够有效且准确的反应出IBD及其亚型疾病的症状及活性水平。PRISM中,独立确定了20位CD患者,23位UC患者以及22位正常对照(来自荷兰)。具体数据及分析结果如下所述。
IBD患者中与宿主炎症相对应的广谱代谢物变化 155位PRISM病人,超过8000种代谢物特征在非IBD对照和CD病人之间存在差异性的变异模式,这说明两种表型之间的代谢物存在显著差异(Fig. 1b),而这种差异是源于多种数据组合,包括了宿主组织中病变活动,IBD中微生物组改变引起的活性以及患者饮食和用药等。UC患者代谢物特征呈现出更为广的分布,大约有一半的代谢物特征类似于非IBD对照,而剩下的则更偏向CD患者的代谢物特征。相似的变化趋势也表现在微生物种群结构上,以及来自患者对应的宏基因组(Fig. 1c)。具体来说,分类的第一个轴对应的两个数据集具有高度的正相关性(Spearman’s r = 0.664,two-tailed P <>−20),这与肠道代谢特征,菌群结构特征以及疾病状况相一致。 我们假设代谢物特征在每个人中均表现出广度的变化,尤其是在UC患者中,这可能是导致活动性炎症在个体水平上存在差异的一部分原因。通过将代谢物变化第一轴与个体粪便钙网蛋白(IBD中的炎症标记物)水平进行比对,进行评估。对93例病人中粪便钙网蛋白进行测定,发现代谢物变化第一轴与粪便钙网蛋白之间具有较强的关联性(Spearman’s r = 0.486, two-tailed P <>−6; Fig. 1d)。导致这种关联的部分原因,是对照组个体的钙网蛋白水平非常低(均值=35 μg g−1),而CD患者中水平非常高(均值=130 μg g−1)所造成。然而,在评估UC患者时,同样存在这种高度显著相关性。在粪便钙网蛋白测定和宏基因组变化第一轴中,我们同样发现这种相似的趋势(Fig. 1e),由此得出结论,UC患者不同于对照组的炎症水平,而是表现出更多的活动性炎症;其次,这种变异可能会引起UC患者更多的异构代谢和宏基因组特征变化。 代谢组学和微生物分类变化的第一轴也与香农多样性存在显著相关性。与之前的结果相一致,更多的炎症,类似于IBD样本(Fig. 1c),表现出香农多样性的显著下降((Spearman’s r = − 0.572,two-tailed P <>−14,n = 155)。相似的,在代谢物特征中同样观察到了这种趋势(Spearman’s r = − 0.321,P <>−4,n = 155),总体上表现出较小的样品内多样性变异,虽然趋势较弱。值得注意的是,这些相互关联的多样性不足以说明代谢组学第一轴和分类变异之间真的具有强耦合作用。 PRISM(发现队列)中的68例CD患者依据其疾病情况分为不同小组:L1(回肠,n=14),L2(结肠,n=22),L3(回肠结肠,n=29),L1+L4(回肠+上消化道,n=1),未知的(n=2)。对于从CD和非IBD中筛选出个体的代谢组和宏基因组数据进行分析,我们发现在CD患者中,几乎没有观察到依据疾病情况的未分层现象。更确切地说,综合诊断(CD/UC/非IBD)结果表明,个体之间的代谢组和宏基因组特征变异情况表现出统计学上的显著性差异分值(方差排列分析,P <>−4),而疾病情况在CD患者中并未表现出显著影响(P = 0.22和P = 0.35),可能是因为PRISM队列中IBD的既定性质。基于这个结果的发现,在随后的数据分析中,我们把CD作为单一诊断来处理和分析。
IBD与对照表型之间代谢物富集度的差异 为了在更高分辨率的水平上仔细分析IBD患者代谢物变化特征,我们采用多元线性模型去对应每种代谢物特征,以考查其与IBD表型之间的关联性,并控制其他的协变量(年龄和用药)UC-和CD-的特定效应的P值采用多重假设进行修正(FDR 0.05)。尽管采用了这道严格的过滤程序,在IBD中还是有2729种丰度显著不同的代谢物特征(31%),包括200种与151种标准物不匹配的代谢物。在所有差异丰富的代谢物中,与非IBD对照相比,绝大部分(1931;71%)在IBD(CD或UC)中显著降低;而在CD和UC中,有224种(8%)显著升高;在CD中,有505种(19%)表现出极显著升高;而在UC(UC患者的更多异构代谢特征引发的可能性结果)中只有69种(3%)表现出极显著地提高。大量个体差异丰富的代谢物与IBD患者代谢物特征中的较大变化之间存在相一致的关系(Fig. 1b)。 图2. IBD和对照表型中代谢物的丰度差异。采用魏克森讯号等级检定来评估个体代谢物差异丰度趋势,以确定IBD中富集丰富的分子类别。a,专注于至少有10个假定种类的分子类别(见N列),8种在CD中(FDR q <>)正富集显著,表明这些种类在CD中丰度更高,17种呈反富集显著,表明这些种类在对照中丰度更高。b,UC和对照中的子集之间相比这些种类丰度同样显著。虚线表示个体代谢物特征的显著性阈值(abs(t) > 2.61)。c-h,68例CD,53例UC和34例非IBD对照中个体差异丰富标准衡量示例。c-f高亮的代谢物表示a和b中的典型代谢物。每种LC-MS方法中单独以及集中后丰度用ppm表示;用可视化方阵表示数值。箱型图“boxes”表示第一,第二,第三分位数值。“whiskers”表示数据内栏,而内栏外的点认定为离群值。
采用富集分析(魏克森讯号等级检定)来确定混合物质的大类,这些混合物质在IBD表型中表现出显著地中低等丰度。以HMDB注释为基础,确定了代谢物质的分类,并聚焦于97种代谢物,关联了至少数据集中的10种假定类别。在这些类别中,经过多假设检验之后(Benjamini–Hochberg FDR q <>),收集IBD或者非IBD中表现出统计学上显著性的富集类别。97种分子类别中的8种在CD中表现出显著地高丰度,在鞘脂类、甲亚氨酸以及胆酸中观察到的效果最强(Fig. 2a);7种在UC中表现出额外的明显过剩,虽然苯乙醯胺类得以提高,但未达到统计学上的显著水平(Fig. 2b)。UC中没有出现特别地过剩分子类别。 IBD富集型胆盐包括了胆酯(q = 0.003)和鹅脱氧胆酸盐(q = 0.0002;Fig. 2c)。健康人群肠道中,这些初级胆酸能够在脂类中消化,并通过微生物的去结合作用转化为次级胆酸。在CD中,我们观察到了解离态的次级石胆酸盐和脱氧胆酸盐之间互补作用的消失或者损耗,但这种变化并不符合FDR显著性分析的临界值(q分别为0.06和0.13)。IBD患者肠道中初级胆酸的相对过丰这一特点与IBD微生物组中胆酸转化活力的破坏相一致。鞘脂类,是IBD中另一种过丰类物质,在健康人体肠道中扮演多重角色,包括(1)肠细胞膜结构成分;(2)细胞分化中的重要信号分子。除了存在人体细胞膜上,鞘脂类也普遍存在于拟杆菌细胞膜上,而这些微生物衍生的鞘脂类能够调节恒定的自然T细胞的数量。之前的研究表明,鞘磷脂的代谢在IBD中会被干扰和破坏,导致特殊鞘脂类物质的累积,进而诱发炎症水平的升高。这些物质中,神经酰胺和鞘磷脂(Fig. 2d)在CD和UC中均表现出显著地过丰水平(q <>)。 相比于对照,CD和UC中的很多分子物质类别显著下降(Fig. 2a,b)。三萜类和长链脂肪酸(LCFAs,包括羟基十四烷酸,Fig. 2e)是下降最多的两类(分别为135和111),而phenylbenzodioxanes和胆固醇(包括胆甾烯酮)是最稳定的下降类别(它们中的大多数在CD中下降显著)。Phenylbenzodioxanes主要源自于水果,这一结果加固了原有概念,即一些能够检测到的代谢物变化是个体饮食变化的结果。三酰基甘油(TAGs),包括C54:6 TAG(Fig. 2f),相比于CD和UC患者,在对照中富集水平较高。这种变化,结合LCFAs和胆固醇的富集水平,与之前报道的IBD中脂肪酸代谢的潜在扰乱相一致。 然而它们的分子类别在IBD中的富集程度并不是普遍存在差异的,还有其它显著不同的代谢物如乳酸(IBD上端;Fig. 2g)和泛酸(IBD下端;Fig. 2h)。之前有报道表明在CD和UC病人中乳酸有所升高,主要是由IBD肠道微生物组中的某些成员所产生,包括乳杆菌、肠球菌以及片球菌。泛酸(维生素B5)是辅酶A的前体物质,存在于脂肪酸的代谢过程。而且,健康人群肠道能够产生泛酸;因此(像乳酸),它在IBD患者体内丰度的差异可能预示着肠道微生物与代谢物之间的关系被打乱,这一点我们后面详细探索。在这个队列中虽然没有统计学上的显著差异,但相比于对照组,SCFAs类中的丁酸和丙酸在UC和CD患者体内均有所下降。
IBD患者化学相关的物质模块紊乱 为了进一步探究2729种差异丰富代谢物的潜在生物学模式,我们以线性模型中相似残差为基础,对差异丰富的代谢物进行集合。这种方法可以使代谢物共聚并转向为共变,这种共变与IBD表型、年龄以及用药无关。共确定了1403个这样的聚类(mean intracluster Spearman’s r > 0.7)。每个聚类被指定为一种代表性代谢物:即聚类中心或者最接近中心的标准代谢物(适用情况下)。50个最大的聚类代表了780种差异丰富的特征物(占整体的29%),与少数的生物信号相一致,表明有许多差异丰富的代谢产物。 共变代谢物的聚类能够在多种机制的共同作用下提高,包括了:(1)共同亲本代谢物的化学修饰;(2)通过生化途径进行的代谢物互作;(3)特定微生物引导的代谢物共产;以及(4)来源于特定饮食的代谢物。代谢物共变产生的生物信号,特别是来自于代谢物互换的那部分信号,能够被用来将注释代谢物对应的信息传递到它们未注释的部分。这种“连坐”原理也出现在基因共表达数据中,可用于确定功能性相关基因的模块并预测功能基因的分配。根据这种逻辑,我们发现了共聚类代谢物具有更相似的2.7×保留时间、3.0×质荷比以及15×更可能属于相同的化学种类(相对于随机代谢物配对)。因此,聚类能够在相似的理化性质上富集,而这样的聚类共同体可能能够进行性能预测。 图3. 共变丰度解析化学相关聚类,以及IBD-扰乱的代谢物。a,第二大聚类含有39种代谢物特征,它们在CD患者中显著升高。这种聚类在假定的胆酸及其衍生物中均有富集。在该聚类中出现了标准胆盐(浅绿色三角)和鹅脱氧胆酸盐(深绿色三角)多重变量。b,最大的聚类包含了62种代谢物特征,它们在非IBD对照中显著升高。这种聚类在假定的四吡咯及其衍生物中均有富集。155个样品依次均表现为该方式。注:UC患者中,类似control vs 类似CD子集。
IBD中富集的最大代谢物聚类包含了39种代谢物特征,它们在CD中均有富集,且在UC中也有一个额外额富集(Fig. 3a)。这个聚类包含了12种假定胆酸,匹配到的包括胆酯、鹅脱氧胆酸盐的结构变异。这个聚类也包含了17种未标记代谢物,可能与胆盐代谢有关。最大的聚类包含有62种代谢物特征:在对照中均有所升高(Fig. 3b)。该聚类中,有11种特征推测为四吡咯,但是该聚类不含有已知的标准代谢物,因此可作为进一步分析的新靶点。之前所述UC患者中的类似对照和CD在这些个体聚类中也是显而易见的。 其他聚类包括第三大聚类(33种),在非IBD对照中也有升高,且包含了各种各样的TAG代谢物。聚类13(18种)只在CD患者中有所升高,并富集为有机含氮化合物,包括标准的linoleoyl ethanolamide、十六酰胺乙醇以及油酰单乙醇胺。聚类23和25在CD和UC患者中均有升高,包含了各种各样的长链脂肪酸,包括标准的花生四烯酸、肾上腺酸、二十二碳五烯酸以及二十碳三烯酸。值得注意的是,99种聚类(7%)含有的标准物质比规则多;大多数聚类还是未知的,这可能与许多之前未描述的、微生物来源的IBD相关代谢物有关。
IBD微生物组群落组成在种级水平上的变化 个体肠道微生物组的分类学特征能够显示非IBD对照和CD表型之间最大变异来源的区别,而UC患者表现出更多的异构性(Fig. 1b)。进一步分析该趋势,采用前面讲到的线性建模方法来评估195个种级分枝(来自67个属)的丰度。共50个种在一个或者多个表型上差异丰富,而其中的35个在对照中,相较于IBD组有所提高。在这些种类中,Roseburia hominis,Dorea formicigenerans以及Ruminococcus obeum在非IBD对照中表现出最强的丰度。实际上这几个种以及其它的一些种类在IBD中是显著下降的(相比于非IBD),这也与IBD中微生物组种类多样性缺失的总体趋势相一致。未分类的Roseburia种在CD和UC患者中均显著升高,然而在UC中,短双歧杆菌和共生梭菌是唯一的差异丰富的种属。在CD中,共有12个种是唯一的差异丰富的种属,包括了R. gnavus,大肠杆菌以及梭形芽胞梭菌。而这些特定的种属中的绝大多数,其丰度与缺失与之前很多报道研究相一致。
IBD相关联微生物与代谢物之间的关联机制 这种数据集形式的多组学数据分析能够鉴定微生物的特性和代谢物特性:(1)这些代谢物在IBD中差异丰富;(2)且它们之间的相互联系与疾病密切相关。这样的关系与IBD发病时的微生物种群差异呈正相关。例如,一种代谢物与某个物种之间的正相关表明该代谢物能够促进这个物种的生长,或者该物种能够产生这种代谢物。为了鉴别这种互作关系,我们采用大规模关联规则去分析代谢物与物种之间的不同丰度,聚焦于典型的差异丰富的代谢物和种属变化。更重要的是,这种关联规则被应用于从之前的线性模型中得到的代谢物与物种丰度关系的分析中,趋向于疾病水平互作关系单纯驱动的非强调性关联。这一结果说明在代表性差异丰富的代谢物和种属之间,共有15679个FDR-显著性关联(q <>)。在这些关联中,乳酸与乳酸片球菌呈现正相关(Spearman’s r = 0.23),这是一种预期的微生物定向代谢物(Fig. 2g)。为了加深认识和理解假定机械关系在疾病中所带来的扰乱,我们专门聚焦于名义上显著(P <>)的子集,即来自于同方向上非IBD对照的未加工代谢物和种属丰度(这类关联定义为“对照中的确定”)。 图4 IBD关联微生物和代谢物之间潜在的机械性关联。a,IBD中微生物和小分子物质的协变,特别是那些关联着FDR-显著性,确定的对照宏基因组种类和代谢物,与标准物相匹配。当多重代谢物特征与相同标准物特征相匹配,选择均值绝对相关性最高的特征进行绘图。标记有星号的代谢物表明与标准的同分异构体相匹配,难以区分。标准的L-1, 2, 3, 4-tetrahydro-beta-carboline-3-carboxylic acid作为‘cyclomethyltryptophan’。ADMA,不对称二甲基精氨酸;LPC,溶血磷脂胆碱;MAG,单酰甘油。b-d,CD,UC以及非IBD对照中个体相关性示例。
过滤后的数据集含有在差异丰富代谢物和种属之间共2279个关联,包括标准及特征性种属共122个关联(Fig. 4a)。关联分析覆盖了901种代谢物聚类,代表了1878中差异丰富的代谢物;50个差异丰富的种属中的46个至少存在一种关联。然而,虽然这些代谢物和种属之间存在大量的可能性关联,但只有6%具有统计学上的显著性,并在对照中得以确认。这就意味着,尽管很多代谢物与一种或多种微生物相关联,但它们并不符合与大多数微生物的机械关联性关系(反之亦然)。而在代谢物和微生物之间关联的最大群体表现出正相关,二者在对照组中均有提高(1398种关联;占显著性关联中的61%)。这些关联是疾病相一致的一般模式中的典型代表,例如,一个物种产生一种保护性代谢物。紊乱性关联,例如,疾病中代谢物和物种之间的负相关只占所有关联中的2%。这些例子表明,虽然物种与代谢物之间可能存在机械上的关联,但这种机制对于直接加重IBD发病机理并不十分明显。 CD相关联化合物ETA和DPA存在于与对照相关物种的负关联中,以及IBD相关物种的正关联中。ETA和DPA均属于多不饱和LCFAs,如omega-3和omega-6脂肪酸。ETA和DPA均是真核细胞膜的重要组成部分;IBD患者肠道中ETA和DPA升高可能意味着宿主细胞死亡或更新的速率相对提高了,或者是从饮食中的吸收减少了。除了在免疫以及炎症信号中的角色外,多不饱和LCFAs具有抗菌活性,主要是通过它们天然的疏水性来破坏细菌细胞的生物膜。这种活性与涉及ETA的过程中存在特殊的负相关(例如,与Eubacterium ventriosum之间;Fig. 4b),其中的若干具有“相互排斥”的性质(即当ETA存在,对应的微生物缺失,反之亦然)。相反的,DPA与IBD中相关微生物存在正相关性,其中与R. gnavus之间最为显著(Fig. 4c)。这表明DPA很可能是通过干扰与健康相关的物种,来促进这些物种的生长。 辛酸,是一种中链脂肪酸(MCFA),具有抗菌和抗病毒活性。我们的数据显示,辛酸在非IBD对照中富集量较高,这与之前报道过的一些结果相一致。像SCFAs一样,MCFAs很可能出现在肠道中,作为纤维厌氧发酵下的一种分解产物,但也可能主要来源于饮食。与这个观点相一致,辛酸与一系列健康相关的肠道厌氧菌(Alistipes shahii,Alistipes putredinis以及Alistipes finegoldii)成正相关。另一方面,辛酸与R.gnavus的丰度表现出显著的负相关性(Fig. 4d)。这样的一个负相关与R.gnavus对于辛酸的代谢和摄入相一致(这种情况下,随着物种丰度的增加,更多的辛酸被消耗殆尽)。或者,与上述抗菌特性更为一致,辛酸在抑制R. gnavus生长中起到了作用。 为了通过试验验证IBD关联的代谢物是否具有促进IBD相关物种生长的潜力,在含有八种代谢物分子的情况下培养R. gnavus,这些分子与之前的分析相关。在四种预测的负关联中,高浓度的辛酸真正的抑制了R. gnavus的生长,如上假设。在四种预测的正关联中,确定了牛磺酸和DPA能够促进其生长,而植物鞘氨醇则表现出了抑制作用。考虑到影响生长的因素有很多,例如,菌株的特异性和分子物质浓度,可能会对生长有些潜在的影响,例如,副产物,这些结果在后续实验中,对于我们的多组学关联性分析构架提供了初步的有利支撑。
IBD关联的微生物功能和它们代谢物之间的关系变化 为了理解IBD中微生物群落变化所带来的功能影响,我们首先对所有宏基因组中的基因家族进行功能性描述,之后根据酶学委员会(EC)数字注释总结它们的丰度。我们采用之前所说的线性模型去评估这个酶的丰富数据,发现共568个酶在CD、UC或者二者中差异丰富(FDR-corrected q <>)。然而,通过对种级功能属性数据进行检查,发现这类差异丰富的酶有很多,这是由于单一的IBD相关种属主导的酶对于菌群结构的影响所致。更具体地说,当定义“dominating”为“在>样品50%中的酶拷贝数> 50%为explaining”,大肠杆菌单独控制着220个差异丰富的酶,部分原因在于IBD中种类高度富集且异常全面的功能注释。然而,这种分类中的有些酶可能确实具备了与IBD机械上的联系,而其它的可能只是在源基因组拷贝数上有着简单的扩增(或者收缩),这些基因组丰度的变化与特定酶的编码无关。 图5. IBD中微生物功能和代谢物关联的变化。a-e,宏基因组关联酶示例,这些酶在IBD中差异丰富,由它们对应的分类供体注释(a-c 在IBD中富集;d和e缺失)。不同情况下,这些酶是由队列中混合物种调控,而不是单一物种。每个分段条形图代表了155个PRISM宏基因组中的一个。群落酶丰度(log10-转化ppm)由每个分段条形图顶部来表示;来自于主要种类的贡献在整体条形高度中呈显性扩增。依据主体贡献者函数,样品首次分类并根据表型分组。f,g,CD,UC以及非IBD对照中,群落总体酶丰度和IBD关联代谢物之间的相关性。
在这些差异丰富的酶中,共有246个没有被任何单独一种微生物主导,表明在对照(或者IBD)中它们的丰度更高,可能是因为功能群落水平的潜在变化,因此具有更大的机械学意义。例如,镁-导入ATP酶在CD和UC病人中均有富集(相比于对照,Fig. 5a)。已有研究表明,镁的缺失,是IBD过程中的一种副作用,可能是因为IBD关联的微生物组对离子的螯合作用所致。乙醇胺解氨酶在IBD肠道中具有相似的富集(Fig. 5b)。该酶存在于甘油磷脂产生的过程,这是一种CD和UC患者体内代谢物中丰度最为显著的酶(Fig. 2a)。IBD富集型酶的一个最终例子就是谷胱甘肽还原酶(Fig. 5c)。GR催化了谷胱甘肽的生产,一种在抗氧化中起作用的化合物。氧化应激是IBD炎症中的一个特征,因此既定微生物编码GR是该环境中的一种选择性优势。 IBD中,差异丰富的酶反应了专性厌氧到兼性厌氧微生物组的转变。例如,丙酮酸合酶作为一种厌氧酶可以催化丙酮酸盐和乙酰辅酶A的互换,在对照中富集度较高,但在CD患者的一部分中却完全检测不到(Fig. 5d)。钴胺素(VB12)合成过程中的酶在对照中的富集度也较高,包括precorrin-2脱氢酶(Fig. 5e)。然而VB12(包含一个四吡咯结构)因为太大而不能被LC-MS方法捕获,它的衍生物和相关化合物可能也是四吡咯结构,能够在IBD减少的代谢物特征中最大的聚类中富集(Fig. 3b)。 为了更为正式的评估差异丰富的酶和代谢物之间的潜在机械联结,我们重复了聚类和关联程序(之前描述的)。代谢物-酶关联紧跟着相同模式中的多数,这一点在微生物种类和酶之间得以观察。关联度低的(3%),表明多数代谢物只与一少部分酶之间存在关联(反之亦然);绝大多数相互作用(95%)与IBD发病机理表现出协同作用。一些关联出现在标准代谢物和酶之间。例如,镁-导入ATP酶与羟基十四烷酸之间存在显著的负相关性(Fig. 5f)。相反地,precorrin-2脱氢酶与己酸之间存在显著的正相关性(Fig. 5g)。虽然,这样的关系与起着底物酶和产物作用的化合物相一致,但似乎没有显示出这些特定酶-化合物对的真实情况,表明可能还有其它的因素调控着它们之间的关系。
独立验证组中对大多数IBD动态的重复 我们对差异丰富代谢物特征的大部分进行了评估,此外,评估也包括了之前的20个CD和23个UC患者以及22个非IBD对照的微生物种类。PRISM 组中的CD,共有2456个代谢物特征表现出丰富的差异性,在荷兰组中同方向上有2300个(94%)趋势相同的,其中959个(占总体的39%)也表现出FDR-显著性。UC中有1049个代谢物特征表现出丰富的差异性,同方向上有865个(82%)趋势相同的,其中117个(11%)表现出FDR-显著性。在差异丰富的微生物种类中也观察到了相似的模式:38种中的36种在PRISM的CD患者中差异丰富,其中13个达到统计学意义。病人中,同方向上PRISM患者中,共有15个UC-显著的种类,其中3个达到统计学意义。因此,一般定向上的PRISM组中,与IBD相关的绝大多数变化可以鉴定。统计学上的显著性并不是总能重复,部分原因可能是来自于小规模样本量的荷兰组的动力损失(共n=65 vs 155 PRISM组)。此外,多组学特征在IBD亚型中也有区别。以IBD表型为依据,来评估代谢物中或者微生物组成中的差异是否可以用于分类病人,我们对代谢物和微生物种类特性(单独的和统一的)进行随机森林(RF)分类分析。在PRISM组内以及在训练型整体PRISM组和独立验证荷兰组之间进行分级性能评估。这样的两类处理中,RF分类分析运用于样品中的单一子集,之后运用于另一个子集,最后结果表明性能测试并不能从RF分类分析的潜在拟合度中受益。 图6. 从肠道微生物组和多重组学特征中预测IBD状态与亚型。RF分类分型用于代谢物,微生物种类以及它们的组合中以确定IBD患者和IBD亚型。在PRISM队列中,采用5倍交叉验证,除此之外,对于完整PRISM队列也采用模型处理,再在独立荷兰组中验证。a,ROC曲线描绘了RF分类分析真假阳性比率之间的互作关系。AUC统计数值对分类性能进行了综合测量AUC数值接近1表明真阳性率高,当AUC数值接近0.5表明随即响应。b,IBD亚型RF分类分析通过‘混合矩阵’评估。行内i和列内j中的数字表示有多少个样本标记为亚型i,但分配到亚型j。完美的亚型RF分类(100%精确)在非对角元素中数值为0(也就是说,无分类错误样本)。Matrix cells在排中以阴影表示,与数值大小成比例(红色,CD;橘红色,UC;蓝色,非IBD对照)。c,IBD亚型RF分类分析通过‘混合矩阵’评估运用于PRISM队列,并在荷兰队列中进行独立检测。b和a的精度值表示正确分类实例的一部分;误差值由s.e.m比例反应。
在AUC数值范围为0.86到0.92之间的曲线面积(AUC)(AUC数值接近1.0表明一个分类分析达到了高度敏感性,假阳性率非常低,而0.5则是随机的;Fig. 6a)下,所有的RF分类分析表现效果显著好于IBD和非IBD对照区分中的随机性。交叉验证结果(AUC 0.90–0.92)只比独立验证结果(AUC 0.86–0.89)略好一点,表明PRISM-训练RF分类分析总体上要好于荷兰队列,这与之前描述的特征级相一致。RF分类分析在代谢物特征上的应用和微生物种类相似,尽管代谢物特征空间相对较大(数千种VS数十种)。代谢物和微生物种类数据整合后,在分类精度上并没有产生一个显著地提高(相对于单独的代谢物特征),这与肠道微生物和代谢组学特征之间的共享信息的高度相一致。 预测IBD亚型(主要为CD和UC)相对具有挑战性。在PRISM队列中,代谢物、物种和它们组合预测的UC,CD或者非IBD对照标签正确率为64—65%。这与个例/对照预测相比不够成功,但仍然比随机要好很多(Fig. 6b)。分类错误中最常见的来源是将UC患者标记为非IBD或者CD患者。这并不奇怪,是因为UC患者的分布规律与CD(大部分)和非IBD人群是重叠的(Fig. 1b)。相对的,非IBD个体很少被归为两种IBD亚型之一,而CD患者有时被错误的归为UC。当把PRISM-训练的IBD亚型RF分类分析应用于荷兰队列(Fig. 6c)中,观察到输入数据类型中出现了更多的差别。然而,代谢物合并RF分类分析表现的相当好(77%正确分类),依据种类的RF分类分析表现的相当糟(48%正确分类),很大原因可能是因为CD患者的标记错误分类像UC。这表明虽然很多IBD-不同物种在荷兰队列中趋势相似,但它们丰度分布的亚型信息细节保留较少。 讨 论 通过多组学综合分析,本研究揭示并验证了IBD人体肠道代谢组学和微生物组的变化特征。很多个体差异丰富的物种和代谢物类别得以鉴别和确定(例如,胆酸和鞘脂类),且与之前的发现相一致,而极个别如二元羧酸在本研究中首次发现。总体上,我们发现代谢物和代谢物类别在IBD患者中常常耗尽(相比于非IBD对照)。这一模式暗示着IBD患者中“代谢物多样性”存在丢失,趋势类似于IBD微生物组的多样性丢失。 这种多样性很可能包含了大量之前未说明的微生物衍生代谢物质,即那些在与参考数据库作比对时的未分类或者推定分类的物质。相比于靶向代谢组,非靶向代谢组学分析方法能够更为深入的定量许多非特征性代谢物。然而,非特征代谢物无疑包括了生物利害中,之前未说明的与微生物和疾病相关分子,它们也包含了非生物加成物和样本分子片段,一般来说,解释起来更加困难。面对这些挑战,我们采用了一套组合方法:(1)实验上,将代谢物与标准化合物库比对,进行验证,此过程虽然精确,但耗费巨大;(2)将代谢物近似的标注为广谱化合物类别;(3)依据样本间残余协变对代谢物聚类。以共变为基础的聚类在相似的理化特性代谢物中均有富集,一种“连坐”形式,对现有网络分析方法与代谢物特性之间进行互补。以协变为基础的分析方法表明,许多无标记代谢物扮演潜在角色,即与已知标准相一致(Fig. 3a)。另一方面,该过程也揭示了完全无特征,与IBD关联代谢物的聚类(Fig. 3b)。这样的聚类可能能够体现出微生物代谢物与促炎性或抗炎性效果之间的关系,此外,也是额外实验表征的首选。 计算方法也为之后的实验验证以及IBD微生物组和代谢组(包括微生物组衍生的代谢物鉴定)相关机制特性的探究提供了指导。通过微生物种类和与疾病状态无关的代谢物相关酶之间的优先关系确定,我们大致确定了潜在的机械性关联,可能是干扰IBD的所在。很多这些关联的细节有待确定。例如,微生物分类群和代谢物之间呈现正相关可能是因为(1)代谢物呈现的首选碳源能够促进某些微生物的生长,(2)有的代谢物是微生物代谢的副产物,或者(3)代谢物选择性的抑制其它物种的生长(或者是反作用的生态互动)。这些选择可以通过分析基因组和宏基因组注释,从计算的角度去解析。而从实验角度,通过测试微生物种类在含有它们相关代谢物的情况下或者在单一培养中剖析它们的代谢产出,同样可以获得。需要进一步的体内试验(例如,IBD小鼠模型)来确定验证过的微生物-代谢物关联在IBD发病机理中扮演着怎样的诱因。但这样的尝试十分辛苦;因此,假定关联的计算派生子集的揭示性分析将会是一个有利于全面深入分析的重要支援,在宏代谢组特性的基础上,会进一步对生物信息学数据进行优化。 PRISM队列中发现的绝大多数IBD关联物种和代谢物与独立验证队列在方向上相同。统计学显著性不能重复,部分原因是因为小规模验证研究能力的限制。同时,整合个体微生物和代谢组信号能够建立准确的分类分析(对于个例或对照状态,能够推广到其它新的个体)。令人惊讶的是,两种类型(微生物和代谢物)的组合信号并没有促使分类性能更为明显。这个结果意味着IBD肠道代谢组和微生物组的紧密耦合,可能是因为(1)两种特性变化的组合对应着疾病,(2)改变后的微生物组干扰了代谢组,或者是(3)改变后的代谢组干扰了微生物组(潜在回馈)。这种耦合的潜在机制,通过靶向微生物-代谢物关联的实验验证,可以自然的扩增。 预测的IBD亚型(UC vs CD)已证实具有挑战性,虽然这个结果相比于我们研究中发现的其它结果并不令人惊讶。然而,以疾病定位的CD病人,并没有表现出强烈分层,总体上,它们从非IBD对照中很好的分离出来了(Fig. 1)。但UC患者情况并非如此,分散到发炎/类似CD和非发炎/类似对照亚群中,这与前人研究结果相一致。UC中许多特征表现出单独的差异丰富,也在CD中表现出差异丰富,但反之则不一样。这是UC微生物组一般的典型特征,表明IBD关联的扰动可能来源于至少两部分模块:(1)通常与炎症关联的扰动;(2)针对于CD的特定扰动。第一种为多元组学特性和炎症水平(本研究中测定指标为粪便中的钙网蛋白)之间常规关联的基础,为个例/对照状态分类提供基础。第二种在为个例/对照状态分类中也能起到作用,因为它能够提供特定于CD亚型的丰富信息。然而,在不存在UC-特定信号的情况下,结合UC亚群中的异质性,会阻碍UC状态的预测性。虽然如此,但少数的代谢物分子,包括了十六碳烯酸乙酯,在UC中表现出独立的差异丰富;它们使研究可以更进一步。 未来的大多数发展方向可以以本研究为基础或者启示,进一步提高我们对于IBD中宏基因组和代谢组扰动的认识。为了更好的区分UC,例如,本研究中,利用代谢组学分析方法可能错失了有些类型的分子,即那一类随着UC状态产生特定变化的。或者,粪便代谢组学可能在捕获UC-特定标记物上并不完美。在这种情况下,血清代谢物特征分析能够增加血清抗体,进而作为IBD/UC诊断的生物标记物,而相比活体切片具有微创的特性,但是仍然与微生物组相关联。然而,本研究对大量个体采用截面取样,个体中的子集采用密集型纵向采样分析更有利于假定的微生物-代谢物关联分析,并能够进一步说明是否观测人群中的子集在时间上是稳定的或者在代谢组及微生物组成上的变化是稳定的。客观来说,这也有利于揭示因果关系——代谢物的变化出现在微生物或者宿主表型之前,反之亦然,也为疾病活性的探测提供了潜在的可预测靶标。然而,即使没有这些额外的研究,本研究中的多种组学筛选和关联揭示提供了很多可行的假设,即通过考查特定的已知代谢物功能和未知代谢物功能,以及它们的微生物合作伙伴在IBD发病机理中的作用。然而,大多数这样的变化很可能来自于宿主层面的生理学变化,该子集可以从微生物活动来确认结果,为以微生物组为基础的IBD诊断和治疗提供了新方案。 |
|