分享

6+线粒体+巨噬细胞+机器学习+MR,MR分析+双热点的联合思路,千万别错过!

 智汇基因 2025-03-14 发布于广东

导语


结果:

DEG和模块化基因的筛选
GSE 221521数据集在DR组和对照组之间获得784个DEG(492个DEG上调,292个DEG下调)(图1A)。另一方面,在GSE 221521中,DR组中的MPRGs评分显著高于对照组(p< 0.05)(图1B)。通过WGCNA分析,分层聚类分析显示有1个离群样本并将其排除(图1C)。当选择软阈值β为12时,网络近似于无标度分布(图1D)。在确定软阈值后,进行共表达网络的构建,并聚合7个模块(图1E)。在非灰色模块中,p值< 0.05,与该a评分相关|Cor|> 0.3。通过对关键模块的识别,作者得到了MEturquoise和MEyellowed模块。与MPRGs评分最显著相关的模块之一是MEturquoise(cor = 0.7048,p= 5.24 × 10- 18),它包含7,423个基因。另一方面,最高的负相关是MEyellowed(cor =-0.3491,p= 2.68 × 10- 4),其包含1,191个基因。(Fig.1F)。总共获得了8,614个模块基因。在GS和MM之间以高度显著的相关性获得了总共782个模块基因(图1G,H)。

候选基因的关键生物学通路和PPI网络
从784个DEG和1,136个MRG的交叉获得总共26个DE-MRG,并且从784个DEG和782个模块基因的交叉获得63个DE-MPRG(图2A、B)。最后通过斯皮尔曼相关分析得到88个基因作为候选基因,|R| 05)(图2C)。88个候选基因的GO途径分析导致211个生物过程(BP)条目的鉴定。GO通路包括线粒体内膜、核糖体、线粒体自噬、蛋白质定位的负调控和胞内蛋白质转运的调控、未折叠蛋白结合等(图2D)。此外,还鉴定了4种KEGG途径,它们是核糖体、RNA聚合酶、线粒体自噬动物和核苷酸切除修复(图2E)。PPI网络由34个蛋白质和45条边组成,RPS 11和RSC 1A1与其他蛋白质有更多的连接和相互作用(图2F)。

关键基因的获得
以88个候选基因作为暴露因子,以DR作为结果,进行双样本MR分析。通过IVW筛选出13个基因作为关键基因(p< 0.05)。结果,获得了6个保护因子:RPL 28、RPL 36、ATP 5F1E、PRPF 31、PET 100、SEPTIN 4(OR < 1,p< 0.05),而PTAR 1、CYP 27 A1、SLC 4A8、SLC 25 A34、FGD6、LDHD、GAN基因是风险因子(OR > 1,p< 0.05)(图3A)。以散点图分析暴露因素与结局的相关性,PTAR 1、CYP 27 A1、SLC 4A8、SLC 25 A34、FGD 6、LDHD和GAN基因呈正相关,RPL 28、RPL 36、ATP 5F1 E、PRPF 31、PET 100和SEPTIN 4基因呈负相关。森林图显示,RPL 28、RPL 36、ATP 5F1E、PRPF 31、PET 100和SEPTIN 4基因的效应值小于0,PTAR 1、CYP 27 A1、SLC 4A8、SLC 25 A34、FGD 6、LDHD和GAN基因的效应值大于0。SNP数量在IVW线的两侧基本对称,并且与孟德尔第二定律一致。对13个暴露因素和结局进行敏感性分析,发现13个暴露因素无异质性(p> 0.05),13个暴露因素和结局之间不存在水平多效性(p> 0.05)。在LOO中,没有没有严重偏倚的点,并说明了结果的可靠性。最后以DR为暴露因素,13个基因为结局,进行Steiger反向因果关系检验,方向关系判定为“TRUE”,13个暴露因素与结局之间无反向因果关系(p< 0.05)。最后,将RPL 28、RPL 36、ATP 5F1E、PRPF 31、PET100、SEPTIN 4、PTAR 1、CYP 27 A1、SLC 4A8、SLC 25 A34、FGD 6、LDHD、GAN作为关键基因记录。

PTAR 1和SLC25A34作为DR生物标志物的建立
为了进一步识别生物标志物,SVM和Boruta分析中都包括13个关键基因。在Boruta算法中,鉴定出11种候选生物标志物(图3B)。在SVM-RFE内,筛选13个基因产生11个候选生物标志物(图3C)。然后,通过重叠这两组候选生物标志物,将SLC 25 A34、GAN、RPL 36、FGD 6、PTAR 1、PRPF 31、SLC 4A 8、ATP 5 F1 E、PET 100、CYP 27 A1鉴定为候选生物标志物(图3D)。随后,绘制GSE 221521和GSE 160306中这10种候选生物标志物的ROC曲线,以评估它们区分DR和对照组群的能力。然后在两组中选择2种候选生物标志物(AUC ≥ 0.7),其为PTAR 1和SLC 25 A34(图3E、F)。在GSE 221521和GSE 160306数据集中,PTAR 1、SLC 25 A34表达趋势一致且显著,并且两者在DR中显著上调(图3G、H)。因此,将PTAR 1和SLC 25 A34记录为生物标志物用于后续分析。

DR中的PTAR 1和SLC 25A34诺模图诊断
在GSE 221521中,通过列线图发现PTAR 1和SLC 25 A34对DR具有更好的诊断能力(图4A)。诺模图的净效益高于其他单个因素,表明诺模图具有最佳预测(图4B)。诺模图模型的曲线下面积AUC为0.745,表明其是DR发生的良好可靠性预测模型(图4C)。

免疫细胞的分析和相关性
22个免疫细胞的浸润结果显示在图4D中。首先根据75%的样本中表达为0的22个免疫细胞,13个免疫细胞,(初始B细胞、记忆B细胞、CD 8 + T细胞、CD 4+记忆静息T细胞、CD 4+记忆激活T细胞、滤泡辅助T细胞、调节(T细胞)T细胞、静息NK细胞、激活NK细胞、单核细胞、M2巨噬细胞、激活肥大细胞,DR组与对照组相比,NK细胞和单核细胞的活性有显著性差异(p < 0.05),对照组中NK细胞活性显著上调,而单核细胞活性显著上调。(Fig.4E)。此后,这些免疫细胞与生物标志物之间的相关性显示,PTAR 1(cor =-0.41,p= 3.96 × 10-6)与活化的NK细胞表现出最强的正相关性。(Fig.4F)。

关键基因的基因集富集分析
作者使用GSEA来探索生物标志物影响DR发展的途径。在GSE 221521数据集中(p< 0.05),SLC25A34主要富集到58个KEGG通路。这些途径包括蛋白质合成过程如核糖体、神经退行性疾病如帕金森病以及NOTCH和胰岛素信号传导途径(图4G)。PTAR 1主要富集到19条KEGG通路。这些信号通路包括磷脂酰肌醇、神经营养因子、ERBB、Toll样受体、胰岛素信号通路。SLC25A34和PTAR 1均参与溶酶体途径和胰岛素信号传导途径(图4H)。PTAR1和SLC25A34都参与溶酶体途径和胰岛素信号传导途径。

SLC25A34和PTAR 1在不同组织中的表达
首先,对生物标志物进行染色体定位分析,9号染色体上的SLC25A34基因和1号染色体上的PTAR 1基因(图5A)。为了理解皮肤组织和细胞中生物标志物的表达,PTAR 1在组织中富集,并且表达它的前五个组织是骨髓、胸腺、甲状旁腺、肾和肝(图5D)。此外,SLC25A34在舌中的表达量最高,其次是骨骼肌、十二指肠、小肠等(图5E)。为了进一步理解生物标志物的RNA甲基化修饰,在最高置信度的位置(1461)进行SLC25A34 m6A基因座的预测(图5F),而在最高置信度的位置(824)进行PTAR1 m6A基因座的预测(图5G)。SLC25 A34和PTAR 1二级结构m6 A基因座的预测结构随后显示在图5B、C中。

SLC25A34与PTAR1的组网分析
GGI网络显示与异戊烯基转移酶活性和异戊烯化功能相关的生物标志物(图6A)。将从miRDB数据库和TargetScan数据库获得的miRNA进行交叉,得到23个与生物标志物相关的上游miRNA和17个lncRNA(图6B,C)。之后,为了了解转录因子(TF)与生物标志物之间的调控关系,其中有12个TF调节SLC25A34,而有28个TF调节PTAR 1,包括42个节点和40个边缘(图6D)。

总结

将784个DEG分别与1136个MRG和782个MPRG进行交叉,筛选出89个相关基因作为候选基因。MR分析产生了13个与DR具有明确因果关系的关键基因。在 GSE221521 和 GSE160306 中,PTAR 1和SLC25A34的表达趋势在DR组群和对照组群之间是一致和显著的。因此,PTAR 1和SLC 25A34被用作生物标志物。免疫浸润分析显示,DR组与对照组的活化NK细胞和单核细胞有显著性差异,PTAR 1与活化NK细胞呈正相关。两种生物标志物均富集于溶酶体和胰岛素信号通路中。GGI网络显示,生物标志物与异戊烯基转移酶活性和异戊烯化功能相关。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多