分享

4+免疫相关+预后模型,可轻松复现,适合小白使用

 智汇基因 2024-08-16 发布于广东

导语

结果:

整体免疫特征的景观
基于肉瘤样本的基质和免疫特征,采用表达数据(ESTIMATE)算法估计恶性肿瘤组织中的基质细胞和免疫细胞,可靠地揭示肉瘤样本中肿瘤和非肿瘤细胞的浸润水平。计算和分析肉瘤样本的免疫、基质、ESTIMATE和肿瘤纯度评分(表S3)。基于上述特征,将263个样本根据其平均值分为两组,分别命名为高分组和低分组。随后进行Kaplan-Meier分析,探讨免疫、基质、ESTIMATE和肿瘤纯度评分与肉瘤患者未来状况(图1A-D)。在ESTIMATE和肿瘤纯度评分的上半部分和下半部分之间观察到总生存期(OS)的显着差异,其中高ESTIMATE(p = 0.036)和低肿瘤纯度(p = 0.027)评分与较高的生存率显着相关。然而,在基于免疫 (p = 0.099) 和基质 (p = 0.052) 评分的生存曲线中没有观察到这种区别。如以下所示图1,肉瘤患者的生存率与ESTIMATE和肿瘤纯度评分显著相关,其中患者的生存率与ESTIMATE评分呈正相关,与肿瘤纯度呈负相关。从上述分析中获得的数据表明,有可能利用肉瘤的免疫相关评分进行预后预测。随后进行了ssGSEA分析以进行进一步验证。

随后,ssGSEA用于检查免疫激活对肉瘤患者肉瘤进展和预后的影响。30 种免疫细胞类型的免疫特征和临床特征,包括年龄、放疗、肿瘤状态、性别、种族、事件和 OS,如下所示图2一个。与个体的总分一致,无监督聚类将样本分为两个不同的组,免疫特征存在明显差异。具有大量各种免疫特征的组,包括 I 型干扰素 (IFN) 反应、CD4 T 细胞和 B 细胞活化、T 滤泡辅助细胞和 Treg 富集,被命名为免疫高组。因此,免疫激活较低的另一组被命名为免疫力低下组。为了研究 TME、免疫细胞活化以及上半部和下半部之间免疫细胞和肿瘤细胞浸润水平的差异,对肉瘤 TME 进行了多项分析。正如预期的那样,免疫力低下组的肿瘤纯度显着更高(图2因此,提出了高免疫激活与低肿瘤纯度之间的相关性。免疫力高组也明显表现出更高的免疫检查点表达和炎症促进(图2在随后的t-分布式随机邻居嵌入(t-SNE)分析中,两个具有不同免疫特性的簇被清晰区分和可视化(图2D),确认了每个肉瘤样本之间存在免疫差异以及根据不同的免疫细胞浸润水平对肉瘤患者进行分类的有效性。此外,两种免疫亚型表现出明显不同的特征,如图S1A所示。因此,作者怀疑上述发现的免疫亚型可以在免疫和遗传差异的基础上完全区分开来。这一假设通过主成分分析(PCA)得到了验证(图S1B)。

差异表达基因(DEGs)的筛选和评估
使用差异表达分析筛选两种免疫亚型之间表现出不同表达水平的基因。共筛选出5259个DEGs进行进一步分析(表S4),其中3374个DEGs下调(64.16%),其余1885个DEGs上调(35.84%)(图3A).对DEGs进行富集分析,得到功能注释。通过基因本体论(GO)注释和京都基因与基因组百科全书(KEGG)通路富集分析,发现1052个生物过程(BPs)、600种细胞成分(CCs)、650种分子功能(MFs)和65个KEGG通路的DEGs数量显著富集。

使用条形图可视化,前 10 个富集生物通路主要与免疫相关,包括白细胞介导的免疫、T 细胞活化和白细胞间粘附 (图3在GO圈图中,显示了按基因丰度排名的前八个GO术语(图3富集的KEGG通路包括单纯疱疹病毒1型感染、细胞因子-细胞因子受体(CCR)相互作用、趋化因子信号通路和细胞粘附分子(图3如上述富集分析结果所示,发现DEGs与免疫激活密切相关。基于DEGs进行GSEA,进一步探讨具有不同免疫特征(图3共获得460条富集通路,其中前2条包括NABA基质体(NES = 163.0,P.adj = 008.0,FDR = 005.1)、反应组疾病(NES = 984.0,P.adj = 008.0,FDR = 005.3)、反应组先天免疫系统(NES = 163.0,P.adj = 008.0,FDR = 005.3)、反应组适应性免疫系统(NES = 021.0,P.adj = 008.0,FDR = 005.2)和NABA基质体相关通路(NES = 401.0, P.adj = 008.0,FDR = 005.<>)。这些结果表明,TME中的免疫激活可能在肉瘤中起重要作用。
免疫相关DEGs和功能注释的相同基因分析
从肿瘤免疫估计资源 (TIMER) 数据库中共鉴定出 1811 个免疫相关基因 (IRG)(表 S1)。DEGs 和 IRGs 之间的重复基因显示在维恩图中 (图4结果,鉴定出590个重叠基因,并表示为免疫相关DEGs(表S5)。对590个基因进行富集分析,得到包括BPs和生物通路在内的功能注释。总共有 1693 个 GO 术语,由 1517 个 BP、64 个 CC 和 112 个 MF 组成。如 GO 条形图和 Circos 图形中所示图4B,C,这些免疫相关DEGs的突出富集类别被鉴定为白细胞介导的免疫、白细胞活化的上调和淋巴细胞活化。在鉴定出的101个富集KEGG通路中,前<>个富集通路依次为CCR相互作用、病毒蛋白与CCR相互作用、类风湿关节炎、趋化因子信号通路以及加工和呈递(图4随后的GSEA确定了基因富集最多的前五条通路,从多到少依次是淋巴细胞和非淋巴细胞之间的反应组免疫调节相互作用(NES = 1.1810,P.adj = 0.011,FDR = 0.008),有利于利什曼原虫寄生虫感染的反应组抗炎反应(NES = 1.793,P.adj = 0.011,FDR = 0.008),反应组利什曼原虫感染(NES = 1.759,P.adj = 0.011,FDR = 0.008),血管壁反应组细胞表面相互作用(NES = 1.741,P. adj = 0.011,FDR = 0.008)和反应组先天免疫系统(NES = 1.511,P.adj = 0.011,FDR = 0.008)。与上述结果类似,免疫激活,尤其是淋巴细胞和 T 细胞激活,对肉瘤的发展很重要(图4E).

为了研究从相互作用基因/蛋白质检索工具(STRING)数据库中检索到的免疫相关DEG编码蛋白质之间的相互作用,生成了蛋白质-蛋白质相互作用(PPI)网络(图S1C)。网络中共包含5259个节点和1411个交互,节点的拓扑特性如表S6所示。随后,为了进一步研究这些免疫相关DEGs之间的相互作用和相关性,生成了一个相互作用网络(图S1D)。发现多种免疫相关DEG之间存在显着关联。IRF7、STAT1、ISG15、MX1、RSAD2等免疫相关DEGs的交互作用尤为显著。
相互作用网络包含1种干扰素调节因子(IRFs),包括IRF5、IRF7和IRF15。这些基因位于中心节点之间,对其他基因有显著影响。此外,IFN 刺激基因 15 (ISG1)、粘病毒耐药性 1 (MX8)、蛋白酶体(prosome、macropain)亚基 β 型 8 (PSMB2)、自由基 S-腺苷甲硫氨酸结构域 2 (RSAD1)、信号转导和转录激活因子 1 (STAT2) 和骨髓基质细胞抗原 2 (BST7)属于枢纽基因。然后使用最大集团中心性(MCC)方法对中心节点进行排序,其中前十个节点列在表S<>中,以便进一步分析。
为探究前10个枢纽基因的免疫和临床特性,分析了这些基因的免疫浸润水平和OS(图5和图6和表S8)。在所有 1 例病例中,树突状和 T 细胞浸润水平的增加最为显着,再次强调了 TME 中 T 细胞富集与肉瘤发展之间的关系。同时,几乎没有检测到自然杀伤细胞和枢纽基因之间的相关性。在预后分析中,根据IRF0(p = 018.8)、PSMB0(p = 038.2)和RSAD0(p = 008.<>)几个枢纽基因的表达水平,发现上半部分和下半部分之间存在显著差异。

风险模型的构建
263 个肉瘤样本在训练组和验证组之间随机均匀分布。使用单因素Cox分析(p < 0.0062),从9个免疫相关DEGs中选择590个基因作为具有进一步分析预后潜力的有利因素(表S9)。使用最小绝对收缩和选择算子(LASSO)多变量建模,获得两个候选基因(ACVR2B和NFYA)来建立风险特征(表S10,图7A-C)。根据候选者的表达水平和系数值,采用以下公式建立风险评分模型:风险评分=(ACVR0B表达1049.2×)+(NFYA表达0.0188×)。将该公式应用于两个队列,以获得每个样本的风险评分。然后还对两个队列以及原始合并队列(图7D-F)。ROC 曲线的曲线下面积 (AUC) 值大于 0.5 被认为具有统计显著性。训练、验证和合并队列的 ROC 分析均显示 AUC 值大于 0.5,而 1 年的 AUC 最大,面积分别为 0.728、0.610 和 0.686。这些结果表明,该特征在 1 年、3 年和 5 年分别对训练、验证和两个队列表现出高敏感性。为相同的三个队列生成生存曲线,以评估风险评分与生存率之间的相关性(图7G-I)。所有三个队列都证明了低风险组的显着生存优势,表明低风险评分与高生存可能性之间存在很强的相关性。因此,该特征被认为具有预后价值。在进一步的分析中,假设总生存期随着风险评分的增加而降低。然后构建风险评分的分布图以验证上述结果(图8A-C)。为了帮助理解两个枢纽基因对肿瘤发生的影响,分析了两个基因在训练组、验证组和原始合并组中的分布,并用热图(图8D-F)。ACVR2B和NFYA的高表达水平与较高的风险评分呈正相关,提示这两个基因可能是肉瘤发生和临床恶化的危险因素。为进一步了解免疫力高组和免疫力低组的遗传特征和差异,分别分析了两组的突变(图9A,B)。免疫高组195份样本中,134份(68.72%)存在多种基因突变,其中突变频率最高的基因为TP53。在免疫力低下组中,24 名患者中有 40 名 (60%) 表现出基因改变。高分组突变率略高于下半部分。然而,差异在统计学上不显著(p = 0.15,图9C).

Nomogram的可视化和验证
为了分析临床病理参数对结果的贡献程度,并验证模型的预后能力,应用单因素和多因素 Cox 回归分析 (图9D,E)。本研究构建的风险评分在适当时间内的预后预测中显示出显著的价值(p < 0.001),证实了利用该风险特征作为预测工具的可能性。此外,肿瘤状态(p < 0.0001)和年龄(p < 0.01)等其他临床因素也对肉瘤患者的预后有显著影响。在 Cox 回归分析的基础上,生成了由风险评分和其他临床病理参数组成的列线图,并对其进行校正,用于预测肉瘤患者在 1、3 和 5 年(图9F,G)。通过列线图而不是方程式实现预后模型的可视化,呈现了模型的更清晰版本,使肉瘤患者预后的评估更便于临床使用。为了检查列线图的准确性,生成了校准曲线并将其显示在图9G.校准曲线表明列线图的准确性很高,特别是在预测 5 年总生存期方面。

总结

目前,越来越多的研究旨在发现肉瘤的更好特征。然而,肉瘤患者预后的风险模型尚不充分。2020年,Gu等人建立了基于7个基因(TSPAN2、MYBL2、GCSH、FBN39和DDX46B)表达的风险评分模型,用于软组织肉瘤的预后预测[15]。同年,Wu等人开发了另一种基于24个基因(KCNJ4、SLC1A5、ASPA、REM3、SCARA6、LANCL47、CPA<>和TRH)的骨肉瘤模型。[<>]. 尽管两种风险模型都具有相对较好的特征,但它们并未评估免疫力对肉瘤的影响。正如目前研究的结果所表明的那样,免疫浸润对肉瘤发展的影响是不可忽视的。在作者的工作中构建的风险特征是基于免疫力高组和免疫力低组之间的免疫相关DEGs。作者的模型具有可接受的准确性和效率,为预测预后提供了新颖而有价值的工具,为未来的研究提供了启示。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章