分享

8+单细胞marker基因生信思路,快来抄作业!

 智汇基因 2023-02-13 发布于广东

导语

今天给同学们分享一篇单细胞和Bulk-RNA测序的综合分析确定了基于T细胞marker基因的特征的生信文章“Integrated analysis of single-cell and bulk RNA-sequencing identifies a signature based on T-cell marker genes to predict prognosis and therapeutic response in lung squamous cell carcinoma”,这篇文章于2022年10月14日发表在Front Immunol期刊,影响因子为8.786。癌症免疫疗法是治疗晚期或常规耐药癌症患者的一种越来越成功的策略。T细胞已被证明在抗肿瘤和肿瘤微环境塑造中发挥重要作用,而这些作用尚未在肺鳞状细胞癌(LUSC)中得到解释。

1. T细胞标记基因表达谱的鉴定

研究中使用的scRNA-seq数据来自2个LUSC肿瘤样本的12950个细胞。图1A显示了检测到的基因数量范围、测序深度和每个样本中线粒体含量的百分比。经过严格的质控过滤去除低质量细胞后,1370个细胞被纳入后续分析。对数据进行归一化后,作者选择了前2000个高度可变的基因(图1B)。PCA方法用于降维(图1C),并选择15个P值<0.05的PC进行进一步分析(图1D)。作者从9个聚落中鉴定出总共1086个差异表达的标记基因。每个聚落中标记基因的相对表达显示在热图中(图1E)。之后,使用t-SNE算法对9个聚落进行可视化(图1F)。使用“singleR”算法注释细胞亚群,作者发现聚落2和4被定义为T细胞亚群(图1G)。最终,作者根据|logFC|获得了LUSC的72个T细胞标记基因。

图1 通过scRNA-seq分析鉴定T细胞标记基因

2. 预后模型的构建和验证和特征基因的差异表达

通过单因素Cox回归分析,作者发现17个T细胞标记基因与训练队列的预后显着相关。LASSO分析根据最佳lambda值和相应的系数确定了8个基因(图2A、B)。多因素Cox回归分析获得5个基因,包括BTG1、JUND、IER3、ZNF331和PSAP(图2C)。根据中位TCMGrisk(中位TCMGrisk=0.973)将患者分为高危组和低危组。TCMGrisk的散点图表明,随着TCMGrisk评分的增加,OS下降,而死亡率上升(图2D-I)。随后,作者评估了该模型的预后价值。与低危组相比,高危组的生存期显着延长(图2J)。1年、3年和5年训练队列的AUC分别为0.614、0.713和0.702(图2M)。为了进一步验证模型的稳健性,作者在测试队列和GEO队列中进行了相同的分析。测试队列的结果显示,低风险组的OS优于高风险组(图2K)。1年、3年和5年的AUC分别为0.669、0.603和0.645(图2N)。GEO队列的结果显示,低风险组的OS优于高风险组(图2L)。1年、3年和5年的AUC分别为0.661、0.628和0.590(图2O)。两个结果都表明该模型具有良好的预测能力。

图2 预后模型的构建和验证

作者检查了特征基因的mRNA和蛋白质表达水平。与正常患者相比,LUSC患者中IER3表达上调,而LUSC患者中JUND、PSAP和ZNF331表达下调。BTG1表达在两组之间无统计学意义。来自HPA数据库的IHC结果用于进一步评估LUSC中特征基因的表达。IER3蛋白在LUSC组织中显着高表达,抗体染色强,染色细胞较多。而JUND和PSAP蛋白在正常组织中显着高表达。

3. 列线图的建立及决策曲线分析

作者通过整合临床因素和TCMGrisk构建列线图,分别预测LUSC患者的1年、3年和5年生存概率(图3A)。校准图显示观察值与预测值高度一致(图3B)。此外,AUC显示诺模图在预测1年、3年和5年的预后方面具有更多的临床净效益(图3C-E)。DCA表明列线图为1年和3年OS提供了最佳临床净效益,但对于5年OS也没有(图3F–H)。这表明基于TCMGrisk的诺模图可以作为临床实践中预测患者预后的有效方法。

图3 列线图的建立与验证

4. 基因富集分析

GSEA结果显示,训练队列中的高危组主要富集免疫相关通路,如抗原加工和呈递、T细胞、B细胞、自然杀伤细胞和细胞因子受体相互作用信号通路等。值得注意的是,高危人群在非小细胞肺癌通路中富集(图4)。由于这些生物学途径与免疫相关并参与肿瘤免疫,因此作者进一步分析免疫以比较两组之间的差异。

图4 基因富集分析

5. 肿瘤免疫微环境及免疫相关基因的估计

作者进一步研究了TCMGrisk和TIME之间的关系。热图结果表明,免疫相关功能在高危人群中更为活跃(图5A)。相关性分析表明,TCMGrisk与免疫评分和基质评分呈正相关(图5B、C)。ESTIMATE算法结果显示,高危组的基质评分、免疫评分和估计评分均显着升高(图5D)。ssGSEA算法的结果发现,T细胞CD4记忆静息、NK细胞激活、树突状细胞静息和中性粒细胞在高危组中高表达(图5E)。考虑到ICI在免疫治疗中的作用,作者比较了两个风险组中八种常见免疫检查点相关基因的表达水平。结果显示PD-L1、CTLA-4、IDO1、PD-L2、TIM-3、LAG-3和TIGIT在高危组高表达,而PD-1表达在高危组无统计学差异组(图5F)。重要的是,TIDE评分结果显示高危患者的评分明显较低。除此之外,作者还发现HLA相关基因的表达水平在高危人群中均较高(图5G)。以上结果提示高危人群可能更适合ICIs治疗。

图5 肿瘤免疫微环境的特征

6. 基因突变分析

LUSC的整体突变概况如图6A所示。图6B显示了基因突变的相互作用,大多数基因之间同时发生突变。此外,作者还调查了低风险和高风险人群的基因突变。作者发现TP53、TTN和CSMD3是低风险和高风险组中最常发生突变的基因(图6C、D)。两个风险组之间的TMB表达水平没有差异(图6E)。K-M曲线显示高TMB组的预后优于低TMB组(图6F)。结合作者的模型后,低风险+高TMB组的预后明显好于高风险+低TMB组(图6G)。

图6 体细胞突变的特征

7. 药敏分析

作者进一步探讨了低风险和高风险组化疗药物IC50水平的差异(图7A-L)。结果发现,低风险组患者对多西紫杉醇、吉非替尼、紫杉醇、多柔比星、厄洛替尼、拉帕替尼、毒胡萝卜素和长春瑞滨等抗癌药物的IC50较低。相比之下,高风险组患者对阿西替尼、伊马替尼、达沙替尼和雷帕霉素等抗癌药物的IC50较低。上述结果表明,TCMGrisk可作为抗癌药物选择的预测指标。

图7 药物敏感性评价

总结

总之,作者通过结合scRNA-seq和大量RNA-seq数据开发了一种由5个T细胞标记基因组成的新型预后特征。此外,TCMGrisk与TIME、免疫相关通路和药物敏感性显着相关。作者的研究为T细胞标记基因在LUSC患者预后和精准治疗中的作用提供了新的理论见解。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多