分享

9+单细胞+孟德尔随机化+共定位,神仙组合搭配轻松上9+,赶紧Mark!

 智汇基因 2025-03-12 发布于广东

导语


结果:

免疫细胞特异性基因表达的仪器选择总结
在这项研究中,作者旨在通过三步选择过程来选择有效的工具。作者提取了 26,597个独立的顺式作用 eQTL,这些eQTL与14个不同免疫细胞中16,597个基因的表达水平相关(在 OneK1K 队列的 982 名参与者中测量的单细胞基因表达数据),并将它们用作本研究的候选遗传工具(图1)。鉴于单细胞测序数据的复杂性,在这项研究中,特定免疫细胞类型中基因的表达水平被记录为该基因的基因表达谱。


对于仪器选择,作者通过以 0.01 的 LDr 2 截止值进行连锁不平衡(LD)聚集来去除高度相关的遗传变异。来自 1000 基因组计划的欧洲人被用作 LD 参考面板。聚集后,共选择了17,959 个独立的顺式-eQTL,在14种细胞类型中表达了 16,597个基因(图2a)。其次,作者计算了每个eQTL的F统计量,并从进一步分析中排除了 20 个具有 F-statistics<10 的 eQTL,因为它们可能存在潜在的弱仪器偏倚。第三,作者使用 Steiger 滤波来验证仪器的方向性。这种方法测试了eQTL 是否解释了暴露(基因的基因表达谱)比结果(COVID-19)更多的方差。作者所有的 cis-eQTLs 都显示出正确的方向性,并被保存为有效的工具。总之,已选择 14 个免疫细胞中 16,597 个基因表达水平的 17,939 个 eQTL 作为 MR 分析的有效工具。

在仪器选择前后,作者的仪器和 eGenes(其中 eGene 是指具有一个或多个 eQTL的基因)在CD4初始和中枢记忆T细胞中持续富集(CD4 NC; 图2a和b),其中CD4 SOX4和浆细胞显示仪器和 eGenes 数量最少。

鉴定 COVID-19 感染的推定致病基因
然后,作者使用双样本 MR 估计了 14 种免疫细胞类型中基因表达谱对 COVID-19 结果的推定因果影响。从 COVID-19 遗传住房倡议 GWAS 荟萃分析第 7 轮 (https://www./results/r7/) 中提取了四种类型的 COVID-19 结果数据,包括“非常严重的呼吸道确诊 COVID-19 与人群”(标记为“A2”,N 病例 = 13,769,N 对照 = 1,072,442);“住院 COVID-19 与人群”(“B2”,N 例 = 32,519,N 对照 = 2,062,805);“COVID-19 vs. 人群”(“C2”,N 病例 = 122,616,N 对照 = 2,475,240)和“住院 COVID-19 与未住院 COVID-19”(“B1”,N 病例 = 16,512,N 对照 = 71,321)组(参见图1 中的“结果选择”)。对于COVID-19 结局,仅使用欧洲血统参与者的 GWAS 汇总统计。对于“住院COVID-19 与未住院 COVID-19”(B1),仅欧洲数据的 GWAS 汇总统计数据未公开可用,因此作者使用了来自混合人群的数据,其中欧洲人的比例在该数据中为 81%。

在协调暴露数据(测试基因的基因表达谱)和结果数据(COVID-19 结果)后,分别针对四种类型的 COVID-19 结果计算了 14,249-14,485 个 COVID-19 基因表达的 MR 估计值(图 3a)。在错误发现率 (FDR) 校正后,共有 144、3、191 和 40 个 MR 关联(这意味着一种基因表达谱与一种类型的 COVID-19 结果与 MR 和共定位证据的关联)对于 A2(“非常严重的呼吸道确诊 COVID-19 与人群”)、B1(“住院 COVID-19 与未住院 COVID-19”), B2(“住院 COVID-19 与人群”)和 C2(“COVID-19 与人群”)分别为(图 3a)。为了检查 MR 结果的异质性,作者对由两个或多个工具估计的 16 个 MR 关联进行了 Cochran Q 检验,发现几乎没有证据支持工具之间的异质性 (Q 值>0.05)。为了通过连锁不平衡 (LD) 区分因果关系和混杂,作者应用了两种共定位方法,LD 检查、遗传共定位、Susie和SharePro共定位。这些分析表明,378 个 MR 关联中有 343 个(91%)显示共定位证据(定义为共定位概率 ≥70% 或 LD 检查的 r2 ≥ 0.7;Susie 和 SharePro 共定位概率>0.9; 图3a)。这 343 个 MR 关联与 14 种免疫细胞类型中 132 个基因的表达有关。


作者在 10 个数据库中对 COVID-19 相关基因以及25项 COVID-19 相关 MR 研究进行了全面搜索。作者发现,在已鉴定的 132 个基因中,有 58 个之前没有报道过 COVID-19(图 3a)。

在比较四种 COVID-19 结局之间的 MR 关联时,作者发现54个基因在两个或多个 COVID-19 结局中显示出 MR 和共定位证据。一个基因 NBEAL2 在 4 个 COVID-19 结果中显示出证据,12 个基因在 3 个结果中显示出证据,其中 41 个基因在 2 个结果中显示出证据(图 3b)。例如,NBEAL2 基因在所有四种类型的 COVID-19 结果中都显示出强大的 MR 和共定位证据(图 3c-e)。这 54 个基因显示与两个或多个 COVID-19 结果相关,被认为是与 COVID-19 相关的可复制基因。

基因表达对 COVID-19 结局的免疫细胞类型特异性影响
作者进一步估计了 132 个推定的 COVID-19 致病基因的细胞类型特异性,其中总共包括 343 个 MR 关联 (200 个基因-COVID-19 对)。其中,200 对中的 145 对 (73%) 仅在一种特定免疫细胞类型中显示出对 COVID-19 的影响(图 4a)。同样,54 个可复制基因中有 30 个(56%)(在两个或多个 COVID-19 结果中具有强有力的 MR 证据)仅在一种免疫细胞类型中显示出细胞类型特异性作用(图 4b)。相比之下,7个基因在5种或更多免疫细胞类型中显示出 MR 关联,例如 13 种免疫细胞类型的 TOMM7 表达与 COVID-19 相关。这意味着这些基因对 COVID-19 具有普遍的免疫介导作用(图4b)。

细胞类型特异性 MR 分析提供了一些证据,支持 CD4 NC 细胞是 COVID-19 的富集细胞类型。然而,作者还观察到 CD4 NC 具有最多的 eGenes (图 2a 和 b)。然后,作者估计了 14 种免疫细胞类型中每一种已鉴定的致病基因数量与 eGenes 数量之间的比率(图 4c)。结果表明,在调整 eGenes 数量的影响后,COVID-19 相关基因富集于自然杀伤 (NK) 募集、血浆和 CD4 SOX4 细胞三种免疫细胞类型中。相比之下,该图在一些其他细胞类型(如 NK 细胞)中被去富集。通过函数 'phyper' 使用另一种富集方法,该图与图 4c 中的图一致。

免疫病毒相关机制中 COVID-19 相关基因的富集
为了探索由已鉴定的 COVID-19 相关基因富集的免疫介导机制,作者进行了一组功能富集分析,包括本体亚型、通路分析和基因亚型分析。在与 COVID-19 相关的 132 个基因中,119 个基因可以转化为 Entrez 基因 ID 并被纳入富集分析。结果表明,这 119 个基因富含干扰素信号传导、免疫系统中的细胞因子信号传导和干扰素 α/β 信号传导等途径,与之前研究中报告的结果一致。富集结果可分为六种类型的生物途径:病毒反应途径、免疫炎症途径、细胞过程途径、代谢过程途径、对刺激的反应和疾病途径(图5a)。然后,作者对已鉴定的致病基因进行了蛋白质-蛋白质相互作用 (PPI) 网络分析。在本分析中包含的 119 个基因中,它们编码的 15 个蛋白质几乎没有与任何其他蛋白质相互作用的证据,剩下 104 个蛋白质编码基因用于 PPI 分析。使用 Metascape 将 104 种基因编码蛋白中的 34 种(33%)进一步聚类为4个模块(图 5b)。

COVID-19 免疫相关药物靶点的验证和再利用
鉴于确定了 COVID-19 的潜在免疫相关药物靶点,作者进行了两项分析。首先,作者在 PubChem (https://pubchem.ncbi.nlm./) 和现有的药物-基因相互作用数据库(包括 OpenTargets、DrugBank和Drug-gene interaction database)中检索了靶向 132 个已鉴定基因的药物。该检索确定了 32 种候选药物,靶向已鉴定基因中的 24 种。这 32 种药物的主要适应症是慢性咳嗽、各种类型的疼痛(神经性、肌肉骨骼和炎症性)、肿瘤和脂质代谢异常,这些是 COVID-19 感染和 COVID 后遗症患者出现的症状。已确定的24个基因中有10个是未报告的基因,这些基因在以前的任何研究中都没有报道,其中 90% 显示出对严重 COVID-19(A2 和 B2 组中“非常严重和住院的 COVID-19 病例”)的影响,8个基因仅在一种特定细胞类型中显示 MR 关联。

确定COVID-19药物靶点优先级的证据三角测量
结合从本研究中获得的上述证据,使用以下标准来确定 COVID-19 有前途的药物靶基因:(i) 该基因显示 MR 和共定位,以支持其作为 COVID-19 的推定致病基因,并且以前的研究没有报道(因此它必须是一个未报道的基因, 如果该基因也是可复制基因,则会获得额外的分数);(ii) 未报道的基因在相关通路中富集或包含在四个聚类模块中;(iii) 该基因显示与 SARS-COV-2 蛋白的预测相互作用和/或与 COVID-19 现有宿主蛋白的关联;(iv) 该基因是可成药基因(作为现有药物的靶点或作为可成药靶点)。对于 58 个具有 MR 和共定位证据以支持其因果关系的未报道基因,作者根据上述标准将它们分为三个等级。18 个基因被列为 1 级药物靶点 (总分 ≥1)。23 个基因,包括 19 个蛋白质编码基因和 4 个非编码基因,被列为 2 级靶标(总分在 0.35 和 1 之间),其余靶标被列为 3 级靶标。除 4 个非编码基因外,其余 37 个 Tier 1 和 Tier 2 基因被视为 COVID-19 有前途的药物靶点基因 (图 6)。其中,NCR3 被评为最高候选基因,得分最高为 2.1,这在所有测试标准中都显示了良好的证据。同样,EHMT2 、 RHEB 和 HSPA1B 也显示出来自多个标准的良好证据 (总分在 1.85 到 1.95 之间)。


总结

作者进行了单细胞 eQTL MR 和共定位分析,以研究 14 种免疫细胞类型的基因表达对 COVID-19 严重程度风险的推定因果影响。进一步应用宿主-病原体蛋白相互作用的功能富集分析和预测来确定参与 COVID-19 病理生理学的免疫介导的致病基因和网络。将遗传证据与临床试验信息相结合,作者开发了一个分层系统,以优先考虑 COVID-19 的免疫介导药物靶点。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多