近期,国际学术期刊Nucleic Acids Research 在线发表了一项最新研究成果,报道了针对33种肿瘤类型、近万样本的eQTL分析。 这项工作由美国德州大学健康科学中心韩冷教授 (https://med./bmb/labs/han/labnews/)和华中科技大学公共卫生学院缪小平教授共同合作完成。龚静博士为第一作者。 癌症eQTL分析非常必要 全基因组关联研究(GWAS)可以为疾病或性状的遗传病因研究提供线索。分析显示,GWAS发现的与疾病相关的风险位点大多数位于基因的非编码区域并在调控区域富集,这些结果提示疾病相关位点可能主要通过调控基因表达来发挥作用。 所以想进一步剖析疾病,将遗传变异与基因表达数据的整合在一起,就要用到表达定量性状遗传位点(eQTLs) 分析。它是研究遗传变异功能及分子生物学机制的重要方法。然而,目前eQTL研究主要集中在血液样本和正常组织中,而有研究在通过肿瘤样本和正常样本的对比之后,发现大量eQTLs具有肿瘤特异性。针对癌症,尤其是多癌症的eQTL分析非常缺乏。 运用癌症基因组计划数据进行分析 为了揭示癌症中遗传变异对基因表达的影响,作者利用癌症基因组图谱计划(TCGA) 项目中33种肿瘤类型的9196个肿瘤样本的基因型和基因表达数据,进行了一系列的eQTL分析。一共发现了5606570个可以顺式调控基因表达的cis-eQTLs和231210个可以远程调控基因的trans-eQTLs。 研究发现,eQTL的发现数量随着样本量的增加而增加。由于全基因组eQTL分析需要同时具有多个样本的全基因组基因型数据(一般用芯片获得)和基因表达量数据(一般用测序技术获得),会花费大量经费,因此一般研究样本量都较少。而TCGA中有多个癌症样本量超过400,乳腺癌中样本量达到1092例,因此该研究用美国癌症基因组图谱计划的数据进行分析将有助于eQTL的发现。 另外,作者通过整合eQTLs与临床预后信息和GWAS数据,发现了22212个跟生存相关的eQTLs和337131个跟GWAS位点重合的eQTLs。 pancanQTL数据库概述:(A)pancanQTL四个数据集,包括cis-eQTLs,trans-eQTLs,生存相关的eQTLs和GWAS相关的eQTLs。(B)PancanQTL的搜索框。(C)cis-eQTLs 数据集中eQTL示意图。(D)与生存时间相关的eQTL Kaplan-Meier plot示意图。图片来源:Nucleic Acids Research 数据库平台pancanQTL提供免费查询 为了促进研究成果的利用,作者构建了数据库平台pancanQTL(http://bioinfo.life./PancanQTL),供其他研究者免费查询、浏览。该pancanQTL数据库上线一个月,即有来自13个国家近500次的数据访问。 该研究为认识不同癌症组织和不同个体中基因变异和基因表达的关联带来了新启示,有助于增强遗传变异在肿瘤的发生与发展中发挥的潜在生物学功能的理解,促进遗传和癌症相关研究领域的发展。 参考资料 |
|