关于数据库挖掘和分析,我们分别介绍过GEO和TCGA数据分析的多个工具了(如gene vesitigator,GEO2R,KM plotter,oncolnc,CRN等等),也准备了5分生信文章的还原(免费课堂:不想做实验,如何发一篇5分的文章?),依凡还专门录制了生物信息学数据库挖掘的系列课程,大家也可以单击文末原文链接直接购买学习和使用。 今天我们就来为大家介绍一个进行TCGA数据库数据挖掘的网站,简单易用。 UALCAN:http://ualcan.path./index.html 在主页右上角有一个Analysis选项,我们直接单击就可以打开下面的界面: 第一个功能:Scan by genes。可以直接查询多个基因在肿瘤里的表达和与预后的关系,比如我们输入10个基因: 然后单击Explore就可以打开新界面: 这里我们看到分析的链接有GEx profile和Survival Profile,说的分别是基因的表达情况和基因表达与预后的关系,而后面的HPRD,Genecards等是相关的数据库,我们先看第一个基因BMP4的GEx Profile: 大家看到左侧是肿瘤类型,右侧是分组类型,在上图中显示的红绿箱式图就是左侧的乳腺癌(Breast invasive carcinoma),分组标准是Major Cancer Stages,显示的就是BMP4基因在正常组和原发乳腺癌(Primary Tumor)组的差异和统计结果。 当然,我们可以选择其它肿瘤,比如肝癌(Liver hepatocellular carcinoma): 也可以选择分组标准,比如分期(Individual cancer stages): 再比如乳腺癌的亚型: 当然,我们还可以看到基因与患者预后的结果关系,通过一开始界面的survival profile: 或者Gex Profile界面的Visualize survial Plot都可以打开: 打开后的界面: 首先出现的是根据BMP4表达水平进行的生存曲线,我们可以直接下载为pdg格式用AI编辑,也可以继续单击next或者下面的页码(1,2,3,4,5)查看其它分类情况,比如表达和种族(Race): 表达和肿瘤分型: 等等,同样可以下载使用。 下面,我们再看第二个功能:Scan by gene Classes。在这个界面: 我们看到有各种类型的gene class,有的是蛋白类型,比如激酶kinase,泛素连接酶,蛋白酶,磷酸酶,还有根据功能划分的,比如细胞周期,凋亡,转移,还有通路的,比如p53,Hedgehog通路等。 也就是说,我们可以直接查看这一类基因在TCGA中的数据情况,这里我们以P53通路为例,选好后直接单击explore,这是我们看到的结果: 左侧是基因名,中间是基因在不同肿瘤中的表达和预后结果,最后是数据库链接,最上面的search for genes还可以直接对这个表格里面的基因进行搜索。以第一个基因CDK2为例,我们看到LIHC肝癌这个选项的LIHC是红色,表示的是CDK2表达显著上调;边框也是红色,表示总生存期显著,我们单击看一下具体的结果: 最后,我们看基因链接到的各个数据库: 第一个是HPRD:human protein reference database 可以查看CDK2的互作蛋白: 以及修饰等: 第二个是Genecards:看我们公众号的同学肯定都知道这个数据库了,收录是关于基因的综合信息: 我们就不多说了,有困难看这篇文章:听说你开题缺素材……。 第三个是Targetscan,做miRNA研究的基本都听过这个工具,这里对应的是调控CDK2基因的miRNA: 第四个是Pubmed Cancer,大家看一下: 是直接链接进行这个基因CDK2与Cancer这个关键词的搜索结果,展示的是文章的情况。 第五个是Human protein atlas,同样我们也介绍过:(工具篇)S5E50:航母级神器——蛋白组学结果大收录! 网站我们就介绍好了,大家使用的时候记得引用开发者的文章: UALCAN: A Portal for Facilitating Tumor Subgroup Gene Expression and Survival Analyses.Neoplasia. 2017 Aug;19(8):649-658.公众号介绍过的其它工具: (工具篇)S5E35:如何在不懂生信的前提下挖掘别人的数据? |
|
来自: 昵称45834002 > 《文件夹1》