分享

TCGA基因芯片数据分析神器,问你接不接?

 萌小芊 2018-03-11

TCGA分析神器

闭关学习TCGA,想用R语言直接下载TGCA数据库RNA-Seq、基因芯片数据等,不给力的电脑,运行速度太慢,还是建议想搞编程的同学,起码电脑内存8G,200G以上,当然懒人有懒人的处理办法,毕竟目前很多软件都是懒人开发的。TCPA你值得拥有!http://www./tcpa/

点击链接,进入主要界面,主要有四个部分,summary、My protein、Visualization、Analysis

Summary里面主要讲了本软件涉及的数据集,主要是TCGA中的蛋白芯片数据和一些细胞系数据,点击右边的show按钮可以显示特定数据集中的信息概要,比如点击BRCA show可以查看BRCA的详细信息

My protein主要展示一些蛋白Marker,同时可以看到一些抗体的信息和货号、来源等信息。

点击Visualization,可以看到两个界面Network Visualization和Heatmap Visualization两个部分。Network Visualization进入后,点击select a data set,可选择TCGA Breast invasive carcinoma(BRCA)(901samples),点击show,显示蛋白共表达网络,可以看到下图结果,红色表示正相关,绿色表示负相关。

点击Heatmap,进入后选择数据集,比如TCGA Breast invasive carcinoma(BRCA)(901samples),点击show,显示热图,见下图

选择K=3热图后,显示BRCA乳腺癌热图数据,见下图:可通过滚动鼠标对图进行放大缩小

Analysis一栏最为重要,里面的图完全可以放在文章第一部分来完善逻辑环。包含三个分析模块,相关性分析(Correlation),差异分析(Differential)和生存分析(Survival)。Correlation模块展示肿瘤样本中(以乳腺癌为例)分子表达相关性,按皮尔逊系数从大到小排列,点击可以看到该分子的散点图。Differential模块用处不大,只能分析两种肿瘤组织之间表达差异,比较结肠癌和乳腺癌。Survival模块按Log-Rank p值从小到大排列了蛋白表达量与生存率之间的关系,红色代表高表达组,蓝色代表低表达组

相关性分析(Correlation)

差异分析(Differential)-结肠癌VS乳腺癌

生存分析(Survival)

红色表示高表达组,蓝色表示低表达组

图/文/编辑/     刘晓雪



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多