我们把基础科研的层次分为四部分:临床、细胞、动物和分子,在临床样本出发的研究中,我们介绍过三步骤:1. 找差异;2. 分析相关性 3. 预后分析。对大家来说,临床部分常常遇到的问题就是样本量不够,比如自己只能收到20对样本,这时我们还有两个选择: 1. 从商业化的公司购买样本,比如组织芯片; 2. 从公共数据库(比如TCGA)中挖掘数据。 其实,我们看到的高分文章常常就是把这三部分整合起来用,比如:CCR这篇文章: 第一个figure: 甚至直接只用数据库的结果,今天我们就从一篇文章开始说起: 这篇文章是2017年3月份发表在Oncotarget杂志的文章,说的是STAT家族的七个分子作为乳腺癌标志物的主题,我们看文章的内容: fig1 七个STAT因子在不同肿瘤中的表达(数据来源于Oncomine) fig2 七个STAT因子与SBR(Scarff Bloom & Richardson grade status)的关系 fig3 七个STAT因子与乳腺癌预后(RFS)的关系(KM Plotter) fig4 乳腺癌中STAT3表达与突变(预后)分析(cBioPortal) 就这样,大家已经看到了,文章用了Oncomine,KM plotter,TCGA等数据库,挖掘下来就把4个图给找出来了,是不是一方面觉得Oncotarget名副其实的灌水(鄙夷脸),另一方面在想:即使是灌水,我要是也能灌几篇也可以(沉思脸)。 所以,今天我们就来用工具跟大家说说这些图的做法,今天我们说的这个是:fig 3 七个STAT因子与乳腺癌预后(RFS)的关系(KM Plotter)中如何用网站直接做: 这个网站是:Kaplan Meier Plotter(http:///analysis/),打开后页面如下: 划重点了,网站可以进行四个癌种:乳腺癌、卵巢癌、肺癌、胃癌的mRNA表达和乳腺癌miRNA的预后分析。 下面我们看怎么把fig3的图给重复出来,我们以P值小于0.05的STAT2 为例: 接下来: 选好最后的Draw Kaplan-Meier Plot后就出来了: 跟文章里面的结果有些不同,是由于数据库更新造成的,不过logrank P都小于0.05,都有意义: 其它的内容我们下次再说,大家感兴趣的也可以通过课程来听,小张都放到课程里面了: |
|