揭秘芯片——Agilent数据标准化 原创 2016-03-22 by Wu 欧易生物 欧易生物 oebiotech 关注欧易生物官方公众号,了解生物技术服务动态,更多优惠抢先知晓。 上次介绍了Agilent芯片的原始数据之后,可能细心的客户又会提问了,在欧易生物的报告中,紧接在原始数据之后的还有一个文件“2 标准化数据”,这个文件夹又是个什么东东? 有些客户可能想了,我在拿到原始数据之后,这个数据里面又包含了每个样本每个基因的表达量,那么是不是可以直接用来比较差异?但是这里面有几个问题:
基于这两个原因,我们需要对数据进行标准化,而在基因表达研究中,一般我们假设在同一批次的样本中,基因的信号分布范围大概一致,对于Agilent芯片,一般利用Quantile方法对数据进行标准化。(关于Quantile方法的介绍见下回分解) 标准化前后的数据分布如下图,图上每列对应一个样本,从下图看,每个样本的数据分布趋势不一致,如果直接进行比较,那么得到的基因很多都是差异基因,而这样的结果不是我们所期望的。 标准化后的数据分布: 从上图可以看到,经过标准化后的结果,每个样本的数据分布大致都是呈现一致分布。经过标准化后的数据,就可以进行下一步的差异筛选了。 To be continued Agilent芯片首选服务商:欧易生物——近六年内唯一获得认证的官方服务商! 阅读 |
|