分享

揭秘芯片——Agilent数据标准化

 微笑如酒 2017-02-22

揭秘芯片——Agilent数据标准化

原创 2016-03-22 by Wu 欧易生物
欧易生物

oebiotech

关注欧易生物官方公众号,了解生物技术服务动态,更多优惠抢先知晓。


上次介绍了Agilent芯片的原始数据之后,可能细心的客户又会提问了,在欧易生物的报告中,紧接在原始数据之后的还有一个文件“2 标准化数据”,这个文件夹又是个什么东东


有些客户可能想了,我在拿到原始数据之后,这个数据里面又包含了每个样本每个基因的表达量,那么是不是可以直接用来比较差异?但是这里面有几个问题:


  • 拿到的数据不是呈现大致的正态分布,后续若得用到统计算法的话,不符合统计算法的假设前提


  • 虽然样本上样量是一样的,但是最后检测得到的信号值还是会有变动的,这个属于芯片技术的系统误差,这样的系统误差若没有进行剔除的话,很有可能会对后续的差异筛选造成干扰

 

基于这两个原因,我们需要对数据进行标准化,而在基因表达研究中,一般我们假设在同一批次的样本中,基因的信号分布范围大概一致,对于Agilent芯片,一般利用Quantile方法对数据进行标准化。(关于Quantile方法的介绍见下回分解)


标准化前后的数据分布如下图,图上每列对应一个样本,从下图看,每个样本的数据分布趋势不一致,如果直接进行比较,那么得到的基因很多都是差异基因,而这样的结果不是我们所期望的。



标准化后的数据分布:


从上图可以看到,经过标准化后的结果,每个样本的数据分布大致都是呈现一致分布。经过标准化后的数据,就可以进行下一步的差异筛选了。


To be continued


Agilent芯片首选服务商:欧易生物——近六年内唯一获得认证的官方服务商!



阅读
精选留言

该文章作者已设置需关注才可以留言

写留言

    该文章作者已设置需关注才可以留言

    写留言

    加载中
    以上留言由公众号筛选后显示

    了解留言功能详情

      本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
      转藏 分享 献花(0

      0条评论

      发表

      请遵守用户 评论公约

      类似文章 更多