对于二代数据的表达差异分析,理论上应该用reads counts进行计算。这个在我们论坛的专题帖已经有解释:
同时,在我们OS-tools已经有基于edgeR软件的差异分析工具。但依然有网友问,如果手头没有reads count数据,而只有RPKM/FPKM值该怎么办? 这个时候,就只能退而求其次,使用t检验或者方差分析。但注意,这两种检验是基于正态分布的检验方法,是不适用于二代数据的,对低丰度基因的检验会产生大量假阳性。不到万不得已不要使用这类方法。 如果非使用不可,可以:
请确定你认真看了上面两点使用建议,再开始看代码。 # t检验的代码如下:
#方差分析的代码如下,与t检验相比,逻辑相同,只是有些细微的修改。
另外,如果没有R基础的同学,看这一期视频,学完就基本可以保证正确使用这个脚本:
备注:理论上如果你理解了这个方法,可以进行任何组间的差异检验。只要把检验方法的部分的相关语句替换就可以了,例如可以替换为秩和检验、相关性检验等; |
|