分享

【进阶篇一】微生物多样性研究常用分析方法介绍

 sailing_387 2016-08-15

上期小编为大家介绍了什么是OTU,以及Alpha多样性和Beta多样性的含义,大家应该对这些基本概念都有了一定的了解,那这些分析到底是怎么做的呢?这期就为大家介绍分析用到的一些软件和方法。


微生物多样性分析神器——QIIME

QIIME全称为Quantitative Insights Into Microbial Ecology,是一款专门为微生物生态学研究服务的软件,它整合了许多科研界公认的第三方软件工具和算法,可以进行数据质控、序列比对、OTU聚类、物种注释、物种进化树构建、多样性指数计算等等,功能十分强大。


QIIME支持在Linux和Mac系统中运行,Windows系统可以安装QIIME虚拟软件来运行。您可以登录QIIME的官方网站进行软件的下载:http:///,也会有针对illumina数据的指导“Illumina overview tutorial”

PS:QIIME的发音为:‘Chime’[t?a?m],如果你使用,记得加上引用文献:QIIME allows analysis of high-throughput community sequencing data

如何实现OTU聚类——UPARSE

上期讲到了微生物多样性研究中首先就要构建OTU,UPARSE软件就可以完成这个步骤,你可以单独下载UPARSE或直接在QIIME上进行。UPARSE方法在2013年发表在Nature Methods,专门用于OTU的构建。


你可以将拼接好并经过数据质控后的FASTA格式数据,输入到UPARSE软件中,设定相似度值(建议使用UPARSE中默认值97%),软件就会进行OTU的聚类,最后结果会以表格的形式展现,我们称之为“OTU table”,后续很多分析都是在OTU table基础上进行的。

如表1中显示,分析会得到类似的一张OTUtable,表中数字代表每个OTU在每个样本中的Tag个数情况,也统计了每个样本中的Tags总数(Total_tag),低频Tags数(Uniq_tag)数,如果某一条Tag和其他Tag相似度都没有达到97%,就会独自形成一个OTU,我们称这种tag为Uniq_tag,这些可能是由于测序错误导致的,所以在分析中需要将Uniq_tag去除。

物种注释——RDPClassifier和Greengene数据库

构建好的OTU之后,会选取的OTU代表序列跟数据库中的已知序列比对,每个OTU就会得到一个物种注释信息。大家可能会想到常用的Blast比对方法,但我们建议使用RDP Classifier,它原理类似于LCA算法,就是如果一个代表序列在属水平上得到了两种注释结果,就会向前看科水平的注释结果,如果科水平只有一个注释结果,该序列就只能注释到科水平,而认为属水平注释结果是不准确的,因此比使用Blast准确度更高。



这样的话,OTU table中又多了一列物种注释信息,终于将一堆复杂的序列变成了我们关心的物种情况了,而且还可以体现一个样本中不同物种的丰度情况哦~我们可以利用Tags的多少来体现物种的相对丰度,但只能体现一个样本中不同物种的相对丰度,样本和样本之间是不能比较的

本期就先介绍到这儿,如果你想进一步学习上面软件的具体使用操作,可以参加我们5月分举办的信息分析培训班,我们的信息分析工程师将手把手教你如何使用,大家可以登录诺禾致源官网查询报名信息。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多