α多样性评估样本内的多样性,包括丰富度和均匀度。可以使用几个软件包计算α多样性,包括QIIME、R包vegan和USEARCH。
β多样性评估样本间微生物群的差异,通常与主坐标分析(PCoA)、非度量多维标度(NMDS)或约束主坐标分析(CPCoA)等降维方法相结合。这些分析可以在R-vegan包中实现,并在散点图中可视化。
分类组成描述了微生物群落的组成,通常使用堆积条形图来可视化。为了简单起见,微生物群通常显示门或属水平。
差异比较可确定组间丰度显著不同的特征(如物种或基因),结果可以使用火山图、曼哈顿图或扩展误差条形图进行可视化。一般使用Welch’s t-test, MannWhitney U test, Kruskal-Wallis test, 或 ALDEx2, edgeR , STAMP ,LEfSe 等工具分析。
相关性分析用于揭示分类单元与样本元数据之间的关联。例如,它用于识别分类群与环境因素(如pH值、地理位置和临床指数)之间的关联。
网络分析从整体的角度探究特征的共现性。相关网络的特性可能代表共同发生的类群或功能途径之间的潜在相互作用。可以使用R中的cor.test()函数或适用于诸如SparCC包等成分数据的更强大的工具来计算相关系数和有效的P值。还可以使用R库igraph、Cytoscape或Gephi对网络进行可视化和分析。
在微生物研究中,机器学习用于分类、β多样性分析、特定特征的组合分析。常用的机器学习方法包括随机森林、Adaboost和深度学习,通过选择生物标志物或回归分析对组进行分类,以显示生物标志物丰度的实验条件依赖性变化。
Treemap广泛应用于系统发育树的构建、微生物组的分类注释和可视化。代表性的扩增子序列易于用于系统发育分析。我们建议使用IQ-TREE通过大数据快速构建高可信度的系统树,并使用iTOL在线可视化。可以使用R脚本table2itol(https://github.com/mgoeker/table2itol)轻松生成树的注释文件。此外,我们建议使用GraPhlAn在一个有吸引力的分支图中可视化系统发育树或层次分类法。