配色: 字号:
微生物检测之16S与宏基因组测序mNGS
2022-03-01 | 阅:  转:  |  分享 
  
微生物检测16S与宏基因组测序mNGS2022年3月1日目录CONTENTS1微生物基本概念2微生物常见检测方法316S测序4宏基因组测序第
一节微生物基本概念微生物基本概念微生物(Microbe/micro-organism)微生物(microorganism,mic
robe)是一些肉眼看不见的微小生物的总称。包括属于原核类的细菌、放线菌、支原体、立克次氏体、衣原体和蓝细菌(过去称蓝藻或蓝绿藻)
,属于真核类的真菌(酵母菌和霉菌)、原生动物和显微藻类,以及属于非细胞类的病毒、类病毒和肮病毒等。种群(Population)种群
(population)指同一时间生活在一定自然区域内,同种生物的所有个体共位群(Guild)共位群(guild):在代谢关系上相
关的种群群落(Community)微生物群落(community):是指在一定区域里或一定生境里,各种微生物种群相互松散结合,或有
组织紧凑结合的种群结构单位。多组共位群相互.作用形成的群体。生态系统(Ecosystem)微生物生态系统是各种环境因子如物理、化学
及生物因子对微生物区系(及自然群体)的作用,以及微生物区系对外界环境的反作用微生物组与元基因组微生物组(Microbiome)微生
物组指的是包括微生物(细菌、古细菌、低等或高等真核生物和病毒)的基因组(基因),以及其周围环境在内的全部元基因组(Metageno
me):某个环境中所有微生物的遗传物质。微生物组学微生物组(Microbiome)的特点是结合了宏基因组学、代谢组学、宏转录组学
、以及宏蛋白组学等和临床/环境数据的集合Metabolomics代谢组学用来确定给定菌株或单个组织代谢物特征的分析方法。给定菌株
和单个组织内存在的所有代谢物统称为代谢组(metabolome)。大多数用来描述代谢组的平台包括核磁共振(NMR)、质谱(MS)与
液相色谱(liquidchromatography)联合分离系统Metatranscriptomics宏转录组学通过对微生物群
落中的表达的RNAs(meta-RNAs),采用进行高通量测序分析相应的meta-cDNA。这种方法可提供微生物组的调控和表达层
面的整体信息Metaproteomics宏蛋白质组指的是在特定时间、特定环境/临床样品中的整个蛋白质组的大规模描述宏基因组宏基因
组(Metagenome):广义宏基因组是指特定环境下所有生物遗传物质的总和。狭义宏基因组是指特定环境样品中细菌和真菌的基因组总
和。获得微生物的手段传统病原检测方法宏基因组检测方法细菌/真菌以培养为主,阳性率仅有15-20%,需要3-5天报告时间无偏性病原体
广覆盖(细菌、真菌、病毒、寄生虫),灵敏度高病毒以PCR检测与血清检测为主,检测目标狭窄,靶标固定深入提供病原鉴定,分型难以检测新
发/罕见病原,难以检测疑难混合感染以序列为基础,可检测新发病原体,并进行溯源分类目前可培养的微生物极少未培养细菌达93.5%未培养
古菌达98.3%第二节微生物常见检测方法QPCRDGGE扩增子测序宏基因组测序QPCR实时荧光定量核酸扩增检测系统(Real-ti
meQuantitativePCRDetectingSystem)该方法是临床上分子生物学诊断技术的主流原理:针对某一(类
)具体的功能酶的序列,设计特异性引物,通过PCR扩增,观察其表达量的情况适用场景:针对具体的病原微生物,设计特异性引物,通过PCR
扩增,定型或定量地确定感染情况DGGE变形凝胶梯度电泳(denaturinggradientgelelectrophores
is)该方法主要应用微生物多样性、亲缘关系鉴定、突变检测等领域基本原理:根据DNA在不同浓度的变性剂中解链行为的不同而导致电泳迁移
率发生变化,从而将片段大小相同而碱基组成不同的DNA片段分开区分不同序列,精确到1个碱基扩增子测序扩增子测序:对特定长度的PCR产
物或者捕获的片段进行测序。扩增子测序主要包括:16SrDNA测序:16SrDNA为编码原核生物核糖体小亚基rRNA的DNA序列
,主要用于细菌或古菌的多样性分析。18SrDNA测序:18SrDNA为编码真核生物核糖体小亚基rRNA的DNA序列,主要用于真
核生物之间的种类差异。ITS测序:主要用于真菌多样性分析,ITS1位于真核生物核糖体rDNA序列18S和5.8S之间,ITS2位于
真核生物核糖体rDNA序列5.8S和28S之间。目标区域扩增子测序:针对某个功能区域(如尿素分解)进行扩增测序,主要用于特殊功能徼
生物群落的多样性分析。宏基因组测序宏基因组测序(MetagenomicsSequencing):是对环境样品中全部微生物的总DN
A(也称宏基因组Metagenomic)进行高通量测序,主要研究微生物种群结构、基因功能活性、微生物之间的相互协作关系以及微生物与
环境之间的关系。基本实验原理:将微生物基因组DNA随机打断成500bp的小片段,然后在片段两端加入通用引物进行PCR扩增测序,再通
过组装的方式,将小片段拼接成较长的序列。16S和宏基因组测序测序原理研究目的物种鉴定浓度16S针对细菌某一段高变区序列V4区或V3
-V4区)进行PCR扩增后进行测序,得到1500bp左右的序列。主要研究群落的物种组成、物种间的进化关系以及群落的多样性。得到的序
列很多注释不到种的水平上。宏基因组高通量测序:将微生物基因组DNA随机打断成500bp的小片段,然后在片段两端加入通用引物进行PC
R扩增测序,再通过组装的方式,将小片段拼接成较长的序列。在16S测序分析的基础上,还可以进行基因和功能层面的深入研究(GO、Pat
hway等)。可以鉴定到微生物的种的水平、甚至是菌株的水平。第三节16S测序16S测序16SrDNA扩增子测序(16SrDNA
AmpliconSequencing)针对16SrDNA某个或某几个变异区域,选择通用引物进行PCR扩增,对PCR产物进行测
序分析;通过物种注释及丰富分析,可以揭示样本物种构成,通过α多样性分析(Alphadiversity)和β多样性分析(Beta
diversity),可以揭示样本间差异。16S测序实验流程提取DNA及扩增建库:提取样品总DNA后,根据保守区设计得到引物,在引
物末端加上测序接头,进行PCR扩增并对其产物进行纯化、定量和均一化形成测序文库,建好的文库先进行文库质检。高通量测序:质检合格的文
库用IlluminaHiSeq2500进行测序。生信分析:高通量测序(如IlluminaHiSeq等测序平台)得到的原始图像
数据文件,经碱基识别(BaseCalling)分析转化为原始测序序列(SequencedReads),结果以FASTQ(简称为
fq)文件格式存储,其中包含测序序列(Reads)的序列信息以及其对应的测序质量信息。OTU分析OTU即分类操作单元,是在系统发生
学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。使用QIIME(versi
on1.8.0)软件中的UCLUST对Tags在97%的相似度水平下进行聚类、获得OTU,并基于Silva(细菌)和UNITE
(真菌)分类学数据库对OTU进行分类学注释。一、物种注释及分类学分析将OTU的代表序列与微生物参考数据库进行比对可得到每个OTU对
应的物种分类信息,进而在各水平(phylum,class,order,family,genus,species)统计各样品群落组成
,利用QIIME软件生成不同分类水平上的物种丰度表,再利用R语言工具绘制成样品各分类学水平下的群落结构图。物种丰度聚类热图物种分布
图二、系统进化树用QIIME软件挑选出属分类学水平上丰度最高的OTU的序列作为代表序列,进行多重序列比对并构建系统进化树,然后通过
Python语言工具绘制图形。三、Alpha多样性分析Alpha多样性(Alphadiversity)反映的是单个样品物种丰度(
richness)及物种多样性(diversity),有多种衡量指标:Chao1、Ace、Shannon、Simpson。Chao
1和Ace指数衡量物种丰度即物种数量的多少。Shannon和Simpson指数用于衡量物种多样性,受样品群落中物种丰度和物种均匀度
(Communityevenness)的影响。使用Mothur(versionv.1.30)软件,对样品Alpha多样性指
数进行评估。一般为比较样品间的多样性指数,分析时会将样品所含序列数进行标准化。Shannonindex越大则OTU种类越多,物种
越丰富,表明样品中已涵盖绝大多数的微生物物种信息。Shannonindex曲线四、Beta多样性分析使用QIIME软件进行Be
ta多样性(Betadiversity)分析,比较不同样品在物种多样性方面存在的相似程度。Beta多样性分析主要采用binar
yjaccard、braycurtis、weightedunifrac(限细菌)、unweightedunifrac(
限细菌)等4种算法计算样品间的距离从而获得样本间的β值。基于这4种距离矩阵展开的Beta多样性分析,主要有以下几点。1)PCA与P
CoA分析:2)NMDS分析:3)UPGMA分析:4)组间物种差异热图:Beta多样性分析1)PCA与PCoA分析:通过一系列的特
征值和特征向量进行排序,选择主要的前几位特征值,采取降维的思想,找到距离矩阵中最主要的坐标,从而观察个体或群体间的差异。PCA分析
(PrincipalComponentAnalysis),即主成分分析,是一种对数据进行简化分析的技术,这种方法可以有效的找出
数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。PCoA分析,即主坐标分析(
principalco-ordinatesanalysis),也是一种非约束性的数据降维分析方法,可用来研究样本群落组成的相似
性或差异性,与PCA分析类似;主要区别在于,PCA基于欧氏距离,PCoA基于除欧氏距离以外的其它距离,通过降维找出影响样本群落
组成差异的潜在主成分。NMDS分析NMDS分析:将对象间的相似性或相异性数据看成点间距离的单调函数,在保持原始数据次序关系的基础上
,用新的相同次序的数据列替换原始数据进行度量型多维尺度分析,用于比对样本组之间的差异。UPGMA分析、组间物种差异热图UPGMA分
析:基于各样品序列间的进化信息的差异来计算样品间的差异,可以反映样品在进化树中是否有显著的微生物群落差异。组间物种差异热图:基于O
TU-Table和上述4种距离矩阵进行物种聚类,从聚类中可以了解样品之间的相似性以及各分类水平上的群落构成相似性。UPGMA分析五
、组间差异显著性分析组间差异显著性分析组间差异显著性分析主要用于发现不同组间具有统计学差异的Biomarker。六、16S功能基因
预测分析使用PICRUSt软件通过比对16S测序数据获得的物种组成信息,推测样本中的功能基因组成,从而分析不同样本或分组之间在功能
上的差异。首先需要对生成的OTU-table进行标准化(不同的种属菌包含的16S拷贝数不相同);然后,通过每个OTU对应的gree
ngeneid,即可获得OTU对应的KEGG和COG家族信息,从而计算该KEGG和COG的丰度并从KEGG数据库的信息中获得Pa
thway、EC信息、OTU丰度计算各功能类别的丰度。组间KEGG代谢途径差异分析图COG功能分类统计图第四节宏基因组测序宏基因组
测序宏基因组(Metagenomics),也称元基因组,利用新一代高通量测序技术(NGS)以特定环境下微生物群体基因组为研究对象
,在分析微生物多样性、种群结构、进化关系的基础上,可进一步探究微生物群体功能活性、相互协作关系及与环境之间的关系,发掘潜在的生物学
意义。与传统微生物研究方法相比,宏基因组测序技术规避了绝大部分微生物不能培养、痕量菌无法检测的缺点,因此近年来在环境微生物学研究中
得到了广泛应用。宏基因组测序流程组装和基因预测组装得到的scaffolds是在gap区域打断的序列集合。根据组装结果进行基因预测;
然后,按照细菌密码子表(NCBIGeneticCodes11),将预测的基因翻译成蛋白序列功能注释1.代谢通路注释KEGG数据
库包含8类生物代谢通路的分析:GlobalMap,Metabolism,GeneticInformationProcessi
ng,EnvironmentalInformationProcessing,CellularProcesses,Orga
nismalSystems,HumanDiseases,DrugDevelopment,其中每类又被系统分类为二、三、四层
。第二层目前包括有39种子功能;第三层即为其代谢通路图;第四层为每个代谢通路图的具体注释信息。功能注释2.同源基因簇注释eggNO
G(evolutionarygenealogyofgenes:Non-supervisedOrthologousGro
ups)数据库是利用Smith-Waterman比对算法对构建的基因直系同源簇(OrthologousGroups)及其功能注释,新版数据库eggNOGVersion3涵盖了1,133个物种的基因,构建包含24类,约70万个OrthologousGroups,其中约62.5%具有宽泛的功能注释信息。功能注释3.碳水化合物酶活性注释CAZy数据库是一个专门用来收集、研究碳水化合物活性酶的基因、结构和生化信息的数据库,主要涵盖5个大的家族:糖苷水解酶(GHs,GlycosideHydrolases),糖基转移酶(GTs,GlycosylTransferases),多糖裂合酶(PLs,PolysaccharideLyases),碳水化合物酯酶(CEs,CarbohydrateEsterases)和碳水化合物结合模块(CBMs,Carbohydrate-BindingModules)。感谢您的聆听!
献花(0)
+1
(本文系醉意流年huc...原创)