分享

NAT REV MOL CELL BIO | 转录组测序技术的计算分析中需要更完整的方法学描述

 微科享 2021-04-19

加拿大学者Michelle S. Scott等人于2019年53日在《Nature Reviews Molecular Cell Biology》上发表题目为《In silico analysis of RNA-seq requires a more complete description of methodology》的综述。

该综述表明随着转录组测序技术在分子细胞生物学中的广泛使用,越来越多的数据分析计算工具和资源发展起来,为确保这一过程的重现性和透明度,详细指明用于转录组测序数据集的所有工具和参数很重要。

转录组测序数据的计算分析(从原始reads到转录本定量)需要独特的工具以及生物学参考,这些的结合决定了分析的结果。转录组测序流程的组合特征要求对所有的计算选择和参数进行完整的描述,以确保技术的重现性。

本文主要内容概述

转录组测序(RNA-seq)是一种通过测序对转录产物进行高通量检测和定量的方法,在分子细胞生物学中得到了越来越广泛的应用RNA-seq的原始测序结果一般包含了数十甚至数百万条reads,要得到原始样本转录组的相对定量结果需要几步处理。检查和过滤reads以保证测序质量,比对到合适的基因组或者转录组,最后进行定量。针对这几步处理,数百种计算工具和

资源发展起来,每种都证实比以前的方法更好。详细指明用于RNA-seq数据集分析的所有的工具和参数值至关重要,能够保证数据分析和解释过程中的重现性和透明度。

参考方法必须阐明清楚且可执行性强

高通量核苷酸测序技术的最少信息(MINSEQE)的参考早就已经有了。对于RNA-seq的计算要点,MINSEQE指南建议提供测序数据(比如FASTQ文件),以及数据处理和分析流程等充足的细节来保证数据解释的清晰,并且能够让科研人员重复分析步骤。MINSEQE指南明确这里面应该包含,但不局限于过滤和数据矫正方法,比对方法和参考基因组的识别。而且,指南建议提供研究最终的处理或者总结数据。我们也认同这些建议,但是我们认为提供的内容应该更具体,而且要定期更新修改,所有前处理的所有参数,比对和定量工具都应该阐释清楚。同时,提供用于比对和注释的基因组文件也同样重要(比如GRCh38.p12 and Ensembl 96)。我们主张所有RNA-seq的研究在发表时都要有方法学的细节。

RNA-seq的一大优点是当用新的基因组,注释和比对工具或者定量工具时,测序数据集可以再次分析。所以数据处理和分析流程完整的被提供在每篇文章里至关重要。

尽管以前呼吁增大计算RNA-seq的可重复性,针对现在发表的文章来看,只有一小部分文章完整描述了RNA-seq的关键的数据处理和分析流程。确保RNA-seq的可重复性还有好长一段路要走。

RNA-seq有望成为分子细胞生物学的主流技术。随着越来越多越来越精确和有效的工具用于分析RNA-seq数据,我们必须确保从这些分析中得到的结果和结论是可重复的。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多