分享

CNGBdb动手实验室 | 癌症分析【第1课】热身-快速跑变异检测

 尐尐呅 2022-06-09 发布于湖北

实践必修课:癌症分析

基因组突变的积累被广泛认为是癌症发生、发展的重要原因,也是探索癌症治疗方法的重要切入点。因此,基因组测序及变异检测成为癌症研究最常见的分析方案。

癌症分析实践必修课将以具体实例介绍简单实用的癌症基因组生信分析的常用工具以及分析思路。

第一课:动手体验变异检测

Get your hands dirty!

Step1:安装docker

你需要一台电脑,Windows, Mac或是Linux系统,都可以!只要,你安装好Docker:

https://www./

根据docker官网指引,下载并安装Docker,注册Docker账号登录,根据官网文档配置:

https://docs./docker-for-windows/install

确认在你的计算机上,Docker is running:

如果你安装成功了,可以在PowerShell/command prompt/Terminal里操作,看到以下结果:

> docker --version

> docker run hello-world


Q & A 

Q:为什么要使用Docker呢?

A:因为在Docker中,开发者已经把他们的工具程序和依赖包都放在一个轻量级、可移植的镜像中,你可以很方便地在你的电脑(无论是Windows,MacOS,还是Linux)上使用这些工具程序。

Step2:安装docker版GATK

你需要了解GATK,并准备好一个Docker版本的GATK。GATK (Genome Analysis Toolkit)是大名鼎鼎的美国Broad Institute 开发的一套基因组分析生信工具,也是人类及癌症基因组分析中最经典,最常用的工具。其中,本次演示中使用的HaplotypeCaller是GATK常用的变异检测软件。

https://software./gatk/

GATK已经把他们的工具放在Docker hub,因此,我们可以来尝试一下使用Docker版本的GATK。根据Docker hub上的提示,只要一句命令,就可以下载好Docker GATK:

> docker pull broadinstitute/gatk


查看一下你的Docker镜像,如果是这样,说明你已经下载好了:

> docker images


Step3:准备测试数据

你需要准备一个用来测试的数据,CNGBdb (国家基因库大数据平台)上有充足的公开数据资源供大家做生信实践,只要你有充足的存储空间,轻松下载,玩一玩!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多