分享

玩转基因组浏览器之VCF文件的可视化

 生信修炼手册 2020-03-12

除了基因结构,测序深度的可视化外,IGV也可以展示基因组变异信息,支持以下两种文件格式

  1. VCF

  2. MAF

VCF是存储突变位点分型结果的标准文件格式,而MAF是由TCGA制订的,存储突变位点注释信息的文件格式。本文主要展示VCF文件导入IGV的详细过程。

首选我们需要对VCF文件建立索引,可以使用tabix软件来实现,操作方法如下

# 使用bgzip进行压缩
bgzip input.vcf

# 对压缩文件建立索引
tabix -p vcf input.vcf.gz

建立索引之后,就可以直接将vcf.gz文件导入IGV进行查看,结果示意如下

VCF文件中存储了多个样本的分型结果,每个位点的突变类型用不同颜色表示

  1. 深蓝色,杂合突变

  2. 青绿色,纯合突变

  3. 灰色,纯合未突变

在最上方用柱状图来表示allel在所有样本中的频率,蓝色表示ref allele, 红色表示alt allele。不同颜色表征不同的突变类型,可以形成类似热图的效果,方便直观的比较不同样本突变情况的异同。

·end·

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多