转自:https://blog.csdn.net/yangl7/article/details/109850480;如有侵权,请告知撤回。 GATK是一款强大的数据处理软件,最近在优化GWAS流程时遇到一个麻烦事,就是要将各样品的VCF文件进行合并,本来GATK里面有一个可以合并VCF数据的命令 CombineGVCFs,可以将所有样品的VCF合并成一个文件。但是这个命令需要一个一个输入文件名。 熟悉GWAS的小伙伴应该清楚,GWAS项目动辄上百个样品,让人一个一个输入还是很繁琐的。因此我写了个shell脚本,能够快速输入样品名称,并执行CombineGVCFs命令。 脚本 Ref_genome="genome.fna" echo 'gatk CombineGVCFs \' > combine.sh #将命令写在另一个脚本里 echo '-R' ${Ref_genome} '\' >> combine.sh for i in {*.g.vcf.gz}; do echo '--variant '${i}' \' >> combine.sh; done echo '-O all_sample.g.vcf.gz' >> combine.sh; sh combine.sh #执行combine.sh脚本 # -R 参考基因组 --variant 输入变异文件 可以输入多个文件 -O 输出文件 来看看执行脚本 cat combine.sh 版权声明:本文为CSDN博主「穆易青」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/yangl7/article/details/109850480 |
|