分享

丁香园论坛

 昵称57799527 2018-07-15
在网上搜索到的:
Blast,全称Basic Local Alignment Search Tool,即“基于局部比对算法的搜索工具”,由Altschul等人于1990年发布。Blast能够实现比较两段核酸或者蛋白序列之间的同源性的功能,它能够快速的找到两段序列之间的同源序列并对比对区域进行打分以确定同源性的高低。Blast具有较快的比对速度和较高的比对精度,适用于多种序列比对的情况,在常规双序列比对分析中应用最为广泛。可以毫不夸张的说,blast是做比较基因组学乃至整个生物信息学研究所必须掌握的一种比对工具。

Blast种类
Blast是一个集成的程序包,通过调用不同的比对程序,blast实现了五种可能的序列比对方式:
Blastp:蛋白序列与蛋白库做比对,直接比对蛋白序列的同源性。
Blastx:核酸序列对蛋白库的比对,先将核酸序列翻译成蛋白序列(根据相位可以翻译为6种可能的蛋白序列),再与蛋白库做比对。
Blastn:核酸序列对核酸库的比对,直接比较核酸序列的同源性。
Tblastn:蛋白序列对核酸库的比对,将库中的核酸序列翻译成蛋白序列,比对蛋白序列的同源性。
Tblastx:核酸序列对核酸库在蛋白级别的比对,将库和待查序列都翻译成蛋白序列,然后对蛋白序。
Blastclust:通过blast聚类。

Blast的几个常用参数
-e 期望值,表示了两条序列比对上的区域的整体相似程度。这个 值越小,比对结果越好。命令行中加入此参数则结果中只出现 期望值小于输入设定值的结果。
-F 过滤参数,将序列中的简单重复过滤不比。缺省值是TRUE, 如键入“-F F”,blast就不会过滤简单重复。
-m8 输出结果采用列表形式
许多人弄不清,输出行上的Score ,expect,P(N)何意?
Score = ,用打分表BLOSUM-62 ,Score in bits = ,?=0.319 ,k = 0.133,,稍有变化。expect简称E-value ,已经考虑了数据库的因素。其意义是:当用咨询序列搜索一个数据库(如非冗余的SwissProt ,现有77419 条序列,共27864727残基),纯由机会击中对象的平均数。例如E=1 ,表示在目前大小的数据库中,纯由机会搜到的对象数平均值为1 。而P(N)指N 个最高分匹配段的分数和纯由机会超过域值的概率。这些P 与E 有关系式P=1-e-E 。如何计算这些Score, Expect和P(N),须有较专门的统计数学的知识。对一般用户,乃须知道它们的含义。

希望对楼主有参考价值,很多我也不了解,希望高手参与,另外,如何进行BLAST,如何分析BLAST后的结果,请访问
http://www.ncbi.nlm./Education/BLASTinfo/tut1.html

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多