BLAST 和 FASTA 的区别

目录:

Anonim

主要区别 – BLAST 与 FASTA

BLAST 和 FASTA 是两种相似性搜索程序,它们根据过度的序列相似性来识别同源 DNA 序列和蛋白质。两个 DNA 或氨基酸序列之间的过度相似性是由于共同的祖先同源性引起的。最有效的相似性搜索是比较蛋白质的氨基酸序列而不是 DNA 序列。 BLAST 和 FASTA 都使用评分策略来比较两个序列并提供关于序列之间相似性的高度准确的统计估计。这 主要区别 BLAST 和 FASTA 之间是 BLAST 主要用于寻找无间隙的、局部最优的序列比对 然而 FASTA 参与寻找不太相似的序列之间的相似性。

涵盖的关键领域

1. 什么是爆炸 – 定义、程序、用途2。 什么是 FASTA – 定义、程序、用途 3。 BLAST 和 FASTA 有什么相似之处 – 共同特点4。 BLAST 和 FASTA 有什么区别 – 主要差异的比较

关键术语:BLAST、FASTA、DNA、核苷酸、蛋白质、氨基酸、同源性、相似性、期望值

什么是爆炸

BLAST 代表 基本的局部比对搜索工具.这将搜索查询序列与保存在国家生物技术信息中心 (NCBI) 网站上的序列之间的相似性。可以根据保藏序列的序列同源性检测查询序列中的推定基因。 BLAST 作为一种生物信息学工具很受欢迎,因为它能够快速识别两个序列之间的局部相似性区域。 BLAST 计算一个期望值,它估计两个序列之间的匹配数。它使用序列的局部比对。可以在此处找到 NCBI BLAST 网络界面。

图 1:NCBI BLAST 网络界面

不同的 BLAST 搜索

爆炸程序

查询和数据库

BLASTN(核苷酸 BLAST)

查询 – 核苷酸,数据库 – 核苷酸

BLASTP(蛋白质爆炸)

查询 – 蛋白质,数据库 – 蛋白质

BLASTX

查询 – 翻译的核苷酸,数据库 – 蛋白质

TBLASTN

查询 - 蛋白质,数据库 - 翻译的核苷酸

TBLASTX

查询 – 翻译的核苷酸,数据库 – 翻译的核苷酸

什么是 FASTA

FASTA 是另一种序列比对工具,用于搜索 DNA 和蛋白质序列之间的相似性。查询序列被分解为称为 k 元组的序列模式或单词,并且在目标序列中搜索这些 k 元组以找到两者之间的相似性。 FASTA 是一个很好的相似性搜索工具。查找序列相似性时,进行搜索的最佳方法是先执行 BLAST 搜索,然后转到 FASTA。 FASTA 文件格式被广泛用作其他序列比对工具(如 BLAST)中的输入方法。欧洲生物信息学研究所 (EBI) 提供的 FASTA 网络界面可在此处找到。

图 2:FASTA 网络界面

FASTA 计划

FASTA计划

描述

法斯塔

蛋白质 – 蛋白质序列比较或核苷酸 – 核苷酸序列比较

快,快

核苷酸 - 蛋白质序列比较。

搜索

蛋白质-蛋白质或核苷酸-核苷酸序列之间的局部比对

GGSEARCH

蛋白质-蛋白质或核苷酸-核苷酸序列之间的全局比对

谷歌搜索

查询的全局比对和数据库中序列的局部比对。

BLAST 和 FASTA 之间的相似之处

BLAST 和 FASTA 的区别

定义

爆破: BLAST 是一种用于比较初级生物序列信息(如核苷酸或氨基酸序列)的算法。

法斯塔: FASTA 是一个 DNA 和蛋白质序列比对软件包。

代表

爆破: BLAST 代表基本局部比对搜索工具。

法斯塔: FASTA 是“fast-all”或“FastA”的缩写。

全球/本地对齐

爆破: BLAST 使用局部序列比对。

法斯塔: FASTA 首先使用局部序列比对,然后将相似性搜索扩展到全局比对。

局部序列比对

爆破: BLAST 通过比较两个序列中的单个残基来搜索局部比对的相似性。

法斯塔: FASTA 通过比较序列模式或单词来搜索局部比对中的相似性。

搜索类型

爆破: BLAST 更适合在紧密匹配或局部最优序列中进行相似性搜索。

法斯塔: FASTA 更适合在不太相似的序列中进行相似性搜索。

什么样的工作

爆破: BLAST 最适合蛋白质搜索。

法斯塔: FASTA 最适合核苷酸搜索。

查询序列中的差距

爆破: 在 BLAST 中,查询序列和目标序列之间不允许存在间隙。

法斯塔: 在 FASTA 中,允许有间隙。

灵敏度

爆破: BLAST 是一种敏感的生物信息学工具。

法斯塔: FASTA 比 BLAST 更敏感。

速度

爆破: BLAST 比 FASTA 更快。

法斯塔: 与 BLAST 相比,FASTA 的收费速度较慢。

开发商

爆破: BLAST 由美国国立卫生研究院的 Stephen Altschul、Webb Miller、Warren Gish、Eugene Myers 和 David J. Lipman 于 1990 年设计。

法斯塔: FASTA 由 David J. Lipman 和 William R. Pearson 于 1985 年开发。

意义

爆破: BLAST 是目前应用最广泛的相似性搜索生物信息学工具。

法斯塔: FASTA 的遗产是 FASTA 格式,它现在在生物信息学中无处不在。

结论

BLAST 和 FASTA 是两个成对序列比对工具,用于生物信息学中搜索 DNA 或蛋白质序列之间的相似性。 BLAST 是用于核苷酸和氨基酸序列局部比对的最广泛使用的工具。 FASTA 是一个很好的相似性搜索工具,它使用序列模式或单词。它最适合于不太相似的序列之间的相似性搜索。 BLAST 和 FASTA 之间的主要区别在于每个工具中使用的相似性搜索策略。

参考:

1. 马登,托马斯。 “BLAST 序列分析工具。” NCBI 手册 [互联网]。第二版。美国国家医学图书馆,2013 年 3 月 15 日。Web.Available here. 2017 年 6 月 9 日。2.“使用 FASTA 的成对序列比对。” Amrita Vishwa Vidyapeetham 大学。 N.p.,日期不详网。在这里可用。 2017 年 6 月 9 日。

图片提供:

1.BLAST官方网站2.FASTA官方网站

BLAST 和 FASTA 的区别