BLAST
BLAST (Basic
Local Alignment Search Tool) es un programa informático de
alineamientos de secuencias de tipo local, ya sea de ADN, ARN o de
Proteinas. El programa es capaz de comparar una secuencia problema (también
denominada en la literatura secuencia query) contra una gran cantidad de
secuencias que se encuentren en una base de datos. El algoritmo encuentra
las secuencias de la base de datos que tienen mayor parecido a la secuencia
problema. Es importante mencionar que BLAST usa un algoritmo heurístico por
lo que no nos puede garantizar que ha encontrado la solución correcta. Sin
embargo, BLAST es capaz de calcular la significación de sus resultados, por lo
que nos provee de un parámetro para juzgar los resultados que se obtienen.
Normalmente el BLAST es usado para encontrar probables genes homólogos.
Por lo general, cuando una nueva secuencia es obtenida, se usa el BLAST para
compararla con otras secuencias que han sido previamente caracterizadas, para
así poder inferir su función. El BLAST es la herramienta más usada para la
anotación y predicción funcional de genes o secuencias proteicas. Muchas
variantes han sido creadas para resolver algunos problemas específicos de
búsqueda.
Algoritmo del BLAST
BLAST usa una matriz de sustitución de aminoácidos o
nucleótidos para calificar sus alineamientos. Dicha matriz contiene la
puntuación (también llamada score) que se le da al alinear un nucleótido o
un aminoácido X de la secuencia A con otro aminoácido Y de la secuencia B.
Esta es la página de BLAST donde podrás buscar por nucleótidos o
por proteínas.
Primera etapa: ensemillado o seeding
En esta etapa se buscan "palabras" pequeñas en las secuencias
de la base de datos, que corresponden a fragmentos de la secuencia problema.
BLAST asume que los alineamientos significativos deben contener estas palabras.
Segunda etapa: extensión
Una vez obtenidas las palabras que cumplen con los criterios dados, se
pasa a la etapa de extensión. En esta etapa el alineamiento se va extendiendo a
ambos lados de las palabras. La extensión realizada en este punto se realiza
haciendo uso del algoritmo de Smith-Waterman.
Tercera etapa: evaluación
Una vez terminada la extensión de todas las palabras, cada uno de los
alineamientos realizados es evaluado para determinar su significación
estadística. Para ello, el programa elimina los alineamientos inconsistentes
(alineamientos que junten la misma parte de la secuencia problema con distintas
partes de una secuencia en la base de datos).
opinion
A
pesar de que BLAST es un programa muy poderoso y casi siempre podemos confiar
en sus resultados, se debe recordar que el programa es heurístico y por lo
tanto puede que no encuentre la solución óptima. En la actualidad, el abuso y
la pobre interpretación de los resultados de BLAST ha llevado a múltiples
errores de anotación. Una cosa a tener en cuenta al usar BLAST es que cuanta
más evidencia externa se pueda obtener para corroborar un alineamiento
(fisiológica, filogenética, genética, etc.) es mejor.
No hay comentarios:
Publicar un comentario