Clustal
Clustal es
un programa de computadora ampliamente utilizado para
realizar alineamientos múltiples de secuencias.
La última versión es la 2.0.12 (2009), cuya principal novedad es que fue
completamente reescrita en C++.1 Hay
dos variantes:
ClustalW:
interfaz de línea de comandos
ClustalX:
esta versión tiene una interfaz gráfica. Está disponible para Unix/Linux, Mac OS y Windows.
Entrada/Salida
Este
programa acepta un amplio rango de formatos de entrada. Incluyendo NBRF/PIR, FASTA, EMBL/Swissprot,
Clustal, GCC/MSF, GCG9 RSF y GDE.
El
formato de salida puede ser alguno de los siguientes: Clustal, NBRF/PIR,
GCG/MSF, PHYLIP, GDE, NEXUS.
Alineamiento múltiple de
secuencias
Hay tres etapas importantes:
- Hacer un alineamiento por pares
- Crear un árbol filogenético (o usar un árbol definido por el usuario)
- Usar el árbol filogenético para llevar a cabo el alineamiento múltiple
Esto es hecho
automáticamente cuando seleccionas "Do Complete Alignment"
("Hacer el alineamiento completo", en español). Otras opciones son
"Do Alignment from guide tree" ("Hacer el alienamiento con el
árbol guía) y "Produce guide tree only" ("Sólo producir el árbol
guía).
Alineamientos de perfiles
Los alineamientos de parejas
son computados con un método todos contra todos y las similitudes son guardadas
en una matriz. Esta es luego convertida en una matriz de distancias, donde la
longitud de la distancia refleja la distancia evolutiva entre cada par de
secuencias.
De esta matriz de
distancias, es creado un árbol de guía o filogenético utilizando un algoritmo de clustering neighbour-joining para
determinar el orden en que los pares de secuencias serán alineados y combinados
con alineamientos previos. Las secuencias son alineadas progresivamente en cada
punto de ramificación empezando por los pares de secuencias más cercanos.
ALINEAMIENTO
DE TODAS LAS SECUENCIAS
ÁRBOL
FILOGENÉTICO