El documento describe los diferentes tipos de alineamientos de secuencias utilizados en bioinformática, incluyendo alineamientos locales, globales y múltiples. Explica que un alineamiento compara secuencias de ADN, ARN o proteínas para identificar zonas de similitud que podrían indicar relaciones evolutivas. También enumera varios programas comunes y sus algoritmos correspondientes utilizados para diferentes tipos de alineamientos.
2. Alineamiento:
Un alineamiento de secuencias en bioinformática es una forma de representar y
comparar dos o más secuencias o cadenas de ADN, ARN, o estructuras primarias
proteicas para resaltar sus zonas de similitud, que podrían indicar relaciones
funcionales o evolutivas entre los genes o proteínas consultados. Las secuencias
alineadas se escriben con las letras (representando aminoácidos o nucleótidos) en
filas de una matriz en las que, si es necesario, se insertan espacios para que las
zonas con idéntica o similar estructura se alineen.
3. La manera de representar y comparar dos o más frecuencias o cadenas de ADN,
ARN, o estructuras primarias proteicas, que al compararlas resaltan sus zonas de
similitud, las cuales podrían indicar relaciones funcionales o evolutivos entre los
genes o proteínas.
EXISTEN TRES
TIPOS DE
ALINEAMIENTOS:
LOCAL
GLOBAL
MULTIPLE
4. Alineamiento Local:
Son las que se alinean en las zonas más parecidas. Las secuencias homologas se
parecen solo en las regiones mas conservadas.
Conservadas: grado de similitud entre los aminoácidos que ocupan una posición concreta
en la secuencia, como medida aproximada en una región particular o secuencia motivo,
entre linajes.
Linajes: los huecos introducidos en el tiempo transcurrido desde que divergen( mutaciones
de inserción o deleción).
5. Alineamiento Global:
Sirve para alinear secuencias que se empiecen y acaben en la misma región, por ejemplo
genes homólogos de especies similares.
Se intenta que el alineamiento cubra las dos secuencias completamente introduciendo los gaps
que sean necesarios.
Región: donde comienza una secuencia corta y conservada.
Gaps corresponde a una deleción o a una inserción.
6. Alineamiento Múltiple:
Es un alineamiento de más de dos secuencias. Como en el caso de los alineamientos por
parejas pueden ser ADN, ARN o proteína.
Las aplicaciones mas habituales son:
La reconstrucción filogenética.
El análisis estructural de proteínas.
La búsqueda de dominios conservados.
La búsqueda de regiones conservadas en promotores.
7. Programa. Algoritmo. Tipo de alineamiento. Cuando debe usarse.
Bioedit. Needleman-Wunsch global Manipulacion y analisis de
secuencias y enlaces a
programas de analisis
externos.
BLAST2Sequences. Smith-Waterman local Cuando quieres alinear 2
secuencias.
Blastn. Smith-Waterman local Comparar una secuencia de
nucleótidos contra una
secuencia de nucleótidos.
Blastp. Smith-Waterman local Comparar una secuencia de
aminoácidos contra una
secuencia de proteínas.
CrustalW genético múltiple Cuando se desean alinear
secuencias de ADN y
proteinas interactivamente
8. Programa. Algoritmo. Tipo de alineamiento. Cuando debe usarse.
Crustal Omega. Genético múltiple Cuando se desea generar
alineaciones entre 3 o mas
secuencias.
Crustal X. genético múltiple Realizar múltiples alineaciones
, ver los resultados del
proceso de alineación, y si es
necesario , mejorar la
alineación .
COBALT. genético múltiple Alineamiento múltiple de
secuencias de proteínas
EMBOSS Matcher. LALIGN (Bill Pearson). local Identificar similitudes locales
en dos secuencias de entrada.
EMBOSS Needle. Needleman-Wunsch global Identificar similitudes globales
en dos secuencias de entrada.
9. Programa. Algoritmo. Tipo de alineamiento. Cuando debe usarse.
EMBOSS Stretcher. Needleman-Wunsch global Calcular un alineamiento global de
dos secuencias, usando una
modificación del algoritmo de
programación que utiliza el espacio
lineal.
EMBOSS Water. Smith-Waterman local Para calcular la alineación local de
una secuencia a una u otras más
secuencias.
MEGA. genético múltiple. Para el análisis de ADN y secuencias
de proteínas de datos de especies y
poblaciones.
MUSCLE. genético múltiple Comparación de secuencias
múltiples por Log-expectation.
Puede alinear cientos de secuencias
en cuestión de segundos.
Needleman-Wunsch Global Align
Nucleotide or Protein Secuences
with BLAST
Needleman-Wunsch global En las secuencias que comparten
una similitud significativa sobre la
mayor parte de sus extensiones.
10. Programa. Algoritmo. Tipo de alineamiento. Cuando debe usarse.
T-Coffee
genético múltiple Permite cambiar en un
alineamiento múltiple, la
comparación de secuencias de
alineaciones locales y
globales.