ciencia y tegnologia acuativa para la conservacion

Laboratorio de Sistemática Filogenética
Rama de la biología evolutiva que se
encarga de estudiar las relaciones de
parentesco -evolutivo- entre las especies.
Hipótesis de homología (matriz alineada)
Caracteres homólogos (ADN, morfología, bioacústica, etc..)
El objetivo del laboratorio de sistemática filogenética es fortalecer el entendimiento de los procesos básicos
y técnicas para reconstruir hipótesis filogenéticas (árboles) a partir de caracteres moleculares.
H. Mauricio Ortega-Andrade | EVOLUCIÓN | 2019

Materiales y métodos |Práctica 1|
Revisión y edición de
secuencias (.ab1)
Alineamiento de
secuencias (.nex)
Modelo evolutivo de
sustitución de nucleótidos
Reconstrucción hipótesis
filogenética
Edición de árboles
http://www.geneious.com/
http://www.mbio.ncsu.edu/BioEdit/bioedit.html
http://phylemon.bioinfo.cipf.es/ev
olutionary.html
http://mrbayes.sourceforge.net/
http://jmodeltest.org/login http://www.robertlanfe
ar.com/partitionfinder/
https://www.phylo.org/portal2/login!input.action
https://code.google.com/arc
hive/p/garli/downloads
http://tree.bio.ed.ac.uk/software/figtree/

Práctica 1 | Alineación de secuencias
Secuencia “limpia”
Secuencia con “ruido”
Criterio Técnico

Espacios
Espacios artificiales sin
codificación
Espacios artificiales con codificación
(N)
Espacios identificados como nucleótidos
(G)
No modificar, pues no
hay mala lectura en la
secuencia
Modificar, pues hay mala lectura
en la secuencia
Modificar y editar (borrar) nucleótido
identificado erróneamente
Situación
Decisión

Single-nucleotide polymorphism (SNP)
Heterozigoto
Situación
Codificar
Decisión
Single-nucleotide polymorphism (SNP)
Heterozigoto.
Codificar

Pérdida de resolución por gel
Secuencia con ruido
Secuencia no legible

Secuencias consenso (contig)
Permite tomar decisiones sobre la validación de las lecturas de nucleótidos en las secuencias

http://www.geneious.com/
Práctica 1 | Edición de secuencias y consenso
Applied Biosystems' DNA Electropherogram File (.ab1)
 Carpeta “Secuencias”

1. Abrir Geneious y crear una carpeta llamada “Lab1”
2. Cargar las secuencias almacenadas en la carpeta “Secuencias” (GoogleDrive)
3. Visualizar independientemente las secuencias del especímen QCAZ19180 (Forward |SarL| y Reverse |SbrH)
4. Realizar un consenso (assembly/contig) con el par de secuencias.
5. Editarlas de acuerdo criterio técnico, en función del nucleótido identificado en cada posición de la secuencia.
6. Realizar la edición y consenso para todas las secuencias del ejercicio.
Práctica 1 | Edición de secuencias y consenso (30 minutos)
https://seqcore.brcf.med.umich.edu/sites/default/files/html/interpret.html

16S rRNA Secondary Structure
Loop
Tronco
Entre las regiones conservadas, el gen 16s RNA tiene alrededor
de 9 regiones hipervariables.
Para estudios de organismos cercanamente relacionados (a nivel
poblacional, p.ej.), las regions hipervariables son muy útiles para
diferenciar haplotipos.
16s RNA.
Para estudios filogenéticos a nivel de
especies, es preferible trabajar con las
regiones conservadas para construir
hípótesis de homología.

Práctica 1 | Alineamiento (30 minutos)
1. Con las secuencias consenso validadas, construya una matriz alineada (algoritmo Geniuous aligment)
2. Revise el resultado de la matriz alineada.
3. Editarla para que todas las secuencias formen una hipótesis de homología, es decir una matriz alineada.
4. Guarde una copia de la matriz alineada, con el nombre “16S_alineada”.
5. Cargue en Geneious la matriz llamada “16s_extraction.nex” de la carpeta “Matrices” y alinéala con la matriz
“16S_alineada”, y grábelo en un archivo nuevo, llamado “16S_sinHV” que significa, “16s sin hipervariables”.

Secuencias invertidas
Regiones hipervariables

Anotaciones en matrices: Excluir regiones hipervariables y extremos de las secuencias
1. Abra la matriz “16S_sinHV” en Mesquite.
2. Sobre este archivo, identifique, seleccione y anote como “Excluido” los extremos de las secuencies y las regiones
hipervariables.
3. De manera opcional, dependiendo del programa de análisis (BEAST, p. ej.), borre las áreas hipervariables.
Anotar caracteres seleccionados
desde el panel “Character List”

Práctica 1 | Matrices concatenadas de distintos genes (60 minutos)
Matrices concatenadas de varios genes
Master block
Archivo con los nombres
de todas las secuencias
a concatenar entre
genes
Matrices individuales
Matrices alineadas de
genes individuales (16s,
COI, RAG, etc)
Matriz concatenada
Matriz que concatena al
Master Block con las
matrices individuales
+ =

Práctica 1 | Matrices concatenadas de distintos genes (60 minutos)
1. New Project
2. New ->New Taxa Block -> Asigno el nombre “Master”, con
tres taxa asociados.
3. Incluir en el proyecto los archivos “16s.nex”, “COI.nex” y
“RAG.nex” que están en la carpeta “Matrices”.
MASTER BLOCK

1. Renombrar los Taxa Block y
Character Matrix de acuerdo a
cada gen.
2. En menú principal voy a “Taxa
& Trees” -> New Association ->
Selecciono Master ->
selecciono la matriz con el
mayor número de especies, p.
ej. 16s -> Asigno el nombre a la
asociación “Master&16s”
¿Cuál de las matrices individuales tiene el mayor número de secuencias?

1. Borro las tres primeras especies, si es que quedan vacías.
1. Selecciono todos los nombres de la lista de la derecha del menú
2. De los títulos de la columna 16s presiono “el triángulo negro invertido” en la columna 16s -> Create new taxa
in Master Block from Selected” -> aceptar.

1. En menú principal voy a “Taxa & Trees” -> New Association ->
Selecciono Master -> ahora selecciono la matriz con el segundo lugar
en número de especies, p. ej. COI -> Asigno el nombre a la asociación
“Master&COI”.
Matriz que concatena varios genes

2. Selecciono todos los nombres de la lista de la derecha del menú.
3. De los títulos de la columna COI presiono “el triángulo negro invertido” en la columna COI -> Auto assign
matches” / ignore White-spaces/ Ignore Cases / Matched if a number in both names are the same /
mínimum number of digits in number (5) -> aceptar.
OK!

Así debe verse el archivo master, con tres genes concatenados:
1. Ahora edito los nombres de las terminales o taxa en el Block del Master, desde el archivo Excel de la base
de datos con el siguiente formato: #Museo_Localidad_spp. Esto es necesario para estandarizar los
nombres entre las matrices (opcional).
2. Grabo el archivo como “MasterMatrixAssociated”, el cual contiene las asociaciones entre las bases de
datos y el Master.

Formato NEXUS de una matriz concatenada |Wordpad|
Encabezado
Especies grp. externo
Comando de “Fin de la matriz”
“Bug” en el archivo por defecto (borrarlo)
Detalles de las particiones del archivo
Instrucciones para MrBayes

Codificar en la matriz codones de Genes Codificantes
1. Cargar el archivo “MrBayes_concat.nex” y
renombrar el “Taxa block” y “carácter matrix”
como “MrBayes_codon”.
2. Matrix  Genetic Code Selecciono regiones de
los genes en la matriz.
3. Asigno nombres de genes a regiones (16s, COI,
RAG).

1. Selecciono la región de un gen codificante (p.ej. COI)
2. Codon position Set codón position Minimize Stop Codons Asigno nombres
de genes a regiones (16s, COI, RAG).
3. Realizar el mismo procedimiento con el gen codificante nuclear (RAG1) Codones identificados

1. Exportar la matriz como archivo NEXUS para MrBayes, con el nombre MrBayes_codón.nex
2. Note que ahora ya trae las posiciones de los genes y los codones.
3. Crear una carpeta que se llame “Matrices individuales” y Exportar la matriz MrBayes_codón.nex como
Particiones separadas en archivos NEXUS.
Matriz codificada para codones Matrices de genes individuales

¿Cuántas especies forman el grupo externo? ¿Cuántas terminales tiene la matriz?
¿Cuántos caracteres? ¿Cuántos genes codificantes?

Modelos Evolutivos de Sustitución de Nucleótdios

http://www.robertlanfe
ar.com/partitionfinder/
1. Cargar el archivo MrBayes_Codon en Mesquite

NOTA: Es necesario tener instalado el programa Python
1. COPIAR la carpeta “PartitionFinderV1.1.1_Windows” en el disco C:, y RENOMBRARLA como
“PartitionFinder”.
1) En la ruta C:PartitionFinderexamples crear una carpeta llamada “CLASE” y pegar los dos archivos .py,
que contiene la matriz y el .cfg, que contiene las especificaciones del análisis.

1. Abrir la consola de Windows, click derecho en símbolo
WINDOWS, “All Programs” -> “Accessories” -> “Command
Prompt”.
2. En la consola se debe describir tres comandos en la misma
línea ejecutable: “Python”, “la ruta donde está el archivos de
PartititionFinder.py”, la “carpeta” donde se encuentran los
archivos .phy y .cfg. Estos tres componentes deben estar en
la misma línea de comando de la consola, así:
a. Tipear “python“ seguido de un espacio.
b. Arrastrar a la consola el archivo “PartitionFinder.py”
(que está en la carpeta de descomprimido de
PartitionFinder). La ruta hacia ‘PartitionFinder.py’ se
cargará automáticamente a la consola.
c. Tipea otro espacio, y,
d. Arrastra a la consola la “carpeta” donde se encuentran
los archivos .phy y .cfg
1. Presiona Enter para ejecutar el análisis..

Línea ejecutable desde el programa Python27

Resultados de la selección de modelos evolutivos

Configuración archivo MrBayes |Particiones|
1. Exportar matriz codificada como codones, a un .nex / archivo MrBayes
Declaración de particiones
Particiones para MrBayes
Modelo sustitución nucleótidos

Configuración archivo MrBayes |modelo sustitución nucleótidos|
model name ratematrix = 'statefrequencies =
JC 1rate equal
F81 1rate estimate
K80 2rate equal
HKY 2rate estimate
TrNef (0 1 0 0 2 0) equal
TrN (0 1 0 0 2 0) estimate
K3P (= K81) (0 1 2 2 1 0) equal
K3Puf (= K81uf) (0 1 2 2 1 0) estimate
TIMef (0 1 2 2 3 0) equal
TIM (0 1 2 2 3 0) estimate
TVMef (0 1 2 3 1 4) equal
TVM (0 1 2 3 1 4) estimate
SYM 6rate equal
GTR 6rate estimate
Help Lset

Modelo sustitución nucleótidos
Best_scheme.txt
Ejemplo 2

Reconstrucción hipótesis filogenética
http://mrbayes.sourceforge.net/

1. Abro mrbayes_x64.exe
2. Escribo el comando “exe” y copio la ruta de acceso a la matriz configurada (arrastrar la ruta)
3. Enter

Crear una copia de la matriz MrBayes.nex -------a------ input.nex

Árbol filogenético
Árboles de búsqueda
Estimadores estadísticos
Registro del análisis

Effective sample size
(ESS>200)
Convergencia de las distribuciones estacionarias
Tracer software
Tamaño efectivo de muestreo
de corridas independientes no
correlacionadas,

Effective sample size
(ESS>200)
Convergencia de las distribuciones estacionarias
Tracer software
Tamaño efectivo de muestreo
de corridas no correlacionadas
independientes.
Tamaños menores a 200 en ESS,
significa alta correlación, por lo
que el muestreo no es
independiente (se marca en
rojo en Tracer).

Ejemplos de corridas no convergentes

Árbol filogenético (.tre)
Abrir con Wordpad
A
B
C
D
E
A
B
C
D
E
A
B
C
D
E
Newick ((((A B) C) D) E) (((A B) (C D))E) ((A B) ((C D) E))

http://tree.bio.ed.ac.uk/software/figtree/
Edición de árboles
FigTree
1. File  open 
archivo.con.tre
2. Modificar los tamaños de
letra.
3. Asignar la especie para la raíz
a la rama de
ClongirostrisKU177803
4. Asignar los valores de
probabilidades posteriores
(pp) a los nodos.
5. Expanda o contraiga el árbol
de acuerdo a su interés.

Ejercicio:
1. Utilice la barra de herramientas y el
panel de control para reproducir la
filogenia.
2. Exporte en formato .pdf y .jpg

ciencia y tegnologia acuativa para la conservacion

Recomendados

Recomendados

Más contenido relacionado

Similar a ciencia y tegnologia acuativa para la conservacion

Similar a ciencia y tegnologia acuativa para la conservacion (20)

Más de VinkeGopSalazar

Más de VinkeGopSalazar (11)

Último

Último (20)

ciencia y tegnologia acuativa para la conservacion