SlideShare una empresa de Scribd logo
1 de 99
Laboratorio de BioSistemas
          del Departamento de Ingeniería Genética del CINVESTAV Unidad Irapuato




 Marcadores
 moleculares:
más allá de la             AAAAAAAAAAAAAAA
                           CCCCCCCCCCCCCCCCCC
reconstrucción             GGGGGGGGGGGGGGGG
 filogenética              TTTTTTTTTTTTTTTT




  Dra. Amanda Castillo Cobián
 Depto. de Ingeniería Genética
    CINVESTAV-Irapuato
             IPN
Objetivos
1) Dar a conocer los fundamentos teórico-prácticos de las técnicas más
comúnmente utilizadas en el estudio de evolución molecular.
Desde la selección de un buen marcador hasta la fechación molecular,
pasando por la reconstrucción filogenética como fundamento de todos
los estudios en biología evolutiva moderna.

2) Demostrar el tipo de preguntas que pueden resolverse mediante los
estudios de evolución molecular y el alcance que pueden tener.

3) Que los participantes adquieran un panorama general sobre los análisis
estadísticos y el software disponible para el análisis de datos moleculares.

4) Demostrar el impacto que los estudios evolutivos pueden tener en
trabajos aplicados y como han creado un puente de análisis para entender
los procesos macro y microevolutivos.
“ DNA: that registry of chance, that tone-deaf conservatory where
                             the noise is preserved with the music”

                                                   -Jaques Monod
                 Procesos estocásticos




                                       Procesos demográficos


         Historia
Análisis de datos moleculares

* Proteínas

*DNA

Puede cubrir varios aspectos como :

Estudios a nivel genética de poblaciones
(estructura de poblaciones naturales)

Estudios de selección natural
(Adaptación molecular)

Cálculos de tiempos de divergencia
(Relojes moleculares)
A partir de la teoría Darwin-Wallace:

              Se generaron dos campos de estudio:

            5) la historia evolutiva de los organismos

             7) elucidación de las fuerzas evolutivas
         que moldean la biodiversidad y sus adaptaciones




                  Wallace
Darwin
La representación de relaciones evolutivas…… es ancestral…...
Evolución = Cambio
"Evolution   is the idea that all existing animals and

plants are descended from some one ancestor many

 millions of years ago or at least a small number of

       ancestors many millions of years ago”

                John Maynard Smith
Darwin defined evolution as "descent with modification" and
the word 'descent' refers to the way evolutionary modification
takes place in a series of populations that are descended from
                          one another.
Fuerzas Evolutivas


Selección Natural

Mutación

Deriva Génica

Migración

Endogamia
Tasa
¿ Porqué es importante la reconstrucción de las relaciones

de ancestría-descendencia/ reconstruir la filogenia de los

                      organismos?
FILOGENIA

Hipótesis estadística de relaciones evolutivas




     Nos habla no sólo de las relaciones sino del proceso…..
Reconstrucción filogenética

Metodología que seguimos para estimar relaciones

evolutivas… Mirada al pasado…….
HOMOLOGÍA:
Relación entre dos especies que han descendido a partir
de un origen en común, comparten un mismo ancestro, divergencia
evolutiva.


ANALOGÍA:
Relación entre características comúnes, pero no a partir de un
ancestro común, no de origen, relación convergente.

Datos curiosos:

13)La homología no es una cantidad, se es o no homólogo, no hay tal
cosa como un porcentaje de homología.

2) Se dice que dos secuencias poseen un 95% de SIMILITUD!!!!!
o identidad.

3) Sólo podemos hacer reconstrucción filogenética con caracteres
homólogos!!!
Las relaciones entre los genes homólogos pueden ser del tipo:



•   Ortólogos – relacionados a un evento de especiación.

•   Parálogos – relacionados a un evento de duplicación génica.

•   Xenólogos – producto de un evento de transferencia horizontal.
Se pueden obtener distintos arboles filogenéticos donde las relaciones
descritas entre las especies sean: monofiléticas, polifiléticas o parafiléticas.
Monofilético




  Polifilético
Un árbol filogenético es un diagrama compuesto por nodos y ramas.


                                             nodo terminal
              nodo interno               A

                                         B
                                         C
                                         D
                                         E (OTU)


Enraizado              Rama



 Por lo tanto un árbol filogenético es una hipótesis de relaciones evolutivas.

 Posee dos componentes: tasa y tiempo (la que se acerca más a la
 descripción real de tiempo evolutivo)
Árbol de especies



Árboles de especies:
contiene un representativo
de cada especie, los nodos se refieren a eventos
de especiación.
Árboles de genes (genealogías): representan la
historia de un gen en particular, los nodos pueden
ser relacionados con eventos de especiación o
de duplicación génica.




Árbol de genes
* Los árboles se construyen en base a las similitudes
entre los distintos OTUs (Unidades taxonómicas).

* Estas diferencias o similitudes son cuantificadas con
diferentes métodos para generar la topología del árbol
basado en las distancias existentes en los organismos.

* En las filogenias moleculares la base de la comparación
son sustituciones en nucleótidos cuando se trata de DNA
o amino ácidos para las proteínas.
Ser o no ser un marcador molecular…….

Ese es el dilema…….

O mejor dicho…..


¿Qué es un marcador molecular?
Un marcador molecular es un indicador de la historia evolutiva,
es lo que vamos a analizar para poder dilucidar historia, así como,
diferentes procesos evolutivos.
Posee información genética y/o fenotípica y sobre todo estadística
acerca del proceso evolutivo.



    Marcadores moleculares utilizados para análisis filogenético:

    3) RFLP´S.

    5) Fingerprints genómicos (AFLP´s, RAPDS, SNP´s,).

    7) Análisis de enzimas multilocus.

    9) Secuencias DNA y proteínas.
Características ideales de un marcador molecular:

3) Suficiente información (estadísticamente hablando)
+/- de 500 pb

2) Que posea resolución (dependerá del nivel taxonómico)

3) Que nos relate la historia de la especie (ortólogos,
dependiendo del tipo de estudio).
Los marcadores moleculares, al ser marcadores del proceso evolutivo,

poseen restricciones de diversos tipos:

5) Sitios catalíticos (función)

7) Exones

9) Intrones

11) Secuencias reguladoras

13)Estructura

15)Posiciones

17)Pseudogenes

19)Diferencias en tasas de sustitución (cambio)
Un árbol filogenético es un diagrama compuesto por nodos y ramas.


                                             nodo terminal
              nodo interno               A

                                         B
                                         C
                                         D
                                         E (OTU)


Enraizado              Rama



 Por lo tanto un árbol filogenético es una hipótesis de relaciones evolutivas.

 Posee dos componentes: tasa y tiempo (la que se acerca más a la
 descripción real de tiempo evolutivo)
Topología con longitudes de ramas (aditiva)
                                                                                    54
                                                                                    53
                                                                                    55
                                                                                    75
                                                                  0.97              69
                                                                                0.9767
                                                                                    68
                                                                                 0.73
                                                                   0.96             72
                                                                                   0.98
                                                                                    73
                                                                                    74
                                                                         0.97       76
                                                                                    79
                                                                          0.97      86
                                                                                    84
                                                                                   0.98
                                                                           0.97
                                                                                0.5185
                                                                                    87
                                                                                  0.57
                                                                                    89
                                                                             0.97 0.99
                                                                                    90
                                                                                    91
                                                                                    92
                                                                                  0.97
   0.59                                                                             93
                                                                                    63
                                                                                   0.98
                                                                                    96
                                                                                    61
                                                                              0.97 60
                                                                               0.73 59
                                                                                0.9762
                                                                                    58
                                                                                  0.97
                                                                                    65
                                                                                   0.97
                                                                                    66
                                                                                    64
                                                                                   0.97
                                                                                    71
                                                                                    70
                                                                                    80
                                                                                0.8881
                                                                                    82
                                                                                    83
            0.96                                                                    32
                                                                                    34
                                                                                    19
                                                                                0.897
                                                                                 0.79
                                                                                    2
                                                                                  0.98
                                                                                    6
                                                           0.97              0.96 0.99
                                                                                    8
                                                                                    16
                                                                                  0.98
                                                                                    17
                                                                                    24
                                                                                    3
                                                             0.89                   5
                                                                                    11
                   0.65                                                   0.97      22
                                                                                    23
                                                                                    31
                                                         0.96                  0.96 33
                                                                     0.97       0.7328
                                                                                    29
                                                                                 0.97
                                                                                    27
                                                                                   0.92
                                                                                    30
                                                                                    14
                                                                                0.9838
                                                                                   0.98
                                                                                    39
                                                                                 0.98
                                                                                    40
                                                                                   0.98
                                                                                    41
                                                                                    4
                                                                                   0.99
                                                                                    15
                          0.94                                                      1
                                                                                    117
                                                                                    9
                                                                                   0.96
                                                                                0.91104
                                                                                    25

Clados
                                                                                  0.96
                                                                                    26
                                                                                   0.97
                                                                                    36
                                                                                    78
                                                                                 0.97
                                                                                    56
                                                                                  0.97
                                                                                    37
                                                                                   0.98

resueltos
                                                 0.77                               101
                                                                            0.56    52
                                                                                   0.96
                                                                                    94
                                 0.79                                               95
                                                                                  0.96
                                                                                    99
                                                                                   0.93
                                                                                    102
                                                      0.87                          116
                                                                                    118
                                                                                    114
                                                                                    115
                                                                               0.96 42
                                                               0.95                 44
                                                                                 0.95
                                                                                    110
                                                                                    111
                                              0.72                                  43
                                  0.73                                              46


                                                                                          politomía
                                                                0.69                47
                                                                                    49
                                                                           0.94     50
                                                                                    105
                                                                                    106
                                                                                    107
                                                                                    109
                                                                                    112
                                         0.51                                       45
                                                                                    48
                                                                                 0.96
                                                                                    108
                                                                                    113
                                                                                    57
                                                                                  0.93
                                                                                    100
                                                                                   0.97
                                                                                    103
                                       0.53                                         20
                                                                                    51
                                                                               0.86 88
                                                                                    98
                                                                                    18
                                                                                   0.66
                                                                                    77
                                                                                    10
                                                                                   0.98
                                                                                    21
                                                                                    12
                                                                                 0.86
                                                                                    35
                                                                                  0.94
                                                                                    13
                                                                                   0.98
                                                                                    97
La reconstrucción filogenética requiere de la estimación
  de las relaciones evolutivas, y dependiendo del método
  de reconstrucción se tendrá también la estimación de
  la diferencia o divergencia genética.

  Se estima:

  8) Topología

  10)Distancia genética


  Mediante el uso de    algoritmos o métodos de optimización.
                       (NJ/UPGMA)    (Parsimonia/Verosimilitud)

1) Los algoritmos hacen estimación de topología y distancia,
al mismo tiempo. Por lo mismo son muy rápidos.

2) Los métodos basados en un criterio de optimización, hacen
una separación y escogen en un espacio de óptimos los mejores,
para posteriormente describir el proceso evolutivo como un espacio
de probabilidades. Por lo mismo son computacionalmente intensivos
y lentos.
Pero, ¿cómo se determina la homología en los caracteres moleculares?


* Alineación de secuencias (aa ó nucleótidos)

-Cada sitio es un caracter con origen compartido (homólogo).

-Equivale a una característica morfológica.

-Estadísticamente es más robusto.

-Para mantener la correspondencia en
sitios homólogos es necesario la
introducción de ‘gaps’.

-Indeles

-Gaps e indeles NO se introducen de
manera aleatoria.

-No interrumpen el marco de
lectura y respetan estructura (loops)
Existen diversos programas que realizan alineaciones de secuencias:


 4) ClustalW (y sus variaciones)

 6) Muscle

 8) T-Coffe




Estos programas realizan una alineación global, es decir, fuerzan el
alineamiento de las secuencias en su longitud total.
Otros algoritmos de alineación:

3) FASTA

5) BLAST


Son programas de alineación local sólo buscan segmentos con
la puntuación más alta.
(por ejemplo, localizan dominios de proteínas)
A mayor distancia genética es mayor la acumulación de
mutaciones. Dependiendo del tiempo de acumulación de
estos cambios puede llegar a ser muy difícil o imposible
la alineación en algunas regiones de las secuencias.
(Saturación)

Las regiones que no son alineables o de homología dudosa
deben de ser excluidas de cualquier análisis filogenético,
pues meten ruido y generan hipótesis de relaciones falsas.
Para los métodos que utilizan un CO, es necesario el desarrollo de
un modelo de sustitución (nucleótidos, aa o codones).

Estos modelos son aproximaciones a los procesos naturales de sustitución
en el tiempo.

Debido a que los métodos con CO ajustan los datos observados a un
determinado modelo de sustitución y de acuerdo a esto modelan las
diferentes topologías y les brindan un soporte estadístico, es de suma
importancia la determinación del modelo de sustitución que más se ajuste
a los datos.

Los modelos de sustitución describen las probabilidades de cambio
ya sea de un nucleótido por otro (A-G, A-C), de un aa por otro Ala-Try,
de un codon por otro AGT-GGG, por ejemplo.
La reconstrucción filogenética requiere de estimaciones de:

3) Topología

5) Proceso evolutivo (requiere de un modelo de sustitución o cambio)

7) Estos modelos de sustitución nos describen las probabilidades en que
se dan las sustituciones.

4) Los métodos que determinan una distancia genética o usan un criterio
de optimización ocupan un modelo explícito de sustitución.

5) Los métodos de distancia estiman un parámetro (Número de sust. por sitio)

6) Los métodos con criterio de optimización estiman el valor de cada uno
de los parámetros del modelo dada una topología y un grupo de datos.

7) Es necesario usar una prueba estadística para seleccionar el modelo de
sustitución que posea un mayor ajuste a nuestros datos.
Modelos de sustitución

         C



  T      A      A

                         A <=> G
         G
                         T <=> C
Existen dos aproximaciones para la construcción de modelos
de sustitución:


5) Modelos empíricos = Calculados a partir de la comparación de
numerosas alineaciones y que resultan en valores fijos de los
parámetros de sustitución. Se utilizan principalmente para AA´s.
(Matrices Dayhoff, BLOSUM,etc)

2) Modelos paramétricos = Se basan en el modelado de ciertas
propiedades químicas (AA´s) o composicionales, inferidos a partir
de cada base de datos. Se utilizan principalmente para nucleótidos
y codones (Uso diferencial de codones).

Ambos resultan en modelos de procesos Markovianos, definidos por
matrices que contienen tasas relativas de ocurrencia de todos los
tipos de sustituciones.
Ambos métodos describen las tasas relativas, ocurrencia de todos
los tipos de cambio en el tiempo.

Se asume que esta matriz es reversible no existe dirección
en el tiempo evolutivo, árboles no enraizados, el proceso puede fluir
en ambas direcciones.

Las sustituciones se describen como resultado de un proceso de mutación
al azar, es decir, las mutaciones futuras ocurren al azar y son
independientes del estado anterior, dependen únicamente del estado actual
(proceso Markoviano).

La probabilidad de intercambio de un carácter (mutación) por otro
está modelada por una distribución de Poisson.
Se manejan tres tipos de parámetros en el modelado del
proceso de sustitución:

4) Frecuencia (proporción de cada nucleótido en la muestra)

6) Tasas de cambio (transiciones, transversiones,
uso de codones)

9) Heterogeneidad en tasas de sustitución (entre posiciones,
regiones codificantes VS no codificantes, etc)
(Distribución gamma)
Los diferentes modelos se distinguen por algunos factores básicos:

3) Frecuencias de nucleótidos

= Frecuencia ΠA= ΠG =ΠT= ΠC (JC69, K2P,K3P..)

≠ Frecuencia ΠA ≠ ΠG ≠ ΠT ≠ ΠC (F81, HKY85, Tr93, GTR…)


2) Tasas de transición VS. transversión

ti/tv ≠ 0.5 existe un sesgo en algún tipo de sustituciones

Generalmente las transiciones son mayores a las transversiones.
Los diversos modelos de sustitución se distinguen por su
parametrización:

4) Frecuencia nucleótidos
=o≠

2) Tasas de sustitución (ti/tv)

Tasa   1 Modelo Jukes-Cantor, 1969
Tasa   2 Modelo Kimura-2, F84
Tasa   3 Modelo TrN (2 ti, 1tv)
Tasa   6 Modelo GTR (cada sustitución su tasa)
Jukes-Cantor (JC) (Jukes-Cantor, 1969)


   Equal base frequencies, all substitutions are equally likely.




  Equal base frequencies



                                                      T C A G
Rate matrix                                       T fN a a a
                                                  C a fN a a
                                                  A a a fN a
                                                  G a a a fN
Jukes-Cantor (un parámetro)



                  α
    A                         G
                                  α
α                      α
                   α



    C                         T
                   α
Kimura 2-parameters (K80) (Kimura, 1980)


Equal base frequencies, variable transition and transversion frequencies.



   Equal base frequencies




    Rate matrix

                                                        T C A G
                                                    T fN a b b
                                                    C a fN b b
                                                    A b b fN a
                                                    G b b a fN
Kimura-dos parámetros



                 α
    A                       G

                        β       β
β
                  β



    C                       T
                  α
Felsenstein (F81) (Felsenstein, 1981)


   Variable base frequencies, all substitutions equally likely.




   Variable base frequencies




Rate matrix                                                T C A G
                                                       T fT a a a
                                                       C a fC a a
                                                       A a a fA a
                                                       G a a a fG
Hasegawa-Kishino-Yano (HKY85) (Hasegawa,Kishino,Yano, 1985)

 Variable base frequencies, variable transition and transversion frequencies.




    Variable base frequencies




   Rate matrix
                                                               T C A G
                                                           T fT a b b
                                                           C a fC b b
                                                           A b b fA a
                                                           G b b a fG
Tamura-Nei (TN93) (Tamura and Nei, 1993)


      Distinguish between two different types of transition (A<=>G)
      is different to (C <=> T), equal transversion frequencies.


       Variable base frequencies




Rate matrix                                                    T C A G
                                                           T fT a b b
                                                           C a fC b b
                                                           A b b fA c
                                                           G b b c fG
Kimura 3-parameter (K3P)


 Variable base frequencies, distinguish between two different types of
 transvesions (A<=>T) is different to (G <=>C), equal transition frequencies.


   Variable base frequencies



                             T C A G
                         T fN a b c
                         C a fN c b
                         A b c fN a
                         G c b a fN
General Time Reversible (GTR) (Tavaré, 1986)

 Variable base frequencies, symmetrical substituion matrix.


                                       General Time Reversible
    Variable base frequencies


                                   T C A G
    Rate matrix
                                T fT a b c        General Time Reversible
                                C a fC d e
                                A b d fA f
                                G c e f fG
Distribución gamma
Modela la heterogeneidad de tasas. Cada sitio posee una tasa tomada
aleatoriamente de esta distribución.
α controla la forma de la distribución, arriba de 1 es forma de campana,
lo que significa baja heterogeneidad en tasas, arriba de uno, parece una L
y refleja una gran heterogeneidad de tasas.
Modelos de substitución de codones
Durante la traducción se involucra el reconocimiento de tripletes o codones
que comprenden el Código Genético Universal, de los 64 codones sabemos
que tres de ellos son de término, por lo tanto tenemos 61 codones, lo que
supone que algunos aminoácidos serán codificados por más de un codón.

Debido a la degeneración del código genético, existen tasas de sustitución
diferenciales para los codones y por lo consiguiente para cada una de las
diferentes posiciones.

Existen sustituciones sinónimas (que no cambian el tipo de aa)
y no sinónimas que cambian el tipo de aa.       1a     2a    3a



                                               A T G
                                               dS     dN     dS
                                               dN            dN
1*     Segunda base                                        3*
Base   U              C           A            G           Base

       UUU            UCU         UAU          UGU         U
              Phe           Ser         Tyr          Cys
       UUC            UCC         UAC          UGC         C
U
       UUA            UCA         UAA          UGA Stop    A
              Leu           Ser         Stop
       UUG            UCG         UAG          UGG Trp     G

       CUU            CCU         CAU          CGU         U
              Leu           Pro         His          Arg
       CUC            CCC         CAC          CGC         C
C
       CUA            CCA         CAA          CGA         A
              Leu           Pro         Gln          Arg
       CUG            CCG         CAG          CGG         G

       AUU            ACU         AAU          AGU         U
              Ile           Thr         Asn          Ser
       AUC            ACC         AAC          AGC         C
A
       AUA Ile        ACA         AAA          AGA         A
                            Thr         Lys          Arg
       AUG Met ACG                AAG          AGG         G

       GUU            GCU         GAU          GGU         U
              Val           Ala         Asp          Gly
       GUC            GCC         GAC          GGC         C
G
       GUA            GCA         GAA          GGA         A
              Val           Ala         Glu          Gly
       GUG            GCG         GAG          GGG         G
Modelos de substitución de aminoácidos




 PAM matrices- Matriz que describe el cambio en tiempo evolutivo
 del 1% de los aminoácidos de una proteína.

 Dayhoff matrices – Se llevo a cabo utilizando 34 superfamilias conocidas
 de proteínas cercanas entre sí y sus tasas de mutación.

 BLOSSUM matrices – Utilizan comparaciones entre familias distantes
 de proteínas y sus valores de similitud.
* La reconstrucción filogenética es un proceso de estimación de la
topología y la longitud de las ramas.


* Los métodos de reconstrucción filogenética están basados en
dos estrategias diferentes:

8) Definición de un algoritmo que determina los pasos a seguir
para la reconstrucción de la topología. (Combinan la inferencia de la
topología con la mejor topología posible, esto los hace más rápidos)

2) Usando un criterio de optimización que permite decidir cuál de
las topologías se ajusta más a nuestros datos. (En este caso topología
y su soporte están desacoplados, son más lentos)
Existen varios métodos de reconstrucción filogenética:

               3)Distancia (Algoritmo)
            (sustituciones de caracteres)

                 2) Parsimonia (CO)
      (estados de carácter, sitios informativos)

            3) Máxima verosimilitud (CO)
           (distribución de probabilidades)

                 4) Bayesianos (CO)
Dentro de estos mismos métodos los más utilizados
históricamente han sido:

4)UPGMA (Parsimonia)

2) NJ (Vecino más cercano) (Distancia)

3) MP (Máxima Parsimonia) (Parsimonia)

4) ML (Máxima verosimilitud)

5)Bayesianos
Los métodos de distancia convierten primero la alineación en
una matriz de distancias.

Los más utilizados se basan en el criterio de mínima evolución
(UPGMA y NJ).

Se apoya el árbol/topología cuya longitud total minimice las
distancias entre los otus, a partir de una matriz de distancias
pareadas.
Distancias ultramétricas

Usualmente se ajustan a un árbol bajo el supuesto de reloj molecular.

Son equidistantes a la raíz del árbol.

Las distancias son aditivas.

Para un par de secuencias el valor en la matriz corresponde a la
suma de longitudes de ramas en el camino más corto que las une
(dentro del árbol).
En los métodos de evolución mínima se busca el árbol cuya
longitud de ramas sea mínima.
UPGMA (Unweighted pair-group method with arithmetic mean)



     (a)

               A                         A                            A

               B                         B                            B
                                         C                            C
                                                                      D


      dAB/2                   d(AB)C/2                    d(ABC)D/2



Tasas de cambio constantes, distancias aritméticas, escala las distancias,
reloj molecular, distancias equidistantes, árbol enraizado, topología enraizada
se obtiene las longitudes de rama simultáneamente a la topología.
Neighbor-joinig method (vecino más cercano)




            8
                                                                            8
     1              7
                                           1
                                                                                7


2           X               6                        X             Y                6


                                           2
    3                                                                           5
                        5
            4                                                           4
                                                                   3


    Se escoge el que da la mínima suma de las distancias entre las ramas, minimiza
    la longitud total del árbol, se obtiene un solo árbol,
Máxima Parsimonia (MP)



Busca el árbol que requiere el mínimo número de pasos evolutivos
(árbol más parsimonioso)

Utiliza el concepto de sitios informativos, todos los demás sitios no son
tomados en consideración para la reconstrucción de la topología.

Se apoya el árbol con mayor número de sitios informativos.

Para el caso de MP la situación se complica pues podemos reconstruir más
de un árbol igualmente parsimonioso.
1 2 3 4 5
                 1   A T A T T
                 2   A T C G T
                 3   G C A G T
                 4   G C C G T




Este proceso se repite para otros árboles…….
1   2   1   2



3   4   4   3
Unweighted Parsimony
Todas las sustituciones son iguales.


Weighted parsimony
Hace diferencias entre transiciones y transversiones.
Métodos de búsqueda de árboles óptimos:

3) Exactos .- Garantizan la obtención de un solo árbol.

e) Búsqueda exhaustiva
f) Búsqueda branch-bound

2) Heurísticos (aproximados). – Encontrar soluciones óptimas.

j) Stepwise addition (adición secuencial)
k) Branch swapping (intercambio de ramas)
l) Star decomposition (descomposición a manera de estrella)
Atracción de ramas largas

Se refiere a situaciones en las que linajes con una tasas de cambio

muy diferente al promedio, muestran relaciones con otros linajes

a pesar de no ser cierto.

Una estrategia para reducir el efecto es agregar más outgroups

a nuestra base de datos o secuencias que pudiesen romper estas

relaciones aparentes.
Métodos de Máxima verosimilitud (ML)




Requiere un modelo probabilístico de substitución de
nucleótidos, es decir, necesitamos especificar la probabilidad
de transición o cambio de un tipo de nucleótido a otro en un
intervalo de tiempo para cada rama.
Probabilidad de los datos dada una hipótesis

                               P ( D | H)


                           Hipótesis (H):
                         - árbol (topología)
                        - longitud de ramas
                    - parámetros del modelo de
                            substitución

                            Datos (D):
                    - secuencias de nucleótidos
                    - secuencias de aminoácidos

* Método paramétrico que utiliza explícitamente un modelo de sustitución.

* Utiliza la matriz original de los datos.

* CO para escoger entre árboles
i         j   k    l
     1         2   3   4
                             X- nucleótido del nodo ancestral

t3

          Z

     t2
               Y
                            La probabilidad de encontrar el nucleótido l en la
                            Secuencia 4:
          t1
                   X
                            Pxl (t1+t2+t3) (tiempo total de X a l, entre los dos nodos)

                            La probabilidad de encontrar el nucleótido Y en el nodo
                            Ancestral de las secs 1, 2, 3 es

                            Pxy (t1)

                            Y así sucesivamente……
Por lo tanto, la probabildiad de tener i, j, k, l en las puntas del árbol se calcula:


Pxl (t1+t2+t3) Pxy (t1) Pyk (t2+t3) Pyz 8t2) Pzi (t3) Pzj (t3)


Sólo podemos asumir probabilidades porque en la práctica no conocemos el
nucleótido ancestral real. Esta probabilidad se puede inferir a partir de la frecuencia
del nucleótido en la muestra real de las secuencias.

El cálculo de la función de verosimilitud para una secuencia se puede definir como:


    n
L = Π πni Prob (ni mi, t)               La verosimilitud para una secuencia de DNA
   i=1                                  con un número n de bases que posea la base mi
                                        en el sitio i y base ni en el mismo sitio de otra
                                        secuencia.
Validación estadística de las reconstrucciones filogenéticas




Existen numerosos métodos los más utilizados en la actualidad son:

3) Bootstrap
BOOTSTRAP
Método estadístico más utilizado.
Se basa en el remuestreo de las secuencias, es decir, aleatoriamente
cambia las posiciones de las bases y rehace la construcción filogenética.
La medida de soporte estadístico se refiere a un intervalo de confianza de
0 a 100.


Supongamos que tenemos la sig. Secuencias:

AGTCGGTAA
AGTGGGTAA
ATCTTGTAA

Si cambiamos la posición 7

TAGTCGGAA
TAGTGGGAA
TATCTTGAA
(esta es una submuestra de la distribución original)
Bootstrapping - an example
Ciliate SSUrDNA - parsimony bootstrap
                        Ochromonas (1)

                        Symbiodinium (2)
       100
                        Prorocentrum (3)

                        Euplotes (8)
             84
                        Tetrahymena (9)

 96                     Loxodes (4)
                  100
                        Tracheloraphis (5)
       100
                        Spirostomum (6)
                  100
                        Gruberia (7)
Inferencia Bayesiana
Teorema de Bayes

Población hipotética             1                   2

                                  60%               40%        Población total

Tipo de enfermedad                1%                0.01%



Muestreo al azar de 100 individuos (incluyendo grupo I y II)



¿Cuál es la probabilidad que 3 de ellos estén enfermos?
D (probabilidad) definida por:

P= P(D) = P(G1) * P(DI G1) +P(G2) * P(D IG2)

             0.6*0.01 +0.4*0.001= 0.0064

Probabilidad de que un individuo esté enfermo



1- 0.0064= La probabilidad de no estar enfermo.
Probabilidada de que 3 de cada 100 estén
enfermos:

P = 100! P3 (1-P)97 / 3!* 97! = 0.0227


BAYES

Lo realizamos de manera inversa

¿Cuál es la probabilidad de que un
individuo de la muestra al azar

que se encuentre enfermo pertenezca al
grupo I?
PI G1I D I= P(G1)* P(DI G1)/P(D)


     0.6*0.01/0.0064=0.94

  (Esta es la probabilidad de que
      pertenezca al grupo I)

D - datos – topología de un árbol
G1 – clase de sitio, probabilidad de transcición, etc)
- cadenas markovianas de Monte Carlo
- la probabilidad posterior de un árbol puede interpretarse como la
probabilidad de que dicho árbol o clado sea correcto

- es imposible estimar dicha pP analíticamente ni siquiera para el caso más
simple de 4 OTUs ( (2s - 3)!/2s - 2 (s - 2)! topologías y 2n-3 long. de rama,
para arb. no enraiz.)

- existen métodos numéricos que permiten aproximar la probabilidad
posterior de un árbol (o de cualquier otra hipótesis compleja). El más útil
es el de las cadenas markovianas de Monte Carlo (MCMC), implementado
en algoritmos como el de Metropolis-Hastings

- MCMC se basa en el muestreo de una distribución simulada en vez de
calcular dicha distribución mediante integración. Así es posible aproximar
el área bajo la curva que representa la distribución de densidad
probabilística posterior para inferencias complejas
Impacto de la reconstrucción filogenética:

3) Cálculo de tiempos de divergencia

5) Selección natural

7) Evolución de la patogénesis

9) Determinación de tasas de sustitución molecular

11)Criminología

Más contenido relacionado

Destacado

Marcadores moleculares De Stefano
Marcadores moleculares De StefanoMarcadores moleculares De Stefano
Marcadores moleculares De StefanoAMERICA CASTAÑEDA
 
Las Variaciones Genéticas
Las Variaciones Genéticas Las Variaciones Genéticas
Las Variaciones Genéticas luckangel
 
Las bases de la genética
Las bases de la genéticaLas bases de la genética
Las bases de la genéticaraquelbiolog
 
Trabajo colaborativo n.1 biotecnologia 1 grupo 2
Trabajo colaborativo n.1 biotecnologia 1  grupo 2Trabajo colaborativo n.1 biotecnologia 1  grupo 2
Trabajo colaborativo n.1 biotecnologia 1 grupo 2Adriana Jimena Perez Prieto
 
Bases de la genetica Puesta en Comun
Bases de la genetica Puesta en ComunBases de la genetica Puesta en Comun
Bases de la genetica Puesta en ComunPromoRoja
 
4° capítulo genética en caninos
4° capítulo   genética en caninos4° capítulo   genética en caninos
4° capítulo genética en caninosMaxi Barto
 
Variaciones geneticas
Variaciones geneticasVariaciones geneticas
Variaciones geneticasMaria Osuna
 
La herencia biologica
La herencia biologicaLa herencia biologica
La herencia biologicaGaia Solaris
 
01-05-La celula, Cambiando el paradigma
01-05-La celula, Cambiando el paradigma01-05-La celula, Cambiando el paradigma
01-05-La celula, Cambiando el paradigmaDr. Arturo O'Byrne
 
Proyecto Genoma Humano
Proyecto Genoma HumanoProyecto Genoma Humano
Proyecto Genoma Humanoguestf46ff8
 
ADN-DNA(ácido desoxirribonucleico)
ADN-DNA(ácido desoxirribonucleico)ADN-DNA(ácido desoxirribonucleico)
ADN-DNA(ácido desoxirribonucleico)vameru
 
El genoma humano
El genoma humanoEl genoma humano
El genoma humanoRaul Garza
 

Destacado (20)

Ud8
Ud8Ud8
Ud8
 
Proyecto Genoma
Proyecto GenomaProyecto Genoma
Proyecto Genoma
 
perros.grupos
perros.gruposperros.grupos
perros.grupos
 
Marcadores moleculares De Stefano
Marcadores moleculares De StefanoMarcadores moleculares De Stefano
Marcadores moleculares De Stefano
 
Las Variaciones Genéticas
Las Variaciones Genéticas Las Variaciones Genéticas
Las Variaciones Genéticas
 
Genetica canina
Genetica caninaGenetica canina
Genetica canina
 
A célula
A célula A célula
A célula
 
Las bases de la genética
Las bases de la genéticaLas bases de la genética
Las bases de la genética
 
Trabajo colaborativo n.1 biotecnologia 1 grupo 2
Trabajo colaborativo n.1 biotecnologia 1  grupo 2Trabajo colaborativo n.1 biotecnologia 1  grupo 2
Trabajo colaborativo n.1 biotecnologia 1 grupo 2
 
Bases de la genetica Puesta en Comun
Bases de la genetica Puesta en ComunBases de la genetica Puesta en Comun
Bases de la genetica Puesta en Comun
 
4° capítulo genética en caninos
4° capítulo   genética en caninos4° capítulo   genética en caninos
4° capítulo genética en caninos
 
Marcadores genéticos citogenetica
Marcadores genéticos citogeneticaMarcadores genéticos citogenetica
Marcadores genéticos citogenetica
 
Variaciones geneticas
Variaciones geneticasVariaciones geneticas
Variaciones geneticas
 
La herencia biologica
La herencia biologicaLa herencia biologica
La herencia biologica
 
Variacion genetica
Variacion geneticaVariacion genetica
Variacion genetica
 
Adn 1copi a
Adn 1copi aAdn 1copi a
Adn 1copi a
 
01-05-La celula, Cambiando el paradigma
01-05-La celula, Cambiando el paradigma01-05-La celula, Cambiando el paradigma
01-05-La celula, Cambiando el paradigma
 
Proyecto Genoma Humano
Proyecto Genoma HumanoProyecto Genoma Humano
Proyecto Genoma Humano
 
ADN-DNA(ácido desoxirribonucleico)
ADN-DNA(ácido desoxirribonucleico)ADN-DNA(ácido desoxirribonucleico)
ADN-DNA(ácido desoxirribonucleico)
 
El genoma humano
El genoma humanoEl genoma humano
El genoma humano
 

Último

PUNTOS CRANEOMÉTRICOS PARA PLANEACIÓN QUIRÚRGICA
PUNTOS CRANEOMÉTRICOS  PARA PLANEACIÓN QUIRÚRGICAPUNTOS CRANEOMÉTRICOS  PARA PLANEACIÓN QUIRÚRGICA
PUNTOS CRANEOMÉTRICOS PARA PLANEACIÓN QUIRÚRGICAVeronica Martínez Zerón
 
Mapa-conceptual-del-Sistema-Circulatorio-2.pptx
Mapa-conceptual-del-Sistema-Circulatorio-2.pptxMapa-conceptual-del-Sistema-Circulatorio-2.pptx
Mapa-conceptual-del-Sistema-Circulatorio-2.pptxJhonDarwinSnchezVsqu1
 
Hemorragia de tubo digestivo alto y bajo (1).pdf
Hemorragia de tubo digestivo alto y bajo (1).pdfHemorragia de tubo digestivo alto y bajo (1).pdf
Hemorragia de tubo digestivo alto y bajo (1).pdfELIZABETHTOVARZAPATA
 
redox y pilas temario 2 bachillerato ebau
redox y pilas temario 2 bachillerato ebauredox y pilas temario 2 bachillerato ebau
redox y pilas temario 2 bachillerato ebauAnaDomnguezMorales
 
Dia mundial de la seguridad y salud en el trabajo
Dia mundial de la seguridad y salud en el trabajoDia mundial de la seguridad y salud en el trabajo
Dia mundial de la seguridad y salud en el trabajoSegundoJuniorMatiasS
 
FISIOLOGIA BACTERIANA y mecanismos de acción (1).pptx
FISIOLOGIA BACTERIANA y mecanismos de acción (1).pptxFISIOLOGIA BACTERIANA y mecanismos de acción (1).pptx
FISIOLOGIA BACTERIANA y mecanismos de acción (1).pptxLoydaMamaniVargas
 
Relacion final de ingresantes 23.11.2020 (2).pdf
Relacion final de ingresantes 23.11.2020 (2).pdfRelacion final de ingresantes 23.11.2020 (2).pdf
Relacion final de ingresantes 23.11.2020 (2).pdfAlvaroLeiva18
 
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
(2024-25-04) Epilepsia, manejo el urgencias (doc).docxUDMAFyC SECTOR ZARAGOZA II
 
Clase 14 Articulacion del Codo y Muñeca 2024.pdf
Clase 14 Articulacion del Codo y Muñeca 2024.pdfClase 14 Articulacion del Codo y Muñeca 2024.pdf
Clase 14 Articulacion del Codo y Muñeca 2024.pdfgarrotamara01
 
Claves Obstétricas roja, azul y amarilla
Claves Obstétricas roja, azul y amarillaClaves Obstétricas roja, azul y amarilla
Claves Obstétricas roja, azul y amarillasarahimena4
 
LA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
LA HISTORIA CLÍNICA EN PEDIATRÍA.pptLA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
LA HISTORIA CLÍNICA EN PEDIATRÍA.pptSyayna
 
Torax normal-Oscar 2024- principios físicos del rx de torax
Torax normal-Oscar 2024- principios físicos del rx de toraxTorax normal-Oscar 2024- principios físicos del rx de torax
Torax normal-Oscar 2024- principios físicos del rx de toraxWillianEduardoMascar
 
Código Rojo MINSAL El salvador- ginecología
Código Rojo MINSAL El salvador- ginecologíaCódigo Rojo MINSAL El salvador- ginecología
Código Rojo MINSAL El salvador- ginecologíaMarceCerros1
 
Plan de Desparasitacion 27.03.2024 minsa.pptx
Plan de Desparasitacion 27.03.2024 minsa.pptxPlan de Desparasitacion 27.03.2024 minsa.pptx
Plan de Desparasitacion 27.03.2024 minsa.pptxOrlandoApazagomez1
 
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdfSe sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdfangela604239
 
Clase 13 Artrologia Cintura Escapular 2024.pdf
Clase 13 Artrologia Cintura Escapular 2024.pdfClase 13 Artrologia Cintura Escapular 2024.pdf
Clase 13 Artrologia Cintura Escapular 2024.pdfgarrotamara01
 
Colecistitis aguda-Medicina interna.pptx
Colecistitis aguda-Medicina interna.pptxColecistitis aguda-Medicina interna.pptx
Colecistitis aguda-Medicina interna.pptx Estefa RM9
 
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (doc).pdf
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (doc).pdf(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (doc).pdf
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (doc).pdfUDMAFyC SECTOR ZARAGOZA II
 
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdfClase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdfgarrotamara01
 

Último (20)

PUNTOS CRANEOMÉTRICOS PARA PLANEACIÓN QUIRÚRGICA
PUNTOS CRANEOMÉTRICOS  PARA PLANEACIÓN QUIRÚRGICAPUNTOS CRANEOMÉTRICOS  PARA PLANEACIÓN QUIRÚRGICA
PUNTOS CRANEOMÉTRICOS PARA PLANEACIÓN QUIRÚRGICA
 
Mapa-conceptual-del-Sistema-Circulatorio-2.pptx
Mapa-conceptual-del-Sistema-Circulatorio-2.pptxMapa-conceptual-del-Sistema-Circulatorio-2.pptx
Mapa-conceptual-del-Sistema-Circulatorio-2.pptx
 
Hemorragia de tubo digestivo alto y bajo (1).pdf
Hemorragia de tubo digestivo alto y bajo (1).pdfHemorragia de tubo digestivo alto y bajo (1).pdf
Hemorragia de tubo digestivo alto y bajo (1).pdf
 
redox y pilas temario 2 bachillerato ebau
redox y pilas temario 2 bachillerato ebauredox y pilas temario 2 bachillerato ebau
redox y pilas temario 2 bachillerato ebau
 
Dia mundial de la seguridad y salud en el trabajo
Dia mundial de la seguridad y salud en el trabajoDia mundial de la seguridad y salud en el trabajo
Dia mundial de la seguridad y salud en el trabajo
 
FISIOLOGIA BACTERIANA y mecanismos de acción (1).pptx
FISIOLOGIA BACTERIANA y mecanismos de acción (1).pptxFISIOLOGIA BACTERIANA y mecanismos de acción (1).pptx
FISIOLOGIA BACTERIANA y mecanismos de acción (1).pptx
 
Relacion final de ingresantes 23.11.2020 (2).pdf
Relacion final de ingresantes 23.11.2020 (2).pdfRelacion final de ingresantes 23.11.2020 (2).pdf
Relacion final de ingresantes 23.11.2020 (2).pdf
 
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
(2024-25-04) Epilepsia, manejo el urgencias (doc).docx
 
Clase 14 Articulacion del Codo y Muñeca 2024.pdf
Clase 14 Articulacion del Codo y Muñeca 2024.pdfClase 14 Articulacion del Codo y Muñeca 2024.pdf
Clase 14 Articulacion del Codo y Muñeca 2024.pdf
 
Claves Obstétricas roja, azul y amarilla
Claves Obstétricas roja, azul y amarillaClaves Obstétricas roja, azul y amarilla
Claves Obstétricas roja, azul y amarilla
 
LA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
LA HISTORIA CLÍNICA EN PEDIATRÍA.pptLA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
LA HISTORIA CLÍNICA EN PEDIATRÍA.ppt
 
Torax normal-Oscar 2024- principios físicos del rx de torax
Torax normal-Oscar 2024- principios físicos del rx de toraxTorax normal-Oscar 2024- principios físicos del rx de torax
Torax normal-Oscar 2024- principios físicos del rx de torax
 
Código Rojo MINSAL El salvador- ginecología
Código Rojo MINSAL El salvador- ginecologíaCódigo Rojo MINSAL El salvador- ginecología
Código Rojo MINSAL El salvador- ginecología
 
Plan de Desparasitacion 27.03.2024 minsa.pptx
Plan de Desparasitacion 27.03.2024 minsa.pptxPlan de Desparasitacion 27.03.2024 minsa.pptx
Plan de Desparasitacion 27.03.2024 minsa.pptx
 
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdfSe sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
Se sustituye manual tarifario 2023 Manual Tarifario 2024.pdf
 
Clase 13 Artrologia Cintura Escapular 2024.pdf
Clase 13 Artrologia Cintura Escapular 2024.pdfClase 13 Artrologia Cintura Escapular 2024.pdf
Clase 13 Artrologia Cintura Escapular 2024.pdf
 
Colecistitis aguda-Medicina interna.pptx
Colecistitis aguda-Medicina interna.pptxColecistitis aguda-Medicina interna.pptx
Colecistitis aguda-Medicina interna.pptx
 
(2024-04-17) ULCERADEMARTORELL (doc).pdf
(2024-04-17) ULCERADEMARTORELL (doc).pdf(2024-04-17) ULCERADEMARTORELL (doc).pdf
(2024-04-17) ULCERADEMARTORELL (doc).pdf
 
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (doc).pdf
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (doc).pdf(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (doc).pdf
(2024-04-17) PATOLOGIAVASCULARENEXTREMIDADINFERIOR (doc).pdf
 
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdfClase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
Clase 15 Artrologia mmii 1 de 3 (Cintura Pelvica y Cadera) 2024.pdf
 

Marcadoresmoleculares curso

  • 1. Laboratorio de BioSistemas del Departamento de Ingeniería Genética del CINVESTAV Unidad Irapuato Marcadores moleculares: más allá de la AAAAAAAAAAAAAAA CCCCCCCCCCCCCCCCCC reconstrucción GGGGGGGGGGGGGGGG filogenética TTTTTTTTTTTTTTTT Dra. Amanda Castillo Cobián Depto. de Ingeniería Genética CINVESTAV-Irapuato IPN
  • 2. Objetivos 1) Dar a conocer los fundamentos teórico-prácticos de las técnicas más comúnmente utilizadas en el estudio de evolución molecular. Desde la selección de un buen marcador hasta la fechación molecular, pasando por la reconstrucción filogenética como fundamento de todos los estudios en biología evolutiva moderna. 2) Demostrar el tipo de preguntas que pueden resolverse mediante los estudios de evolución molecular y el alcance que pueden tener. 3) Que los participantes adquieran un panorama general sobre los análisis estadísticos y el software disponible para el análisis de datos moleculares. 4) Demostrar el impacto que los estudios evolutivos pueden tener en trabajos aplicados y como han creado un puente de análisis para entender los procesos macro y microevolutivos.
  • 3. “ DNA: that registry of chance, that tone-deaf conservatory where the noise is preserved with the music” -Jaques Monod Procesos estocásticos Procesos demográficos Historia
  • 4. Análisis de datos moleculares * Proteínas *DNA Puede cubrir varios aspectos como : Estudios a nivel genética de poblaciones (estructura de poblaciones naturales) Estudios de selección natural (Adaptación molecular) Cálculos de tiempos de divergencia (Relojes moleculares)
  • 5. A partir de la teoría Darwin-Wallace: Se generaron dos campos de estudio: 5) la historia evolutiva de los organismos 7) elucidación de las fuerzas evolutivas que moldean la biodiversidad y sus adaptaciones Wallace Darwin
  • 6. La representación de relaciones evolutivas…… es ancestral…...
  • 7. Evolución = Cambio "Evolution is the idea that all existing animals and plants are descended from some one ancestor many millions of years ago or at least a small number of ancestors many millions of years ago” John Maynard Smith
  • 8. Darwin defined evolution as "descent with modification" and the word 'descent' refers to the way evolutionary modification takes place in a series of populations that are descended from one another.
  • 10. Tasa ¿ Porqué es importante la reconstrucción de las relaciones de ancestría-descendencia/ reconstruir la filogenia de los organismos?
  • 11. FILOGENIA Hipótesis estadística de relaciones evolutivas Nos habla no sólo de las relaciones sino del proceso…..
  • 12. Reconstrucción filogenética Metodología que seguimos para estimar relaciones evolutivas… Mirada al pasado…….
  • 13. HOMOLOGÍA: Relación entre dos especies que han descendido a partir de un origen en común, comparten un mismo ancestro, divergencia evolutiva. ANALOGÍA: Relación entre características comúnes, pero no a partir de un ancestro común, no de origen, relación convergente. Datos curiosos: 13)La homología no es una cantidad, se es o no homólogo, no hay tal cosa como un porcentaje de homología. 2) Se dice que dos secuencias poseen un 95% de SIMILITUD!!!!! o identidad. 3) Sólo podemos hacer reconstrucción filogenética con caracteres homólogos!!!
  • 14.
  • 15. Las relaciones entre los genes homólogos pueden ser del tipo: • Ortólogos – relacionados a un evento de especiación. • Parálogos – relacionados a un evento de duplicación génica. • Xenólogos – producto de un evento de transferencia horizontal.
  • 16.
  • 17. Se pueden obtener distintos arboles filogenéticos donde las relaciones descritas entre las especies sean: monofiléticas, polifiléticas o parafiléticas.
  • 19. Un árbol filogenético es un diagrama compuesto por nodos y ramas. nodo terminal nodo interno A B C D E (OTU) Enraizado Rama Por lo tanto un árbol filogenético es una hipótesis de relaciones evolutivas. Posee dos componentes: tasa y tiempo (la que se acerca más a la descripción real de tiempo evolutivo)
  • 20. Árbol de especies Árboles de especies: contiene un representativo de cada especie, los nodos se refieren a eventos de especiación.
  • 21. Árboles de genes (genealogías): representan la historia de un gen en particular, los nodos pueden ser relacionados con eventos de especiación o de duplicación génica. Árbol de genes
  • 22. * Los árboles se construyen en base a las similitudes entre los distintos OTUs (Unidades taxonómicas). * Estas diferencias o similitudes son cuantificadas con diferentes métodos para generar la topología del árbol basado en las distancias existentes en los organismos. * En las filogenias moleculares la base de la comparación son sustituciones en nucleótidos cuando se trata de DNA o amino ácidos para las proteínas.
  • 23. Ser o no ser un marcador molecular……. Ese es el dilema……. O mejor dicho….. ¿Qué es un marcador molecular?
  • 24. Un marcador molecular es un indicador de la historia evolutiva, es lo que vamos a analizar para poder dilucidar historia, así como, diferentes procesos evolutivos. Posee información genética y/o fenotípica y sobre todo estadística acerca del proceso evolutivo. Marcadores moleculares utilizados para análisis filogenético: 3) RFLP´S. 5) Fingerprints genómicos (AFLP´s, RAPDS, SNP´s,). 7) Análisis de enzimas multilocus. 9) Secuencias DNA y proteínas.
  • 25. Características ideales de un marcador molecular: 3) Suficiente información (estadísticamente hablando) +/- de 500 pb 2) Que posea resolución (dependerá del nivel taxonómico) 3) Que nos relate la historia de la especie (ortólogos, dependiendo del tipo de estudio).
  • 26. Los marcadores moleculares, al ser marcadores del proceso evolutivo, poseen restricciones de diversos tipos: 5) Sitios catalíticos (función) 7) Exones 9) Intrones 11) Secuencias reguladoras 13)Estructura 15)Posiciones 17)Pseudogenes 19)Diferencias en tasas de sustitución (cambio)
  • 27. Un árbol filogenético es un diagrama compuesto por nodos y ramas. nodo terminal nodo interno A B C D E (OTU) Enraizado Rama Por lo tanto un árbol filogenético es una hipótesis de relaciones evolutivas. Posee dos componentes: tasa y tiempo (la que se acerca más a la descripción real de tiempo evolutivo)
  • 28. Topología con longitudes de ramas (aditiva) 54 53 55 75 0.97 69 0.9767 68 0.73 0.96 72 0.98 73 74 0.97 76 79 0.97 86 84 0.98 0.97 0.5185 87 0.57 89 0.97 0.99 90 91 92 0.97 0.59 93 63 0.98 96 61 0.97 60 0.73 59 0.9762 58 0.97 65 0.97 66 64 0.97 71 70 80 0.8881 82 83 0.96 32 34 19 0.897 0.79 2 0.98 6 0.97 0.96 0.99 8 16 0.98 17 24 3 0.89 5 11 0.65 0.97 22 23 31 0.96 0.96 33 0.97 0.7328 29 0.97 27 0.92 30 14 0.9838 0.98 39 0.98 40 0.98 41 4 0.99 15 0.94 1 117 9 0.96 0.91104 25 Clados 0.96 26 0.97 36 78 0.97 56 0.97 37 0.98 resueltos 0.77 101 0.56 52 0.96 94 0.79 95 0.96 99 0.93 102 0.87 116 118 114 115 0.96 42 0.95 44 0.95 110 111 0.72 43 0.73 46 politomía 0.69 47 49 0.94 50 105 106 107 109 112 0.51 45 48 0.96 108 113 57 0.93 100 0.97 103 0.53 20 51 0.86 88 98 18 0.66 77 10 0.98 21 12 0.86 35 0.94 13 0.98 97
  • 29. La reconstrucción filogenética requiere de la estimación de las relaciones evolutivas, y dependiendo del método de reconstrucción se tendrá también la estimación de la diferencia o divergencia genética. Se estima: 8) Topología 10)Distancia genética Mediante el uso de algoritmos o métodos de optimización. (NJ/UPGMA) (Parsimonia/Verosimilitud) 1) Los algoritmos hacen estimación de topología y distancia, al mismo tiempo. Por lo mismo son muy rápidos. 2) Los métodos basados en un criterio de optimización, hacen una separación y escogen en un espacio de óptimos los mejores, para posteriormente describir el proceso evolutivo como un espacio de probabilidades. Por lo mismo son computacionalmente intensivos y lentos.
  • 30. Pero, ¿cómo se determina la homología en los caracteres moleculares? * Alineación de secuencias (aa ó nucleótidos) -Cada sitio es un caracter con origen compartido (homólogo). -Equivale a una característica morfológica. -Estadísticamente es más robusto. -Para mantener la correspondencia en sitios homólogos es necesario la introducción de ‘gaps’. -Indeles -Gaps e indeles NO se introducen de manera aleatoria. -No interrumpen el marco de lectura y respetan estructura (loops)
  • 31. Existen diversos programas que realizan alineaciones de secuencias: 4) ClustalW (y sus variaciones) 6) Muscle 8) T-Coffe Estos programas realizan una alineación global, es decir, fuerzan el alineamiento de las secuencias en su longitud total.
  • 32.
  • 33. Otros algoritmos de alineación: 3) FASTA 5) BLAST Son programas de alineación local sólo buscan segmentos con la puntuación más alta. (por ejemplo, localizan dominios de proteínas)
  • 34. A mayor distancia genética es mayor la acumulación de mutaciones. Dependiendo del tiempo de acumulación de estos cambios puede llegar a ser muy difícil o imposible la alineación en algunas regiones de las secuencias. (Saturación) Las regiones que no son alineables o de homología dudosa deben de ser excluidas de cualquier análisis filogenético, pues meten ruido y generan hipótesis de relaciones falsas.
  • 35. Para los métodos que utilizan un CO, es necesario el desarrollo de un modelo de sustitución (nucleótidos, aa o codones). Estos modelos son aproximaciones a los procesos naturales de sustitución en el tiempo. Debido a que los métodos con CO ajustan los datos observados a un determinado modelo de sustitución y de acuerdo a esto modelan las diferentes topologías y les brindan un soporte estadístico, es de suma importancia la determinación del modelo de sustitución que más se ajuste a los datos. Los modelos de sustitución describen las probabilidades de cambio ya sea de un nucleótido por otro (A-G, A-C), de un aa por otro Ala-Try, de un codon por otro AGT-GGG, por ejemplo.
  • 36. La reconstrucción filogenética requiere de estimaciones de: 3) Topología 5) Proceso evolutivo (requiere de un modelo de sustitución o cambio) 7) Estos modelos de sustitución nos describen las probabilidades en que se dan las sustituciones. 4) Los métodos que determinan una distancia genética o usan un criterio de optimización ocupan un modelo explícito de sustitución. 5) Los métodos de distancia estiman un parámetro (Número de sust. por sitio) 6) Los métodos con criterio de optimización estiman el valor de cada uno de los parámetros del modelo dada una topología y un grupo de datos. 7) Es necesario usar una prueba estadística para seleccionar el modelo de sustitución que posea un mayor ajuste a nuestros datos.
  • 37. Modelos de sustitución C T A A A <=> G G T <=> C
  • 38. Existen dos aproximaciones para la construcción de modelos de sustitución: 5) Modelos empíricos = Calculados a partir de la comparación de numerosas alineaciones y que resultan en valores fijos de los parámetros de sustitución. Se utilizan principalmente para AA´s. (Matrices Dayhoff, BLOSUM,etc) 2) Modelos paramétricos = Se basan en el modelado de ciertas propiedades químicas (AA´s) o composicionales, inferidos a partir de cada base de datos. Se utilizan principalmente para nucleótidos y codones (Uso diferencial de codones). Ambos resultan en modelos de procesos Markovianos, definidos por matrices que contienen tasas relativas de ocurrencia de todos los tipos de sustituciones.
  • 39. Ambos métodos describen las tasas relativas, ocurrencia de todos los tipos de cambio en el tiempo. Se asume que esta matriz es reversible no existe dirección en el tiempo evolutivo, árboles no enraizados, el proceso puede fluir en ambas direcciones. Las sustituciones se describen como resultado de un proceso de mutación al azar, es decir, las mutaciones futuras ocurren al azar y son independientes del estado anterior, dependen únicamente del estado actual (proceso Markoviano). La probabilidad de intercambio de un carácter (mutación) por otro está modelada por una distribución de Poisson.
  • 40. Se manejan tres tipos de parámetros en el modelado del proceso de sustitución: 4) Frecuencia (proporción de cada nucleótido en la muestra) 6) Tasas de cambio (transiciones, transversiones, uso de codones) 9) Heterogeneidad en tasas de sustitución (entre posiciones, regiones codificantes VS no codificantes, etc) (Distribución gamma)
  • 41. Los diferentes modelos se distinguen por algunos factores básicos: 3) Frecuencias de nucleótidos = Frecuencia ΠA= ΠG =ΠT= ΠC (JC69, K2P,K3P..) ≠ Frecuencia ΠA ≠ ΠG ≠ ΠT ≠ ΠC (F81, HKY85, Tr93, GTR…) 2) Tasas de transición VS. transversión ti/tv ≠ 0.5 existe un sesgo en algún tipo de sustituciones Generalmente las transiciones son mayores a las transversiones.
  • 42. Los diversos modelos de sustitución se distinguen por su parametrización: 4) Frecuencia nucleótidos =o≠ 2) Tasas de sustitución (ti/tv) Tasa 1 Modelo Jukes-Cantor, 1969 Tasa 2 Modelo Kimura-2, F84 Tasa 3 Modelo TrN (2 ti, 1tv) Tasa 6 Modelo GTR (cada sustitución su tasa)
  • 43. Jukes-Cantor (JC) (Jukes-Cantor, 1969) Equal base frequencies, all substitutions are equally likely. Equal base frequencies T C A G Rate matrix T fN a a a C a fN a a A a a fN a G a a a fN
  • 44. Jukes-Cantor (un parámetro) α A G α α α α C T α
  • 45. Kimura 2-parameters (K80) (Kimura, 1980) Equal base frequencies, variable transition and transversion frequencies. Equal base frequencies Rate matrix T C A G T fN a b b C a fN b b A b b fN a G b b a fN
  • 46. Kimura-dos parámetros α A G β β β β C T α
  • 47. Felsenstein (F81) (Felsenstein, 1981) Variable base frequencies, all substitutions equally likely. Variable base frequencies Rate matrix T C A G T fT a a a C a fC a a A a a fA a G a a a fG
  • 48. Hasegawa-Kishino-Yano (HKY85) (Hasegawa,Kishino,Yano, 1985) Variable base frequencies, variable transition and transversion frequencies. Variable base frequencies Rate matrix T C A G T fT a b b C a fC b b A b b fA a G b b a fG
  • 49. Tamura-Nei (TN93) (Tamura and Nei, 1993) Distinguish between two different types of transition (A<=>G) is different to (C <=> T), equal transversion frequencies. Variable base frequencies Rate matrix T C A G T fT a b b C a fC b b A b b fA c G b b c fG
  • 50. Kimura 3-parameter (K3P) Variable base frequencies, distinguish between two different types of transvesions (A<=>T) is different to (G <=>C), equal transition frequencies. Variable base frequencies T C A G T fN a b c C a fN c b A b c fN a G c b a fN
  • 51. General Time Reversible (GTR) (Tavaré, 1986) Variable base frequencies, symmetrical substituion matrix. General Time Reversible Variable base frequencies T C A G Rate matrix T fT a b c General Time Reversible C a fC d e A b d fA f G c e f fG
  • 52. Distribución gamma Modela la heterogeneidad de tasas. Cada sitio posee una tasa tomada aleatoriamente de esta distribución. α controla la forma de la distribución, arriba de 1 es forma de campana, lo que significa baja heterogeneidad en tasas, arriba de uno, parece una L y refleja una gran heterogeneidad de tasas.
  • 53. Modelos de substitución de codones Durante la traducción se involucra el reconocimiento de tripletes o codones que comprenden el Código Genético Universal, de los 64 codones sabemos que tres de ellos son de término, por lo tanto tenemos 61 codones, lo que supone que algunos aminoácidos serán codificados por más de un codón. Debido a la degeneración del código genético, existen tasas de sustitución diferenciales para los codones y por lo consiguiente para cada una de las diferentes posiciones. Existen sustituciones sinónimas (que no cambian el tipo de aa) y no sinónimas que cambian el tipo de aa. 1a 2a 3a A T G dS dN dS dN dN
  • 54. 1* Segunda base 3* Base U C A G Base UUU UCU UAU UGU U Phe Ser Tyr Cys UUC UCC UAC UGC C U UUA UCA UAA UGA Stop A Leu Ser Stop UUG UCG UAG UGG Trp G CUU CCU CAU CGU U Leu Pro His Arg CUC CCC CAC CGC C C CUA CCA CAA CGA A Leu Pro Gln Arg CUG CCG CAG CGG G AUU ACU AAU AGU U Ile Thr Asn Ser AUC ACC AAC AGC C A AUA Ile ACA AAA AGA A Thr Lys Arg AUG Met ACG AAG AGG G GUU GCU GAU GGU U Val Ala Asp Gly GUC GCC GAC GGC C G GUA GCA GAA GGA A Val Ala Glu Gly GUG GCG GAG GGG G
  • 55.
  • 56. Modelos de substitución de aminoácidos PAM matrices- Matriz que describe el cambio en tiempo evolutivo del 1% de los aminoácidos de una proteína. Dayhoff matrices – Se llevo a cabo utilizando 34 superfamilias conocidas de proteínas cercanas entre sí y sus tasas de mutación. BLOSSUM matrices – Utilizan comparaciones entre familias distantes de proteínas y sus valores de similitud.
  • 57. * La reconstrucción filogenética es un proceso de estimación de la topología y la longitud de las ramas. * Los métodos de reconstrucción filogenética están basados en dos estrategias diferentes: 8) Definición de un algoritmo que determina los pasos a seguir para la reconstrucción de la topología. (Combinan la inferencia de la topología con la mejor topología posible, esto los hace más rápidos) 2) Usando un criterio de optimización que permite decidir cuál de las topologías se ajusta más a nuestros datos. (En este caso topología y su soporte están desacoplados, son más lentos)
  • 58. Existen varios métodos de reconstrucción filogenética: 3)Distancia (Algoritmo) (sustituciones de caracteres) 2) Parsimonia (CO) (estados de carácter, sitios informativos) 3) Máxima verosimilitud (CO) (distribución de probabilidades) 4) Bayesianos (CO)
  • 59. Dentro de estos mismos métodos los más utilizados históricamente han sido: 4)UPGMA (Parsimonia) 2) NJ (Vecino más cercano) (Distancia) 3) MP (Máxima Parsimonia) (Parsimonia) 4) ML (Máxima verosimilitud) 5)Bayesianos
  • 60. Los métodos de distancia convierten primero la alineación en una matriz de distancias. Los más utilizados se basan en el criterio de mínima evolución (UPGMA y NJ). Se apoya el árbol/topología cuya longitud total minimice las distancias entre los otus, a partir de una matriz de distancias pareadas.
  • 61. Distancias ultramétricas Usualmente se ajustan a un árbol bajo el supuesto de reloj molecular. Son equidistantes a la raíz del árbol. Las distancias son aditivas. Para un par de secuencias el valor en la matriz corresponde a la suma de longitudes de ramas en el camino más corto que las une (dentro del árbol). En los métodos de evolución mínima se busca el árbol cuya longitud de ramas sea mínima.
  • 62. UPGMA (Unweighted pair-group method with arithmetic mean) (a) A A A B B B C C D dAB/2 d(AB)C/2 d(ABC)D/2 Tasas de cambio constantes, distancias aritméticas, escala las distancias, reloj molecular, distancias equidistantes, árbol enraizado, topología enraizada se obtiene las longitudes de rama simultáneamente a la topología.
  • 63. Neighbor-joinig method (vecino más cercano) 8 8 1 7 1 7 2 X 6 X Y 6 2 3 5 5 4 4 3 Se escoge el que da la mínima suma de las distancias entre las ramas, minimiza la longitud total del árbol, se obtiene un solo árbol,
  • 64. Máxima Parsimonia (MP) Busca el árbol que requiere el mínimo número de pasos evolutivos (árbol más parsimonioso) Utiliza el concepto de sitios informativos, todos los demás sitios no son tomados en consideración para la reconstrucción de la topología. Se apoya el árbol con mayor número de sitios informativos. Para el caso de MP la situación se complica pues podemos reconstruir más de un árbol igualmente parsimonioso.
  • 65. 1 2 3 4 5 1 A T A T T 2 A T C G T 3 G C A G T 4 G C C G T Este proceso se repite para otros árboles…….
  • 66. 1 2 1 2 3 4 4 3
  • 67. Unweighted Parsimony Todas las sustituciones son iguales. Weighted parsimony Hace diferencias entre transiciones y transversiones.
  • 68.
  • 69. Métodos de búsqueda de árboles óptimos: 3) Exactos .- Garantizan la obtención de un solo árbol. e) Búsqueda exhaustiva f) Búsqueda branch-bound 2) Heurísticos (aproximados). – Encontrar soluciones óptimas. j) Stepwise addition (adición secuencial) k) Branch swapping (intercambio de ramas) l) Star decomposition (descomposición a manera de estrella)
  • 70. Atracción de ramas largas Se refiere a situaciones en las que linajes con una tasas de cambio muy diferente al promedio, muestran relaciones con otros linajes a pesar de no ser cierto. Una estrategia para reducir el efecto es agregar más outgroups a nuestra base de datos o secuencias que pudiesen romper estas relaciones aparentes.
  • 71. Métodos de Máxima verosimilitud (ML) Requiere un modelo probabilístico de substitución de nucleótidos, es decir, necesitamos especificar la probabilidad de transición o cambio de un tipo de nucleótido a otro en un intervalo de tiempo para cada rama.
  • 72. Probabilidad de los datos dada una hipótesis P ( D | H) Hipótesis (H): - árbol (topología) - longitud de ramas - parámetros del modelo de substitución Datos (D): - secuencias de nucleótidos - secuencias de aminoácidos * Método paramétrico que utiliza explícitamente un modelo de sustitución. * Utiliza la matriz original de los datos. * CO para escoger entre árboles
  • 73. i j k l 1 2 3 4 X- nucleótido del nodo ancestral t3 Z t2 Y La probabilidad de encontrar el nucleótido l en la Secuencia 4: t1 X Pxl (t1+t2+t3) (tiempo total de X a l, entre los dos nodos) La probabilidad de encontrar el nucleótido Y en el nodo Ancestral de las secs 1, 2, 3 es Pxy (t1) Y así sucesivamente……
  • 74. Por lo tanto, la probabildiad de tener i, j, k, l en las puntas del árbol se calcula: Pxl (t1+t2+t3) Pxy (t1) Pyk (t2+t3) Pyz 8t2) Pzi (t3) Pzj (t3) Sólo podemos asumir probabilidades porque en la práctica no conocemos el nucleótido ancestral real. Esta probabilidad se puede inferir a partir de la frecuencia del nucleótido en la muestra real de las secuencias. El cálculo de la función de verosimilitud para una secuencia se puede definir como: n L = Π πni Prob (ni mi, t) La verosimilitud para una secuencia de DNA i=1 con un número n de bases que posea la base mi en el sitio i y base ni en el mismo sitio de otra secuencia.
  • 75.
  • 76.
  • 77.
  • 78.
  • 79. Validación estadística de las reconstrucciones filogenéticas Existen numerosos métodos los más utilizados en la actualidad son: 3) Bootstrap
  • 80. BOOTSTRAP Método estadístico más utilizado. Se basa en el remuestreo de las secuencias, es decir, aleatoriamente cambia las posiciones de las bases y rehace la construcción filogenética. La medida de soporte estadístico se refiere a un intervalo de confianza de 0 a 100. Supongamos que tenemos la sig. Secuencias: AGTCGGTAA AGTGGGTAA ATCTTGTAA Si cambiamos la posición 7 TAGTCGGAA TAGTGGGAA TATCTTGAA (esta es una submuestra de la distribución original)
  • 81.
  • 82. Bootstrapping - an example Ciliate SSUrDNA - parsimony bootstrap Ochromonas (1) Symbiodinium (2) 100 Prorocentrum (3) Euplotes (8) 84 Tetrahymena (9) 96 Loxodes (4) 100 Tracheloraphis (5) 100 Spirostomum (6) 100 Gruberia (7)
  • 84.
  • 85.
  • 86.
  • 87. Teorema de Bayes Población hipotética 1 2 60% 40% Población total Tipo de enfermedad 1% 0.01% Muestreo al azar de 100 individuos (incluyendo grupo I y II) ¿Cuál es la probabilidad que 3 de ellos estén enfermos?
  • 88. D (probabilidad) definida por: P= P(D) = P(G1) * P(DI G1) +P(G2) * P(D IG2) 0.6*0.01 +0.4*0.001= 0.0064 Probabilidad de que un individuo esté enfermo 1- 0.0064= La probabilidad de no estar enfermo.
  • 89. Probabilidada de que 3 de cada 100 estén enfermos: P = 100! P3 (1-P)97 / 3!* 97! = 0.0227 BAYES Lo realizamos de manera inversa ¿Cuál es la probabilidad de que un individuo de la muestra al azar que se encuentre enfermo pertenezca al grupo I?
  • 90. PI G1I D I= P(G1)* P(DI G1)/P(D) 0.6*0.01/0.0064=0.94 (Esta es la probabilidad de que pertenezca al grupo I) D - datos – topología de un árbol G1 – clase de sitio, probabilidad de transcición, etc)
  • 91.
  • 92. - cadenas markovianas de Monte Carlo - la probabilidad posterior de un árbol puede interpretarse como la probabilidad de que dicho árbol o clado sea correcto - es imposible estimar dicha pP analíticamente ni siquiera para el caso más simple de 4 OTUs ( (2s - 3)!/2s - 2 (s - 2)! topologías y 2n-3 long. de rama, para arb. no enraiz.) - existen métodos numéricos que permiten aproximar la probabilidad posterior de un árbol (o de cualquier otra hipótesis compleja). El más útil es el de las cadenas markovianas de Monte Carlo (MCMC), implementado en algoritmos como el de Metropolis-Hastings - MCMC se basa en el muestreo de una distribución simulada en vez de calcular dicha distribución mediante integración. Así es posible aproximar el área bajo la curva que representa la distribución de densidad probabilística posterior para inferencias complejas
  • 93.
  • 94.
  • 95.
  • 96.
  • 97.
  • 98.
  • 99. Impacto de la reconstrucción filogenética: 3) Cálculo de tiempos de divergencia 5) Selección natural 7) Evolución de la patogénesis 9) Determinación de tasas de sustitución molecular 11)Criminología

Notas del editor

  1. El problema del análisis de datos moleculares es distinguir el ruido de lo informativo, lo que guarda algún tipo de información, esto va a depender de las preguntas que queramos contestar y el plazo evolutivo.
  2. Todo esto en su conjunto nos da una descripción de los procesos evolutivos que moldearon la historia de los organismos.
  3. Se supone que debe de reflejar la historia completa, en la mayoría de los casos esperamos que las genealogías de genes reflejen la historia d ela especie. NO existe la filogenia verdadera, es una hipótesis siempre.
  4. Definiciones de homología y analogía. Se es o no homólogo, dejarlo bien claro. Es más adecuado decir identidad o similitud.
  5. Definir ortología, paralogía y xenología.
  6. Representaciones gráficas de las relaciones evolutivas.
  7. En general, cuando pensamos en la integración del registro fósil, la mayoría de las filogenias son parafiléticas.
  8. Ejemplo de relaciones
  9. No todos los arbolitos reflejan tiempo evolutivo, sólo los que son conformados por tasa y tiempo, los de upgma, por ejemplo no necesariamente una rama refleja tiempo evolutivo.
  10. La reconstrucción filogenética es la base de todos estos estudios, es una herramienta que nos permite abordar otro tipo de preguntas, no es un objetivo per se, sino una aproximación a los procesos evolutivos, es dinámica, de ahí la importancia de que se aproxime lo más posible a la realidad.
  11. Definición de marcador molecular
  12. Los marcadores moleculares, al ser marcadores del proceso evolutivo, poseen restricciones funcionales y diferencias en tasas de substitución, además de haber sido afectados por los proceso demográficos.
  13. No todos los arbolitos reflejan tiempo evolutivo, sólo los que son conformados por tasa y tiempo, los de upgma, por ejemplo no necesariamente una rama refleja tiempo evolutivo.
  14. Reconstrucción filogenética requiere de la estimación de las relaciones evolutivas y dependiendo del método de reconstrucción se ten drá también la estimación de la divergencia genética (todo como procesos estadístico)
  15. Alineación, sirve para determinar cuáles son los caracteres homólogos. De ahí que la alineaión es la base de todos los estudios de filogenética. Ya sea de aa o nucleótidos o codones.
  16. Poner el número de arbolitos posibles cada vez que se agrega un taxa, y como en el caso de los métodos de distancia esto no es tan importante pero para CO sí lo es.
  17. Distribución gamma- para acomodar la heterogeneidad de tasas en la alineación (vs. Sitios invariantes por ej.). Cada sitio tiene una tasa tomadad aleatoriamente e independiente de los demás sitios el parámetro alfa controla la forma de la distribución, alfas arriba de uno es de forma de campana, lo que quiere decir que hay baja heterogeneidad, mientras que debajo de uno es fuerte heterogeneidad. El objetivo de los modelos de suttitución es corregir para múltiples sustituciones.
  18. Ahondar un poco más en los modelos de codones.
  19. Poner como se calcula una matriz de distancias con una alineación chiquita.
  20. Explicar el fenómeno y cómo se puede solucionar al agregar más outgroups, por ejemplo.