SlideShare una empresa de Scribd logo
1 de 34
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto Miguel Lillo, Universidad Nacional de Tucumán, Tucumán
Biogeografía histórica Distribución geográfica en un contexto filogenético Brundin, 1972
Biogeografía histórica Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía. Optimación de caracteres, bien sea usando parsimonia de Fitch o similares a Sankoff, o mapeo estocástico usando likelihood.
Biogeografía histórica Áreas predefinidas: Definidas arbitrariamente, nunca se contrastan Ignoran la naturaleza espacial de los datos No permiten escalas detalladas Solo son viables con pocos “caracteres” (áreas) Susceptibles a problemas que no son propios de la biogeografía (v.g. especies ampliamente distribuídas) Nylander et al. 2008
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones
Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones Distribución de un nodo es la suma de sus descendientes
Distribuciones
Distribuciones Puntos georeferenciados
1. Para cada terminal  t 2. Para todas las celdas  (i,j) 3. D t  (i,j)   ←  0,  4. Para cada registro  r  en  t 5. D t  (i,j)   ←  1 para la celda  (x,y)  asignada al registro  r 6. Para cada  V k  de  (x,y) ,  D t  (v1,v2)   ←  1 7. Fin-para 2 8. Fin-para 1 ∎ Relleno de “imagen digital”
Relleno de “imagen digital”
Distribuciones Rellenado de la distribución
Distribuciones Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas. Un poco más de 70 terminales, eso es más de 140 nodos: 360x120x140 celdas. Más de 6'000.000 de celdas, en su mayor parte vacías!
Quad-árboles Construir Q (i1, i2, j1, j2, anc) 1. Si (D|i1, i2, j1, j2| = 0) retornar NULO 2. Q -> ancestro  ←  anc 3. Asignar coordenadas del cuadrante a Q 4. Si ((i1 = i2) y (j1=j2))  Q -> esCelda?  ←  verdadero retornar Q 5. x  ←  i1 + ((i2 – i1) / 2), y  ←  j1 + ((j2 – j1) / 2) Q -> esCelda?  ←  falso 6. Q -> NW  ←  Construir Q (i1, x, j1, y, Q) Q -> NE  ←  Construir Q (x, i2, j1, y, Q) Q -> SW  ←  Construir Q (i1, x, y, j2, Q) Q -> NW  ←  Construir  Q (x, i2, y, j2, Q) 7. Retornar Q ∎
Quad-árboles
Criterio de optimalidad
Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos vicariantes. El criterio optimo es entonces: (i) minimizar nodos no vicariantes (ii) minimizar eliminación de nodos Criterio de optimalidad
Criterio de optimalidad Sea un nodo- j  un nodo en donde todos sus descendientes menos uno tienen una eliminación de distribucion (Page, 1994; Arias et al. 2008). Cualquier otro node es vicariante o no vicariante.
Sea  C n  el costo de la reconstrucción del nodo  n , y  desc (n)  es la lista de descendientes de  n . C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n Criterio de optimalidad
Criterio de optimalidad C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n Donde  Y n Y n  = costo de una eliminación, si la distribución de  n  es eliminada, De lo contrario,  Y n  = 0
C n  =  (  ∑ i = desc(n)   C i  ) +  Y n  +  X n y  X n X n  = 0, si  n  es un nodo- j , X n  = 0, si  n  es un nodo vicariante, X n  = costo de un nodo no vicariante, si n es no vicariante. Criterio de optimalidad
Esta operación permite conocer el costo del árbol para una reconstrucción dada. El peso de la búsqueda esta en la optimación del árbol: cada reconstrucción propuesta, requiere una optimación. Optimación
Optimar (nodo  n ) 1. Si ( n  es eliminado) C n   ←  costo_eliminación Sino C n   ←  0 2. Si  n  es terminal, retornar  C n 3. Para cada  i  que sea  desc(n) C n   ←   C n  + Optimar ( i ) 5. Si  n  es no vicariante C n   ←   C n  + Costo_no_vic 6. Retornar  C n ∎ Optimación ingenua
Optimación ingenua Requiere visitar todos los nodos del árbol. Su estructura revela la posibilidad de una optimación más adecuada: el costo de de un nodo depende solo de sus nodos descendientes, por lo tanto, si se parte de una reconstrucción, es posible únicamente optimar los nodos ancestrales al nodo modificado.
Optimar (nodo  n ) 1. Minetras n dif NULL 2. Si ( n  es eliminado) C n   ←  costo_eliminación Sino C n   ←  0 2. Si  n  es terminal,  n   ←   anc (n) , volver a 1 3. Para cada  i  que sea  desc(n) C n   ←   C n  +  C i 4. Si  n  es no vicariante C n   ←   C n  + Costo_no_vic 5. n   ←   anc (n) 6. Fin-Mientras ∎ Optimación incremental
Optimación incremental Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol. En promedio el número de visitas es el número de nodos entre el terminal más alejado de la raíz y la raíz.
Búsquedas heurísticas Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisimas posibilidades. Búsquedas heurísticas no garantizan encontrar el óptimo, pero permiten atacar problemas mucho mayores.
“ Subida de colina” simple 1. Min  ←  C t 2. Para cada nodo  n  en el árbol  t 3. Eliminar  n Optimizar  t 4. Si ( C t  < Min ) volver a 1. 5. Restaurar  n Optimizar  t 6. Fin para-2. ∎
“ Subida de colina” simple Rápida, independiente del punto de partida. En el peor caso revisa todos los nodos, 2n optimiaciones. Es poco efectiva en árboles grandes, las primeras eliminaciones pueden ser poco óptimas.
Heurística de Page 1.  Prev  ←  C t 2. Min  ←  C t Pos   ←  NULL 3. Para cada nodo  n  en el árbol  t 4. Eliminar  n , Optimizar  t 5. Si ( C t  < Min ) Min  ←  C t Pos  ←  n 6. Restaurar  n , Optimizar  t 7. Fin para-3. 8. Si ( Min < Prev ) Eliminar  n , Optimizar  t volver a 2. ∎
Más exhaustiva que la subida simple. En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones. Si no hay empates, siempre realiza la misma secuencia. Heurística de Page
Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto estará disponible de manera gratuita en internet. Este es el primer programa de biogeografía que utiliza filogenias y datos geográficos simultáneamente Implementación
Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas. En cambio, hay muchas posibilidades para mejorar las heurísticas: búsquedas limitando los nodos a optimar, muestreos basados en cristalización simulada, o fusión de soluciones. Perspectivas
Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314). P. Hovenkamp ha mostrado un gran interés y retroalimentación al proyecto. C.A. Szumik, P.A. Goloboff, D. Casagranda, S. Catalono y M. Mirande han proporcionado ideas, discusión y apoyo. Agradecimientos

Más contenido relacionado

La actualidad más candente

Fauna Ecuatoriana y su taxonomía de peces e imágenes
Fauna Ecuatoriana y su taxonomía de peces e  imágenes Fauna Ecuatoriana y su taxonomía de peces e  imágenes
Fauna Ecuatoriana y su taxonomía de peces e imágenes MarcelaHerrera123456
 
Valencia Ecológica
Valencia Ecológica Valencia Ecológica
Valencia Ecológica DayanaTaques
 
Peces óseos del Ecuador
Peces óseos del EcuadorPeces óseos del Ecuador
Peces óseos del EcuadorKarem Michelle
 
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador Tania Vásquez
 
Metodos de captura de peces
Metodos de captura de pecesMetodos de captura de peces
Metodos de captura de pecesJhossePaul
 
Biodiversidad
BiodiversidadBiodiversidad
Biodiversidadllica
 
Consumo de peces en quito
Consumo de peces en quitoConsumo de peces en quito
Consumo de peces en quitoGuadalupeSaltos
 
Metodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuadorMetodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuadorKarlaLlumiquinga
 
UCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy Proano
UCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy ProanoUCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy Proano
UCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy ProanoFrEdDy Proaño
 
Peces del Parque Nacional Machalilla, Sangay y del Refugio de Vida Silvestre ...
Peces del Parque Nacional Machalilla, Sangay y del Refugio de Vida Silvestre ...Peces del Parque Nacional Machalilla, Sangay y del Refugio de Vida Silvestre ...
Peces del Parque Nacional Machalilla, Sangay y del Refugio de Vida Silvestre ...nickyale1996
 
Pisos zoogeográficos
Pisos zoogeográficosPisos zoogeográficos
Pisos zoogeográficosSandra Ruiz
 
Los Ecosistemas Ecuatorianos
Los Ecosistemas EcuatorianosLos Ecosistemas Ecuatorianos
Los Ecosistemas EcuatorianosAnÐrea Älcivar
 
Ppt 1 variabilidad, adaptacion y evolucion
Ppt 1 variabilidad, adaptacion y evolucionPpt 1 variabilidad, adaptacion y evolucion
Ppt 1 variabilidad, adaptacion y evolucionGonzalo Flores Morales
 
Bosque deciduo de la costa y Bosque húmedo tropical del Chocó
Bosque deciduo de la costa y Bosque húmedo tropical del Chocó Bosque deciduo de la costa y Bosque húmedo tropical del Chocó
Bosque deciduo de la costa y Bosque húmedo tropical del Chocó guicelaFalcon
 
Piso Alto andino del Ecuador
Piso Alto andino del EcuadorPiso Alto andino del Ecuador
Piso Alto andino del Ecuadorpandresaguaguina
 
Peces cartilaginosos
Peces cartilaginososPeces cartilaginosos
Peces cartilaginososSandra Ruiz
 
Piso tropical nor occidental por Jessica Quinchiguango
Piso tropical nor occidental por Jessica QuinchiguangoPiso tropical nor occidental por Jessica Quinchiguango
Piso tropical nor occidental por Jessica Quinchiguangojessicaquinchiguango
 

La actualidad más candente (20)

Fauna Ecuatoriana y su taxonomía de peces e imágenes
Fauna Ecuatoriana y su taxonomía de peces e  imágenes Fauna Ecuatoriana y su taxonomía de peces e  imágenes
Fauna Ecuatoriana y su taxonomía de peces e imágenes
 
Valencia Ecológica
Valencia Ecológica Valencia Ecológica
Valencia Ecológica
 
Peces óseos del Ecuador
Peces óseos del EcuadorPeces óseos del Ecuador
Peces óseos del Ecuador
 
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
Métodos de trabajo de campo y laboratorio de peces óseos del Ecuador
 
Metodos de captura de peces
Metodos de captura de pecesMetodos de captura de peces
Metodos de captura de peces
 
Biodiversidad
BiodiversidadBiodiversidad
Biodiversidad
 
Consumo de peces en quito
Consumo de peces en quitoConsumo de peces en quito
Consumo de peces en quito
 
Metodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuadorMetodos de trabajo en campo para aves del ecuador
Metodos de trabajo en campo para aves del ecuador
 
UCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy Proano
UCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy ProanoUCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy Proano
UCE Carrera de Biologia Y Quimica Pisos zoograficos del ecuador Freddy Proano
 
Peces del Parque Nacional Machalilla, Sangay y del Refugio de Vida Silvestre ...
Peces del Parque Nacional Machalilla, Sangay y del Refugio de Vida Silvestre ...Peces del Parque Nacional Machalilla, Sangay y del Refugio de Vida Silvestre ...
Peces del Parque Nacional Machalilla, Sangay y del Refugio de Vida Silvestre ...
 
Peces en ecuador
Peces en ecuadorPeces en ecuador
Peces en ecuador
 
Pisos zoogeográficos
Pisos zoogeográficosPisos zoogeográficos
Pisos zoogeográficos
 
Los Ecosistemas Ecuatorianos
Los Ecosistemas EcuatorianosLos Ecosistemas Ecuatorianos
Los Ecosistemas Ecuatorianos
 
Ppt 1 variabilidad, adaptacion y evolucion
Ppt 1 variabilidad, adaptacion y evolucionPpt 1 variabilidad, adaptacion y evolucion
Ppt 1 variabilidad, adaptacion y evolucion
 
Bosque deciduo de la costa y Bosque húmedo tropical del Chocó
Bosque deciduo de la costa y Bosque húmedo tropical del Chocó Bosque deciduo de la costa y Bosque húmedo tropical del Chocó
Bosque deciduo de la costa y Bosque húmedo tropical del Chocó
 
Piso Alto andino del Ecuador
Piso Alto andino del EcuadorPiso Alto andino del Ecuador
Piso Alto andino del Ecuador
 
Diversidad Alfa
Diversidad AlfaDiversidad Alfa
Diversidad Alfa
 
Concha de abanico
Concha de abanicoConcha de abanico
Concha de abanico
 
Peces cartilaginosos
Peces cartilaginososPeces cartilaginosos
Peces cartilaginosos
 
Piso tropical nor occidental por Jessica Quinchiguango
Piso tropical nor occidental por Jessica QuinchiguangoPiso tropical nor occidental por Jessica Quinchiguango
Piso tropical nor occidental por Jessica Quinchiguango
 

Destacado

BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier CucaitaBIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier CucaitaJavier Alexander Cucaita Moreno
 
Síntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - ResumenSíntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - ResumenAndres Prieto Pineda
 
1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolle1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolleOscar Garcia Montesinos
 
Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1marianax3
 

Destacado (6)

Biogeografía
BiogeografíaBiogeografía
Biogeografía
 
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier CucaitaBIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
BIOGEOGRAFÍA: FACTORES Y EXPONENTES. Lic Javier Cucaita
 
Síntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - ResumenSíntesis histórica de la biogeografía - Resumen
Síntesis histórica de la biogeografía - Resumen
 
1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolle1 historia biogeografía clasico linneo de candolle
1 historia biogeografía clasico linneo de candolle
 
Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1Biogeografia histórica e ecológica1 1
Biogeografia histórica e ecológica1 1
 
Biogeografia aula 1
Biogeografia   aula 1Biogeografia   aula 1
Biogeografia aula 1
 

Similar a Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional

Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...jfrchicanog
 
Algoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodalesAlgoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodalesDaniel Molina Cabrera
 
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdfS13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdfEddyBerlyFloresMejia
 
Optimizacion Univariada
Optimizacion UnivariadaOptimizacion Univariada
Optimizacion Univariadamuanjaba
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4jcbenitezp
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4jcbenitezp
 
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadasSandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadasolimpica
 
Clase io3
Clase io3Clase io3
Clase io3clavelm
 
1157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 20051157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 2005Gonzalo Gatica
 
Clustering.ppt
Clustering.pptClustering.ppt
Clustering.pptnicoals2
 
Sistemas ecuaciones no lineales
Sistemas ecuaciones no linealesSistemas ecuaciones no lineales
Sistemas ecuaciones no linealesAndres Milquez
 
Soluciones por series
Soluciones por seriesSoluciones por series
Soluciones por seriesKike Prieto
 
Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1Velmuz Buzz
 

Similar a Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional (20)

Optimización. Métodos numéricos
Optimización. Métodos numéricosOptimización. Métodos numéricos
Optimización. Métodos numéricos
 
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
Descomposición en Landscapes Elementales del Problema de Diseño de Redes de R...
 
Algoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodalesAlgoritmo NVMO para problemas multimodales
Algoritmo NVMO para problemas multimodales
 
Sistemas Difusos
Sistemas DifusosSistemas Difusos
Sistemas Difusos
 
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdfS13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
S13 - Procesamiento digital de imágenes y visión artificial.pptx-1.pdf
 
Optimizacion Univariada
Optimizacion UnivariadaOptimizacion Univariada
Optimizacion Univariada
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4
 
Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4Pds 2011 2-balotario de preguntas pc4
Pds 2011 2-balotario de preguntas pc4
 
Paralela4
Paralela4Paralela4
Paralela4
 
Paralela6
Paralela6Paralela6
Paralela6
 
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadasSandoya fernando métodos exactos y heurísticos para el vrp jornadas
Sandoya fernando métodos exactos y heurísticos para el vrp jornadas
 
Clase io3
Clase io3Clase io3
Clase io3
 
Metodo Simplex
Metodo SimplexMetodo Simplex
Metodo Simplex
 
1157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 20051157834458 pauta i1 optimiz 1 2005
1157834458 pauta i1 optimiz 1 2005
 
Complejidad de Algoritmos
Complejidad de AlgoritmosComplejidad de Algoritmos
Complejidad de Algoritmos
 
Clustering.ppt
Clustering.pptClustering.ppt
Clustering.ppt
 
Sistemas ecuaciones no lineales
Sistemas ecuaciones no linealesSistemas ecuaciones no lineales
Sistemas ecuaciones no lineales
 
2014 iii 07 cocientes notables
2014 iii 07 cocientes notables2014 iii 07 cocientes notables
2014 iii 07 cocientes notables
 
Soluciones por series
Soluciones por seriesSoluciones por series
Soluciones por series
 
Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1Analisis de Algoritmos tarea 1
Analisis de Algoritmos tarea 1
 

Más de Asociación Argentina de Bioinformática y Biología Computacional

Más de Asociación Argentina de Bioinformática y Biología Computacional (16)

About using new descriptors for cheminformatics
About using new descriptors for cheminformaticsAbout using new descriptors for cheminformatics
About using new descriptors for cheminformatics
 
La Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTALa Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTA
 
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
 
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
 
Cooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje EstocásticoCooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje Estocástico
 
Prediction of heparin binding sites on GAPDH
Prediction of heparin binding sites on GAPDHPrediction of heparin binding sites on GAPDH
Prediction of heparin binding sites on GAPDH
 
Signals of Evolution: Conservation, Specificity Determining Positions and Coe...
Signals of Evolution: Conservation, Specificity Determining Positions and Coe...Signals of Evolution: Conservation, Specificity Determining Positions and Coe...
Signals of Evolution: Conservation, Specificity Determining Positions and Coe...
 
Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...
 
Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...
 
A structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plantsA structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plants
 
Modelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondiiModelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondii
 
Data balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPsData balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPs
 
Gene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette indexGene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette index
 
Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...
 
Biopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and OutlookBiopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and Outlook
 
¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?
 

Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional

  • 1. Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional J. Salvador Arias CONICET, INSUE, Facultad de Ciencias Naturales e Instituto Miguel Lillo, Universidad Nacional de Tucumán, Tucumán
  • 2. Biogeografía histórica Distribución geográfica en un contexto filogenético Brundin, 1972
  • 3. Biogeografía histórica Los métodos se basan en una analogía entre la reconstrucción filogenética y la biogeografía. Optimación de caracteres, bien sea usando parsimonia de Fitch o similares a Sankoff, o mapeo estocástico usando likelihood.
  • 4. Biogeografía histórica Áreas predefinidas: Definidas arbitrariamente, nunca se contrastan Ignoran la naturaleza espacial de los datos No permiten escalas detalladas Solo son viables con pocos “caracteres” (áreas) Susceptibles a problemas que no son propios de la biogeografía (v.g. especies ampliamente distribuídas) Nylander et al. 2008
  • 5. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica
  • 6. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones
  • 7. Análisis de vicarianza Ideas propuestas por Peter Hovenkamp (1997, 2001) Uso directo de información geográfica En lugar de enfocarse en el área, hay que fijarse en la disyunción (vicarianza/alopatría) de las distribuciones Distribución de un nodo es la suma de sus descendientes
  • 10. 1. Para cada terminal t 2. Para todas las celdas (i,j) 3. D t (i,j) ← 0, 4. Para cada registro r en t 5. D t (i,j) ← 1 para la celda (x,y) asignada al registro r 6. Para cada V k de (x,y) , D t (v1,v2) ← 1 7. Fin-para 2 8. Fin-para 1 ∎ Relleno de “imagen digital”
  • 11. Relleno de “imagen digital”
  • 12. Distribuciones Rellenado de la distribución
  • 13. Distribuciones Grilla de 1x1 grados, entre los 60º N y 60º S: 360 x 120 celdas. Un poco más de 70 terminales, eso es más de 140 nodos: 360x120x140 celdas. Más de 6'000.000 de celdas, en su mayor parte vacías!
  • 14. Quad-árboles Construir Q (i1, i2, j1, j2, anc) 1. Si (D|i1, i2, j1, j2| = 0) retornar NULO 2. Q -> ancestro ← anc 3. Asignar coordenadas del cuadrante a Q 4. Si ((i1 = i2) y (j1=j2)) Q -> esCelda? ← verdadero retornar Q 5. x ← i1 + ((i2 – i1) / 2), y ← j1 + ((j2 – j1) / 2) Q -> esCelda? ← falso 6. Q -> NW ← Construir Q (i1, x, j1, y, Q) Q -> NE ← Construir Q (x, i2, j1, y, Q) Q -> SW ← Construir Q (i1, x, y, j2, Q) Q -> NW ← Construir Q (x, i2, y, j2, Q) 7. Retornar Q ∎
  • 17. Las reconstrucciones posibles se evalúan eliminando nodos, y revisando si dicho eliminación incrementa el número de nodos vicariantes. El criterio optimo es entonces: (i) minimizar nodos no vicariantes (ii) minimizar eliminación de nodos Criterio de optimalidad
  • 18. Criterio de optimalidad Sea un nodo- j un nodo en donde todos sus descendientes menos uno tienen una eliminación de distribucion (Page, 1994; Arias et al. 2008). Cualquier otro node es vicariante o no vicariante.
  • 19. Sea C n el costo de la reconstrucción del nodo n , y desc (n) es la lista de descendientes de n . C n = ( ∑ i = desc(n) C i ) + Y n + X n Criterio de optimalidad
  • 20. Criterio de optimalidad C n = ( ∑ i = desc(n) C i ) + Y n + X n Donde Y n Y n = costo de una eliminación, si la distribución de n es eliminada, De lo contrario, Y n = 0
  • 21. C n = ( ∑ i = desc(n) C i ) + Y n + X n y X n X n = 0, si n es un nodo- j , X n = 0, si n es un nodo vicariante, X n = costo de un nodo no vicariante, si n es no vicariante. Criterio de optimalidad
  • 22. Esta operación permite conocer el costo del árbol para una reconstrucción dada. El peso de la búsqueda esta en la optimación del árbol: cada reconstrucción propuesta, requiere una optimación. Optimación
  • 23. Optimar (nodo n ) 1. Si ( n es eliminado) C n ← costo_eliminación Sino C n ← 0 2. Si n es terminal, retornar C n 3. Para cada i que sea desc(n) C n ← C n + Optimar ( i ) 5. Si n es no vicariante C n ← C n + Costo_no_vic 6. Retornar C n ∎ Optimación ingenua
  • 24. Optimación ingenua Requiere visitar todos los nodos del árbol. Su estructura revela la posibilidad de una optimación más adecuada: el costo de de un nodo depende solo de sus nodos descendientes, por lo tanto, si se parte de una reconstrucción, es posible únicamente optimar los nodos ancestrales al nodo modificado.
  • 25. Optimar (nodo n ) 1. Minetras n dif NULL 2. Si ( n es eliminado) C n ← costo_eliminación Sino C n ← 0 2. Si n es terminal, n ← anc (n) , volver a 1 3. Para cada i que sea desc(n) C n ← C n + C i 4. Si n es no vicariante C n ← C n + Costo_no_vic 5. n ← anc (n) 6. Fin-Mientras ∎ Optimación incremental
  • 26. Optimación incremental Depende de la estructura del árbol. En el peor caso, revisa todos los nodos del árbol. En promedio el número de visitas es el número de nodos entre el terminal más alejado de la raíz y la raíz.
  • 27. Búsquedas heurísticas Las búsquedas exactas son muy costosas. El problema es una combinatoria, por lo que existen múchisimas posibilidades. Búsquedas heurísticas no garantizan encontrar el óptimo, pero permiten atacar problemas mucho mayores.
  • 28. “ Subida de colina” simple 1. Min ← C t 2. Para cada nodo n en el árbol t 3. Eliminar n Optimizar t 4. Si ( C t < Min ) volver a 1. 5. Restaurar n Optimizar t 6. Fin para-2. ∎
  • 29. “ Subida de colina” simple Rápida, independiente del punto de partida. En el peor caso revisa todos los nodos, 2n optimiaciones. Es poco efectiva en árboles grandes, las primeras eliminaciones pueden ser poco óptimas.
  • 30. Heurística de Page 1. Prev ← C t 2. Min ← C t Pos ← NULL 3. Para cada nodo n en el árbol t 4. Eliminar n , Optimizar t 5. Si ( C t < Min ) Min ← C t Pos ← n 6. Restaurar n , Optimizar t 7. Fin para-3. 8. Si ( Min < Prev ) Eliminar n , Optimizar t volver a 2. ∎
  • 31. Más exhaustiva que la subida simple. En cada eliminación hace dos optimaciones. Un ciclo completo hace 2n optimiaciones. Si no hay empates, siempre realiza la misma secuencia. Heurística de Page
  • 32. Los algoritmos presentados aquí se encuentran implementados en VIP (Vicariance Inference Program), un programa que pronto estará disponible de manera gratuita en internet. Este es el primer programa de biogeografía que utiliza filogenias y datos geográficos simultáneamente Implementación
  • 33. Es difícil que se consigan mejores soluciones para la compresión de datos geográficos o optimaciones más rápidas. En cambio, hay muchas posibilidades para mejorar las heurísticas: búsquedas limitando los nodos a optimar, muestreos basados en cristalización simulada, o fusión de soluciones. Perspectivas
  • 34. Este trabajo a recibido financiación de CONICET (beca doctoral), y FONCyT (PICT 1314). P. Hovenkamp ha mostrado un gran interés y retroalimentación al proyecto. C.A. Szumik, P.A. Goloboff, D. Casagranda, S. Catalono y M. Mirande han proporcionado ideas, discusión y apoyo. Agradecimientos