SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                     Universidad Católica de Córdoba / 11-13 de Mayo de 2011




Autores: Farm. Damián Palomba1,2
        Dr. Gustavo E. Vazquez2
        Dra. Mónica F. Díaz1,2
        1PlantaPiloto de Ingeniería Química (PLAPIQUI)- U.N.S.- CONICET
        2Laboratorio de Investigación y Desarrollo en Computación Científica

       (LIDeCC)- U.N.S.- CONICET
        2º Congreso Argentino de Bioinformática y Biología Computacional
                                 Universidad Católica de Córdoba, 13/05/2011
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                  Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                        Introducción
                                                          Desarrollo de nuevos
  Campo de aplicación general
                                                          materiales poliméricos

                   Síntesis de
                                                   propiedades
                    prototipos
                                                    deseadas
                   poliméricos

 Campo de aplicación específico                            Predicción in silico de
                                                           propiedades
                            medición experimental


síntesis y el procesado del material                   dificultades intrínsecas

gasto de tiempo e incremento de costos

                              estimar propiedades previo a la
          Ventaja
                              síntesis del material

                                               2
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                   Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                          Temperatura de transición vítrea (Tg)


    propiedades de los polímeros más          material se convierte en rígido y frágil
    ampliamente modeladas

característica del material             cambios profundos                manufactura y
propiedades mecánicas y físicas         en el rango de T                 utilización del material

                    Tg/M =       Temperatura de transición vítrea molar

    M= masa de la unidad repetitiva         más fácil modelar             interconvertible

  interacciones intra e                                                     aumentan Tg
                             restrinjan movimientos moleculares
  intermoleculares

                               ¡¡Enorme!! n › 20000




                                                3
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                       Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                                  Métodos QSPR para polímeros
          Empíricos                                                      Teóricos
correlacionan target con otras                                  descriptores moleculares
propiedades químicas y físicas                                  estructura del monómero
                                                                y/o de la unidad repetitiva

  grupos químicos investigados
                                                               QSPR con redes neuronales

                                                         Gran auge          mejores resultados que
                                                                            métodos lineales (MLR)

                                                                     No linealidad de la propiedad

      Calidad de los descriptores                              Calidad del modelo
             Conclusion




                             Buenos modelos a partir de buenos descriptores



                          QSPR= Quantitative Structure-Property Relationship
                                                    4
2º Congreso Argentino de Bioinformática y Biología Computacional
                                  Universidad Católica de Córdoba / 11-13 de Mayo de 2011




                     Objetivos

                                                 características físicas,
                                                 químicas, geométricas y
                                                 electrónicas de las cadenas
                         Nuevos                  principales y laterales
                       Descriptores


               Nuevo Modelo
por medio de      QSPR
una ANN




                               5
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                     Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                                         Estrategias


                  Varias
 Unidad                                                                  Cadena
                 unidades         Trímero             Monómero                            Grupo Lateral
repetitiva                                                               Principal
                repetitivas




    Estireno            Poliestireno
                                                              Unidades repetitivas
   (monómero)          unidad repetitiva (mer)




                                    ¡¡Enorme!! n › 20000

                                                  6
2º Congreso Argentino de Bioinformática y Biología Computacional
                                               Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                                  Estrategias


                Varias
 Unidad                                                            Cadena
               unidades     Trímero             Monómero                            Grupo Lateral
repetitiva                                                         Principal
              repetitivas




             Modelado molecular computacional
   Propiedades cadena principal y
   al grupo lateral de la unidad                     estructura tridimensional
   repetitiva media (trímero)
  (Exp las cadenas influyen en la Tg)




                                            7
2º Congreso Argentino de Bioinformática y Biología Computacional
                                           Universidad Católica de Córdoba / 11-13 de Mayo de 2011




                                 H                                                  H      CP


                                                                                     G
   Estireno
           Modelado molecular computacional
                Poliestireno                                                         L
 (monómero)
 Propiedades cadena repetitiva y
                  unidad
                         principal                unidad repetitiva
                                                  (media del trímero)
                       (mer)
 al grupo lateral de la unidad                   estructura tridimensional
 repetitiva media (trímero)
(Exp las cadenas influyen en la Tg)


Polimetilmetacrilato
 unidad repetitiva
                       cadena principal                        grupo lateral


                                          8
2º Congreso Argentino de Bioinformática y Biología Computacional
                                               Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                  Descriptores-Metodología
                      Modelado molecular computacional
     Base de Datos
  88 homopolímeros                     trímero (unidos cabeza-cola) completado con
                                       hidrógenos              HyperChem 8.0.7
(estructuralmente diversos)
       (PM elevado)

                                optimización
                                                        Mecánica Cuántica
     Mecánica Molecular
                                                       Método Semiempirical
      (Método MM+)
                                                     (Algorithm Polak-Ribiere)

                  conformaciones energéticamente estables

                           cálculo de descriptores
      Tradicionales                                         Nuevos

        trímero                               unidad repetitiva media del trímero
                                         cadena principal         grupo lateral



                                            9
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                    Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                                    Descriptores para QSPR
            Descriptores Tradicionales          trímero

   descriptores 3D
                                            descriptores
   Molecular Properties                     0D, 1D, 2D
   Fingerprints
   descriptores binarios
   altamente correlacionados (R≥0.9)


            Nuevos descriptores            unidad repetitiva media del trímero



cadena                                                 grupo
principal                                              lateral



área superficial (aproximada)        área superficial (grid)       volumen         polarizabilidad

      masa molecular        Log P            refractividad              número de átomos
              Propiedad cadena principal o lateral/número
              de átomos de cadena principal o lateral
                                                10
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                   Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                               Generación del modelo QSPR
               Descriptores
     Dragon                                               Valores exp de
               tradicionales                                                   (Target = Tg/M)
                                                          propiedades
  HyperChem Descriptores             Delphos       (software de selección óptima de descriptores)
              nuevos

                   25 mejores conjuntos alternativos de descriptores

                         Mejor conjunto de descriptores      (criterio químico y estadístico)


                                      Statistica
                                  (redes neuronales)


                                    Modelo QSPR

                               Validación del modelo QSPR
         validación interna                                         test de randomización
Cross-Validation y Y-Scrambling          externa
                                                            al azar varias veces
                          set de datos                     diferentes proporciones
              (entrenamiento, testeo y validación)
                                                           ad hoc 2 grupos de datos
                                               11
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                     Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                        Resultados y discusión
                      modelo QSPR              4 descriptores
               grupo lateral                          cadena principal                 trímero
         masa          área superficial (ap)        área superficial (ap)               RBN

número bajo          principio de parsimonia (Occam)                  compuestos
                más descriptores                                       estructuralmente
literatura                                                            diversos
                pocos descriptores familia en particular
                            Parámetros de la red neuronal
 MLP 4-23-1    función de activación        error function             algoritmo de entrenamiento
            capa oculta y salida Tanh            SOS                           BFGS 81

                               Características de los sets
  Entrenamiento:50% (n= 44)               testeo :23% (n=20)            Validación:27% (n=24 )
         R2= 0.992                           q2= 0.95                         R2= 0.946
       Rearmado de los sets                                 2 sets ad hoc
60-20-20   R2= 0.98; 0.98; 0.96        proporción equitativa 60-15-25 R2= 0.97; 0.93; 0.93
50-25-25   R2= 0.99; 0.97; 0.91        de todas las familias 60-15-25 R2= 0.98; 0.99; 0.92

                   no resultado al azar                sin remover outliers

                                                 12
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                                         Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                                                     Descriptores del modelo QSPR

                                          área superficial del grupo lateral (aproximada)

                      relación inversa          ante igual cantidad de materia                         ocupan mayor
                                              los grupos más flexibles (los que poseen                 área superficial
                                              libre rotación)
                      si la misma cantidad de materia                                         restringen los
                      ocupa menos área superficial         masa es más rígida                 movimientos de      Tg
                                                                                              rotación
                                         área superficial de la cadena principal (aproximada)

                         diferenciar estructuralmente en la cadena principal                        relación inversa
Área superficial GL




                                                                        Área superficial CP




                                                                                                         Tg/M
                                Tg/M                                 13
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                       Universidad Católica de Córdoba / 11-13 de Mayo de 2011




number of rotatable bonds (RBN)     Es el número de enlaces que permiten libre rotación
                                    alrededor de sí mismos
    relación inversa                                    correlación A sup del GL

  el nro de enlaces que rotan libremente aumenta el A S GL             ≠ cdo varía la CP
                                polióxidos el RBN es ≠ para c/u y el A S GL es 0 para todos

   cadenas laterales longitudinales extensas            Falla polímeros cadena lateral corta

      RBN también M, de modo que Tg/M                   estos polímeros se diferencian A S del GL


  masa del grupo lateral

   relación inversa

 Correlac A sup GL      2 grupos laterales       masa similar           A S GL
                                                  AS GL similar          masa del grupo lateral
    más representativa             masa GL también M, de modo que Tg/M



                                                   14
2º Congreso Argentino de Bioinformática y Biología Computacional
                          Universidad Católica de Córdoba / 11-13 de Mayo de 2011
masa GL




                           RBN
          Tg/M                                           Tg/M




                      15
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                     Universidad Católica de Córdoba / 11-13 de Mayo de 2011



Dificultades superadas y ventajas con el enfoque
                               Dificultad

                                    descriptores
               cálculo                                                      peso molecular y target


toda molécula es prácticamente imposible                                    Tg ≈ cte PM ≈ 25000
amplias distribuciones de PM y PM elevados                      base de datos         PM › 50000


           trímero                                                         independientes del PM

                               Ventajas

   optimizar                   trímero                               unidad repetitiva media

interacciones            velocidad de optimización          influencia fisicoquímica, estérica y
intramoleculares                                            electrónica de las unidades laterales
ocurren a › escala       facilidad de cálculo                conserva las características
                         de los descriptores                 estructurales

                                                 16
2º Congreso Argentino de Bioinformática y Biología Computacional
                                           Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                        Conclusiones
                         Nuevos Descriptores

Independencia del tipo de       sólo las cadenas           más generalizables
átomos y grupos atómicos

Fáciles de calcular     operación automatizada

Clara interpretación fisicoquímica
Relación inversa Tg/M

                         Nuevo Modelo QSPR

Número bajo de descriptores
Parámetros estadísticos equiparables a los mejores

                          Trabajo futuro
    Modelo con mayor número de unidades repetitivas
    Heteropolímeros                  Polímeros entrecruzados
    Otras propiedades target         mezclas de materiales poliméricos


                                        17
2º Congreso Argentino de Bioinformática y Biología Computacional
         Universidad Católica de Córdoba / 11-13 de Mayo de 2011




     18

Más contenido relacionado

Destacado (7)

Cooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje EstocásticoCooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje Estocástico
 
Modelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondiiModelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondii
 
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
 
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
 
La Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTALa Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTA
 
Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...
 
Bioinformatica Proteinas
Bioinformatica ProteinasBioinformatica Proteinas
Bioinformatica Proteinas
 

Similar a About using new descriptors for cheminformatics

Nanotecnologia.pdf
Nanotecnologia.pdfNanotecnologia.pdf
Nanotecnologia.pdfMeifer
 
Presentación master nanotubos jose ignacio
Presentación master nanotubos jose ignacioPresentación master nanotubos jose ignacio
Presentación master nanotubos jose ignacioJosé Candelera
 
Ciencias naturales ciclo 4
Ciencias naturales ciclo 4Ciencias naturales ciclo 4
Ciencias naturales ciclo 4academicasol
 
MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...
MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...
MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...olga20022017
 
Programación ciclo regular 2012 i
Programación ciclo regular 2012  iProgramación ciclo regular 2012  i
Programación ciclo regular 2012 iAlberto Bocanegra
 
La Ciencia Y El MéTodo CientíFico
La Ciencia Y El MéTodo CientíFicoLa Ciencia Y El MéTodo CientíFico
La Ciencia Y El MéTodo CientíFicoscalavi
 
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac... PEDRO PACHECO
 
Introduccion a la bioinformatica
Introduccion a la bioinformaticaIntroduccion a la bioinformatica
Introduccion a la bioinformaticacursoNGS
 
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...LACBiosafety
 
1er conversatorio ciclo a2011 ¿que es la nanotecnologia?
1er conversatorio ciclo a2011 ¿que es la nanotecnologia?1er conversatorio ciclo a2011 ¿que es la nanotecnologia?
1er conversatorio ciclo a2011 ¿que es la nanotecnologia?Rednano EstUla
 

Similar a About using new descriptors for cheminformatics (12)

Nanotecnologia.pdf
Nanotecnologia.pdfNanotecnologia.pdf
Nanotecnologia.pdf
 
Presentación master nanotubos jose ignacio
Presentación master nanotubos jose ignacioPresentación master nanotubos jose ignacio
Presentación master nanotubos jose ignacio
 
Ciencias naturales ciclo 4
Ciencias naturales ciclo 4Ciencias naturales ciclo 4
Ciencias naturales ciclo 4
 
Ganadores procyt2011
Ganadores procyt2011Ganadores procyt2011
Ganadores procyt2011
 
MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...
MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...
MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...
 
Programación ciclo regular 2012 i
Programación ciclo regular 2012  iProgramación ciclo regular 2012  i
Programación ciclo regular 2012 i
 
La Ciencia Y El MéTodo CientíFico
La Ciencia Y El MéTodo CientíFicoLa Ciencia Y El MéTodo CientíFico
La Ciencia Y El MéTodo CientíFico
 
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
 
Introduccion a la bioinformatica
Introduccion a la bioinformaticaIntroduccion a la bioinformatica
Introduccion a la bioinformatica
 
Sensores
SensoresSensores
Sensores
 
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
 
1er conversatorio ciclo a2011 ¿que es la nanotecnologia?
1er conversatorio ciclo a2011 ¿que es la nanotecnologia?1er conversatorio ciclo a2011 ¿que es la nanotecnologia?
1er conversatorio ciclo a2011 ¿que es la nanotecnologia?
 

Más de Asociación Argentina de Bioinformática y Biología Computacional

Más de Asociación Argentina de Bioinformática y Biología Computacional (8)

Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...
 
A structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plantsA structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plants
 
Data balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPsData balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPs
 
Gene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette indexGene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette index
 
Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...
 
Biopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and OutlookBiopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and Outlook
 
¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?
 
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacionalBiogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional
 

Último

LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
Trabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfTrabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfedepmariaperez
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOnarvaezisabella21
 
tarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzztarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzzAlexandergo5
 
TALLER DE ANALISIS SOLUCION PART 2 (1)-1.docx
TALLER DE ANALISIS SOLUCION  PART 2 (1)-1.docxTALLER DE ANALISIS SOLUCION  PART 2 (1)-1.docx
TALLER DE ANALISIS SOLUCION PART 2 (1)-1.docxobandopaula444
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúCEFERINO DELGADO FLORES
 
Los Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, AplicacionesLos Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, AplicacionesEdomar AR
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptchaverriemily794
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxGESTECPERUSAC
 
Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1ivanapaterninar
 
Presentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia ArtificialPresentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia Artificialcynserafini89
 
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxtjcesar1
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfjeondanny1997
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfFernandoOblitasVivan
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
Documentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosDocumentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosAlbanyMartinez7
 

Último (20)

LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
Trabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdfTrabajo de tecnología excel avanzado.pdf
Trabajo de tecnología excel avanzado.pdf
 
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPOAREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
AREA TECNOLOGIA E INFORMATICA TRABAJO EN EQUIPO
 
tarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzztarea de exposicion de senati zzzzzzzzzz
tarea de exposicion de senati zzzzzzzzzz
 
TALLER DE ANALISIS SOLUCION PART 2 (1)-1.docx
TALLER DE ANALISIS SOLUCION  PART 2 (1)-1.docxTALLER DE ANALISIS SOLUCION  PART 2 (1)-1.docx
TALLER DE ANALISIS SOLUCION PART 2 (1)-1.docx
 
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del PerúRed Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
Red Dorsal Nacional de Fibra Óptica y Redes Regionales del Perú
 
Los Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, AplicacionesLos Microcontroladores PIC, Aplicaciones
Los Microcontroladores PIC, Aplicaciones
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptx
 
Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1Guía de Registro slideshare paso a paso 1
Guía de Registro slideshare paso a paso 1
 
Presentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia ArtificialPresentación sobre la Inteligencia Artificial
Presentación sobre la Inteligencia Artificial
 
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptxModelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
Modelo de Presentacion Feria Robotica Educativa 2024 - Versión3.pptx
 
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdfLa Electricidad Y La Electrónica Trabajo Tecnología.pdf
La Electricidad Y La Electrónica Trabajo Tecnología.pdf
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdf
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
Documentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos JuridicosDocumentacion Electrónica en Actos Juridicos
Documentacion Electrónica en Actos Juridicos
 

About using new descriptors for cheminformatics

  • 1. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Autores: Farm. Damián Palomba1,2 Dr. Gustavo E. Vazquez2 Dra. Mónica F. Díaz1,2 1PlantaPiloto de Ingeniería Química (PLAPIQUI)- U.N.S.- CONICET 2Laboratorio de Investigación y Desarrollo en Computación Científica (LIDeCC)- U.N.S.- CONICET 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba, 13/05/2011
  • 2. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Introducción Desarrollo de nuevos Campo de aplicación general materiales poliméricos Síntesis de propiedades prototipos deseadas poliméricos Campo de aplicación específico Predicción in silico de propiedades medición experimental síntesis y el procesado del material dificultades intrínsecas gasto de tiempo e incremento de costos estimar propiedades previo a la Ventaja síntesis del material 2
  • 3. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Temperatura de transición vítrea (Tg) propiedades de los polímeros más material se convierte en rígido y frágil ampliamente modeladas característica del material cambios profundos manufactura y propiedades mecánicas y físicas en el rango de T utilización del material Tg/M = Temperatura de transición vítrea molar M= masa de la unidad repetitiva más fácil modelar interconvertible interacciones intra e aumentan Tg restrinjan movimientos moleculares intermoleculares ¡¡Enorme!! n › 20000 3
  • 4. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Métodos QSPR para polímeros Empíricos Teóricos correlacionan target con otras descriptores moleculares propiedades químicas y físicas estructura del monómero y/o de la unidad repetitiva grupos químicos investigados QSPR con redes neuronales Gran auge mejores resultados que métodos lineales (MLR) No linealidad de la propiedad Calidad de los descriptores Calidad del modelo Conclusion Buenos modelos a partir de buenos descriptores QSPR= Quantitative Structure-Property Relationship 4
  • 5. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Objetivos características físicas, químicas, geométricas y electrónicas de las cadenas Nuevos principales y laterales Descriptores Nuevo Modelo por medio de QSPR una ANN 5
  • 6. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Estrategias Varias Unidad Cadena unidades Trímero Monómero Grupo Lateral repetitiva Principal repetitivas Estireno Poliestireno Unidades repetitivas (monómero) unidad repetitiva (mer) ¡¡Enorme!! n › 20000 6
  • 7. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Estrategias Varias Unidad Cadena unidades Trímero Monómero Grupo Lateral repetitiva Principal repetitivas Modelado molecular computacional Propiedades cadena principal y al grupo lateral de la unidad estructura tridimensional repetitiva media (trímero) (Exp las cadenas influyen en la Tg) 7
  • 8. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 H H CP G Estireno Modelado molecular computacional Poliestireno L (monómero) Propiedades cadena repetitiva y unidad principal unidad repetitiva (media del trímero) (mer) al grupo lateral de la unidad estructura tridimensional repetitiva media (trímero) (Exp las cadenas influyen en la Tg) Polimetilmetacrilato unidad repetitiva cadena principal grupo lateral 8
  • 9. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Descriptores-Metodología Modelado molecular computacional Base de Datos 88 homopolímeros trímero (unidos cabeza-cola) completado con hidrógenos HyperChem 8.0.7 (estructuralmente diversos) (PM elevado) optimización Mecánica Cuántica Mecánica Molecular Método Semiempirical (Método MM+) (Algorithm Polak-Ribiere) conformaciones energéticamente estables cálculo de descriptores Tradicionales Nuevos trímero unidad repetitiva media del trímero cadena principal grupo lateral 9
  • 10. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Descriptores para QSPR Descriptores Tradicionales trímero descriptores 3D descriptores Molecular Properties 0D, 1D, 2D Fingerprints descriptores binarios altamente correlacionados (R≥0.9) Nuevos descriptores unidad repetitiva media del trímero cadena grupo principal lateral área superficial (aproximada) área superficial (grid) volumen polarizabilidad masa molecular Log P refractividad número de átomos Propiedad cadena principal o lateral/número de átomos de cadena principal o lateral 10
  • 11. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Generación del modelo QSPR Descriptores Dragon Valores exp de tradicionales (Target = Tg/M) propiedades HyperChem Descriptores Delphos (software de selección óptima de descriptores) nuevos 25 mejores conjuntos alternativos de descriptores Mejor conjunto de descriptores (criterio químico y estadístico) Statistica (redes neuronales) Modelo QSPR Validación del modelo QSPR validación interna test de randomización Cross-Validation y Y-Scrambling externa al azar varias veces set de datos diferentes proporciones (entrenamiento, testeo y validación) ad hoc 2 grupos de datos 11
  • 12. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Resultados y discusión modelo QSPR 4 descriptores grupo lateral cadena principal trímero masa área superficial (ap) área superficial (ap) RBN número bajo principio de parsimonia (Occam) compuestos más descriptores estructuralmente literatura diversos pocos descriptores familia en particular Parámetros de la red neuronal MLP 4-23-1 función de activación error function algoritmo de entrenamiento capa oculta y salida Tanh SOS BFGS 81 Características de los sets Entrenamiento:50% (n= 44) testeo :23% (n=20) Validación:27% (n=24 ) R2= 0.992 q2= 0.95 R2= 0.946 Rearmado de los sets 2 sets ad hoc 60-20-20 R2= 0.98; 0.98; 0.96 proporción equitativa 60-15-25 R2= 0.97; 0.93; 0.93 50-25-25 R2= 0.99; 0.97; 0.91 de todas las familias 60-15-25 R2= 0.98; 0.99; 0.92 no resultado al azar sin remover outliers 12
  • 13. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Descriptores del modelo QSPR área superficial del grupo lateral (aproximada) relación inversa ante igual cantidad de materia ocupan mayor los grupos más flexibles (los que poseen área superficial libre rotación) si la misma cantidad de materia restringen los ocupa menos área superficial masa es más rígida movimientos de Tg rotación área superficial de la cadena principal (aproximada) diferenciar estructuralmente en la cadena principal relación inversa Área superficial GL Área superficial CP Tg/M Tg/M 13
  • 14. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 number of rotatable bonds (RBN) Es el número de enlaces que permiten libre rotación alrededor de sí mismos relación inversa correlación A sup del GL el nro de enlaces que rotan libremente aumenta el A S GL ≠ cdo varía la CP polióxidos el RBN es ≠ para c/u y el A S GL es 0 para todos cadenas laterales longitudinales extensas Falla polímeros cadena lateral corta RBN también M, de modo que Tg/M estos polímeros se diferencian A S del GL masa del grupo lateral relación inversa Correlac A sup GL 2 grupos laterales masa similar A S GL AS GL similar masa del grupo lateral más representativa masa GL también M, de modo que Tg/M 14
  • 15. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 masa GL RBN Tg/M Tg/M 15
  • 16. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Dificultades superadas y ventajas con el enfoque Dificultad descriptores cálculo peso molecular y target toda molécula es prácticamente imposible Tg ≈ cte PM ≈ 25000 amplias distribuciones de PM y PM elevados base de datos PM › 50000 trímero independientes del PM Ventajas optimizar trímero unidad repetitiva media interacciones velocidad de optimización influencia fisicoquímica, estérica y intramoleculares electrónica de las unidades laterales ocurren a › escala facilidad de cálculo conserva las características de los descriptores estructurales 16
  • 17. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Conclusiones Nuevos Descriptores Independencia del tipo de sólo las cadenas más generalizables átomos y grupos atómicos Fáciles de calcular operación automatizada Clara interpretación fisicoquímica Relación inversa Tg/M Nuevo Modelo QSPR Número bajo de descriptores Parámetros estadísticos equiparables a los mejores Trabajo futuro Modelo con mayor número de unidades repetitivas Heteropolímeros Polímeros entrecruzados Otras propiedades target mezclas de materiales poliméricos 17
  • 18. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 18