SISTEMAS DE 
INFORMACIÓN 
CARLOS RODRIGUEZ 
JONATHAN NARVAEZ
¿Que Es? 
Los sistemas de información son un conjunto de elementos que administran 
información y organizados de una manera acorde a la organización cubren 
necesidades y/o objetivos.
Elementos de un Sistema de Información 
Hardware 
Datos 
Recurso Humano 
Software 
Procedimientos
Clasificación de los SI
Información en la era genómica 
 El proyecto genoma humano y similares genera 
un inmenso flujo de información 
 Para poder utilizar esta información, ha de estar 
almacenada correctamente 
 El acceso a la información almacenada ... 
 Ha de ser rápido 
 Debe poder hacerse de manera flexible 
 Esto es posible gracias a la creación de bases 
de datos y distribución vía Internet. 
4
Para que se utilizan las bases de 
datos ? 
 Búsqueda de información. 
 Por palabra clave, números de acceso, autores... 
 Búsqueda de homologías 
 ¿Hay secuencias igual o parecidas a la mía ? 
 Búsqueda de patrones 
 ¿Mi secuencia contienen patrones conocidos? 
 Predicciones 
 ¿Puedo encontrar proteínas parecidas a la mía, 
pero con función conocida? 
5
Aspectos a tener en cuenta 
 Los proveedores de recursos 
 Centros o organizaciones especializadas en tener y 
mantener las bases de datos. 
 Bases de datos 
 Hay mucha variedad y contiene información 
diversa 
 Las herramientas 
 Para encontrar información en las BD 
 Para contrastar secuencias contra las BD 
 Para exportar la información 
6
Principales proveedores de recursos 
 El National Center for Biotechnology Information 
(NCBI) centraliza los bancos de datos y 
aplicacions de EEUU 
 El European Bioinformatics Institute (EBI) realiza 
una función similar en Europa 
 GenomeNet reune bases de datos diversas en 
Japón 
7
Principales bases de datos 
en Bioinformática
Tipos de bases de datos 
 Existen cientos de BD en número tan elevado que no es 
práctico enumerarlas (aunque aquí lo intentan) 
 Por el tipo de información que contienen distinguimos 
 Bases de datos bibliográficas 
 Bases de datos taxonómicas 
 Bases de datos de nucleótidos 
 Bases de datos genómicas 
 Bases de datos de proteinas 
 Bases de datos de microarrays 
9
Bases de datos bibliográficas 
 Organización de los artículos publicados en la revistas 
de ámbito científico. 
 Pubmed (NCBI) 
 Medline (EBI) 
 Biocatalog: organización de los artículos por temáticas 
concretas de biología molecular. 
10
Bases de datos taxonómicas 
 Son BD que contienen información sobre la clasificación 
de los seres vivos 
 Esta clasificación es básicamente jerárquica y basada 
en información molecular 
 Pretende clasificar cualquier organismo del que se 
posea como mínimo una secuencia de acidos 
nucléicos 
 Como puede suponerse el proyecto no está libre de 
controversia debido a las visiones diferentes que existen 
en la comunidad taxonómica 
11
Bases de datos de nucleótidos 
 Las bases de datos de ácidos nucleicos reciben las 
secuencias de los laboratorios experimentales y las 
organizan haciéndolas accesibles a diario a toda la 
comunidad científica 
 Existen varias BD que intercambian diariamente su 
contenido 
 Genbank (NCBI) 
 EMBL (EBI) 
 KEGG (Genome net) 
12
Bases de datos de genomas 
 Se encargan de mantener y actualizar las secuencias 
y las anotaciones de genomas completos. 
 Ensembl (EBI) 
 Genome viewer (NCBI) 
 Goldenpath (UCSC) 
 Existen también recursos genómicos especializados 
 Transfact: sitios de unión a factores de transcripción. 
 EST: Expressed Sequence Tags 
 UTRDB: Untranslated regions 
 SpliceSitesDB: Pares de señales de splicing 
13
Bases de datos de proteínas 
 Secuencias primarias de aminoácidos 
 Sin revisión humana 
Trembl (EBI) 
nr (NCBI) 
 Con revisión de la anotación 
Swisprot (EBI) 
 Bases de datos de proteomas 
Proteome analysis (EBI) 
14
Proteínas (II) 
 Estructuras secundarias o dominios. Varían según 
la fuente de las proteínas y el análisis que se 
realiza sobre ellas. 
 BLOCKS: Motivos alineados de PROSITE/PRINTS 
 PROSITE: Expresiones regulares sobre Swiss-prot 
 PRINTS: Conjunto de motivos que definen una familia sobre 
Swiss-prot/TrEMBL 
 PFAM: Modelos de Markov sobre Swiss-prot 
 INTERPRO: Integra la información de muchas bases de datos 
de dominios. 
15
Proteínas (III) 
 Estructuras tridimensionales de macromoléculas 
con las coordenadas en el espacio de cada 
átomo. 
 PDB: Base de datos principal de estructuras 
tridimensionales 
 CATH: Clasificación de PDB en diferentes grupos 
funcionales y estructurales 
 MMDB: subset de PDB mantenido por NCBI 
 MSD: subset de PDB mantenido por EBI 
16
Bases de datos de microarrays 
 Bases de datos con las imágenes y 
resultados obtenidos por arrays de 
expresión. 
ArrayExpress (EBI) 
 Riken Expression Array Database 
 Eisen Laboratory (Lawrence Berkeley National 
Lab) 
17
El formato de la 
información 
18
Estructura de las BD 
 La calidad de la información en una base de 
datos, está muy relacionas con su estructura 
 Este aspecto también es crucial para su eficiencia 
y accesibilidad . 
 En la actualidad no existe ningún formato único y 
estándar, usualmente cada base de datos 
impone su propio formato. 
19
SI en Bioinformática 
● Systems Biology Markup Language (SBML) es un formato legible por 
ordenador para representar los modelos de reacciones bioquímicas. es 
aplicable a las redes metabólicas, las vías de señalización celular, redes de 
regulación genómica, y muchas otras áreas de la biología de sistemas. 
● Modeler’s Notebook and Datastore (MONOD)Es un paquete de software 
de código abierto para la organización de los conocimientos biológicos. 
● Laboratory Information Management System (LIMS)
LIMS 
Es un conjunto de herramientas basadas en sistemas 
informáticos que permite la adquisición y gestión de 
toda la información generada en el laboratorio.
Por qué un LIMS 
● Volumen de Datos 
● Restricción al acceso en la entrada y/o visualización de datos. 
● Control automático de la validez de los datos entrados. 
● Conexión con los instrumentos del laboratorio. 
● Uso de Códigos de Barras 
● Cálculos automáticos 
● Generación automática de informes y gráficos sin necesidad de 
escribir información de nuevo. 
● Chequeo automático de especificaciones
Beneficios 
● Acceso rápido a la 
Información 
● Reducir trabajo manual 
● Reducción de errores 
● Mejoramiento de la 
productividad 
● Integración con otros sistemas 
● Reducción en la transcripción 
de Información 
● Validaciones Automáticas 
● Mejoramiento en la 
generación de reportes y su 
respectivo Analisis
Aplicaciones 
Principalmente en laboratorios de Investigación Cientifica 
● Industria Farmacéutica 
● Biotecnología 
● Ciencias de la Vida 
Los LIMS suelen manejar información relacionada con 
● Fuentes de Información 
● Metodos de Analisis 
● Pruebas 
● Resultados 
● Parametrizaciones 
● Mecanismos de Control
Conclusión 
● El activo más importante en las organizaciones 
actualmente es la información, la cual representa 
el conocimiento y el desarrollo. 
● Un sistema de información debe tener total 
disponibilidad de información brindado una 
estructura robusta y flexible preparada para 
futuros cambios.

Sistemas de informacion

  • 1.
    SISTEMAS DE INFORMACIÓN CARLOS RODRIGUEZ JONATHAN NARVAEZ
  • 2.
    ¿Que Es? Lossistemas de información son un conjunto de elementos que administran información y organizados de una manera acorde a la organización cubren necesidades y/o objetivos.
  • 3.
    Elementos de unSistema de Información Hardware Datos Recurso Humano Software Procedimientos
  • 4.
  • 5.
    Información en laera genómica  El proyecto genoma humano y similares genera un inmenso flujo de información  Para poder utilizar esta información, ha de estar almacenada correctamente  El acceso a la información almacenada ...  Ha de ser rápido  Debe poder hacerse de manera flexible  Esto es posible gracias a la creación de bases de datos y distribución vía Internet. 4
  • 6.
    Para que seutilizan las bases de datos ?  Búsqueda de información.  Por palabra clave, números de acceso, autores...  Búsqueda de homologías  ¿Hay secuencias igual o parecidas a la mía ?  Búsqueda de patrones  ¿Mi secuencia contienen patrones conocidos?  Predicciones  ¿Puedo encontrar proteínas parecidas a la mía, pero con función conocida? 5
  • 7.
    Aspectos a teneren cuenta  Los proveedores de recursos  Centros o organizaciones especializadas en tener y mantener las bases de datos.  Bases de datos  Hay mucha variedad y contiene información diversa  Las herramientas  Para encontrar información en las BD  Para contrastar secuencias contra las BD  Para exportar la información 6
  • 8.
    Principales proveedores derecursos  El National Center for Biotechnology Information (NCBI) centraliza los bancos de datos y aplicacions de EEUU  El European Bioinformatics Institute (EBI) realiza una función similar en Europa  GenomeNet reune bases de datos diversas en Japón 7
  • 9.
    Principales bases dedatos en Bioinformática
  • 10.
    Tipos de basesde datos  Existen cientos de BD en número tan elevado que no es práctico enumerarlas (aunque aquí lo intentan)  Por el tipo de información que contienen distinguimos  Bases de datos bibliográficas  Bases de datos taxonómicas  Bases de datos de nucleótidos  Bases de datos genómicas  Bases de datos de proteinas  Bases de datos de microarrays 9
  • 11.
    Bases de datosbibliográficas  Organización de los artículos publicados en la revistas de ámbito científico.  Pubmed (NCBI)  Medline (EBI)  Biocatalog: organización de los artículos por temáticas concretas de biología molecular. 10
  • 12.
    Bases de datostaxonómicas  Son BD que contienen información sobre la clasificación de los seres vivos  Esta clasificación es básicamente jerárquica y basada en información molecular  Pretende clasificar cualquier organismo del que se posea como mínimo una secuencia de acidos nucléicos  Como puede suponerse el proyecto no está libre de controversia debido a las visiones diferentes que existen en la comunidad taxonómica 11
  • 13.
    Bases de datosde nucleótidos  Las bases de datos de ácidos nucleicos reciben las secuencias de los laboratorios experimentales y las organizan haciéndolas accesibles a diario a toda la comunidad científica  Existen varias BD que intercambian diariamente su contenido  Genbank (NCBI)  EMBL (EBI)  KEGG (Genome net) 12
  • 14.
    Bases de datosde genomas  Se encargan de mantener y actualizar las secuencias y las anotaciones de genomas completos.  Ensembl (EBI)  Genome viewer (NCBI)  Goldenpath (UCSC)  Existen también recursos genómicos especializados  Transfact: sitios de unión a factores de transcripción.  EST: Expressed Sequence Tags  UTRDB: Untranslated regions  SpliceSitesDB: Pares de señales de splicing 13
  • 15.
    Bases de datosde proteínas  Secuencias primarias de aminoácidos  Sin revisión humana Trembl (EBI) nr (NCBI)  Con revisión de la anotación Swisprot (EBI)  Bases de datos de proteomas Proteome analysis (EBI) 14
  • 16.
    Proteínas (II) Estructuras secundarias o dominios. Varían según la fuente de las proteínas y el análisis que se realiza sobre ellas.  BLOCKS: Motivos alineados de PROSITE/PRINTS  PROSITE: Expresiones regulares sobre Swiss-prot  PRINTS: Conjunto de motivos que definen una familia sobre Swiss-prot/TrEMBL  PFAM: Modelos de Markov sobre Swiss-prot  INTERPRO: Integra la información de muchas bases de datos de dominios. 15
  • 17.
    Proteínas (III) Estructuras tridimensionales de macromoléculas con las coordenadas en el espacio de cada átomo.  PDB: Base de datos principal de estructuras tridimensionales  CATH: Clasificación de PDB en diferentes grupos funcionales y estructurales  MMDB: subset de PDB mantenido por NCBI  MSD: subset de PDB mantenido por EBI 16
  • 18.
    Bases de datosde microarrays  Bases de datos con las imágenes y resultados obtenidos por arrays de expresión. ArrayExpress (EBI)  Riken Expression Array Database  Eisen Laboratory (Lawrence Berkeley National Lab) 17
  • 19.
    El formato dela información 18
  • 20.
    Estructura de lasBD  La calidad de la información en una base de datos, está muy relacionas con su estructura  Este aspecto también es crucial para su eficiencia y accesibilidad .  En la actualidad no existe ningún formato único y estándar, usualmente cada base de datos impone su propio formato. 19
  • 21.
    SI en Bioinformática ● Systems Biology Markup Language (SBML) es un formato legible por ordenador para representar los modelos de reacciones bioquímicas. es aplicable a las redes metabólicas, las vías de señalización celular, redes de regulación genómica, y muchas otras áreas de la biología de sistemas. ● Modeler’s Notebook and Datastore (MONOD)Es un paquete de software de código abierto para la organización de los conocimientos biológicos. ● Laboratory Information Management System (LIMS)
  • 22.
    LIMS Es unconjunto de herramientas basadas en sistemas informáticos que permite la adquisición y gestión de toda la información generada en el laboratorio.
  • 23.
    Por qué unLIMS ● Volumen de Datos ● Restricción al acceso en la entrada y/o visualización de datos. ● Control automático de la validez de los datos entrados. ● Conexión con los instrumentos del laboratorio. ● Uso de Códigos de Barras ● Cálculos automáticos ● Generación automática de informes y gráficos sin necesidad de escribir información de nuevo. ● Chequeo automático de especificaciones
  • 24.
    Beneficios ● Accesorápido a la Información ● Reducir trabajo manual ● Reducción de errores ● Mejoramiento de la productividad ● Integración con otros sistemas ● Reducción en la transcripción de Información ● Validaciones Automáticas ● Mejoramiento en la generación de reportes y su respectivo Analisis
  • 25.
    Aplicaciones Principalmente enlaboratorios de Investigación Cientifica ● Industria Farmacéutica ● Biotecnología ● Ciencias de la Vida Los LIMS suelen manejar información relacionada con ● Fuentes de Información ● Metodos de Analisis ● Pruebas ● Resultados ● Parametrizaciones ● Mecanismos de Control
  • 26.
    Conclusión ● Elactivo más importante en las organizaciones actualmente es la información, la cual representa el conocimiento y el desarrollo. ● Un sistema de información debe tener total disponibilidad de información brindado una estructura robusta y flexible preparada para futuros cambios.