SlideShare una empresa de Scribd logo
1 de 10
Limpieza de datos



http://es.wikipedia.org/wiki/Informatica


 JOSÉ CUARTAS   INFORMÁTICA
Limpieza datos
¿Podemos interpretar los datos?¿Qué significan los campos?

¿Cuál es la clave? Las medidas?

Como manejar los datos censurados?

¿Los datos se refieren a los mismos períodos de tiempo?


No olvide hay fallos como: Errores tipográficos,
múltiples formatos, los valores perdidos, no se
entiende la especificación, entre otros.
      JOSÉ CUARTAS       INFORMÁTICA                      2
Limpieza datos

En general, se tiene un problema si los
 datos no significa lo que usted cree.


 Problemas de calidad de datos son
    costosas en tiempo y dinero.


   JOSÉ CUARTAS       INFORMÁTICA     3
Los malos datos y datos malos.

El mal diseño de información .Si compras una medicina que no
requiere de receta médica, y no indica cuanto y cuando hay que consumirla,
(Busco una solución, voy donde el medico, chaman o alguien que resuelva).
     "La cultura de la duda“

     “La peor decisión es la indecisión” Benjamin Frankiln

La mala información. Se tienes la certeza de estar consumiendo la
medicina de manera correcta, aunque no sea cierto.

Nunca olvide
“las decisiones de hoy son las consecuencias de mañana”

        JOSÉ CUARTAS           INFORMÁTICA                            4
Datos




        http://es.wikipedia.org/wiki/Dato
Cuando los DATOS son VALIDOS hay MAYOR confianza
para la TOMA DE DECISIONES.
    JOSÉ CUARTAS     INFORMÁTICA                   5
Preprocesar y Preparar Datos
• Son todas aquellas técnicas de análisis de datos que
  permite mejorar la calidad de un conjunto de datos.

   – Esto permite que las técnicas de extracción de conocimiento
     puedan obtener mayor y mejor información.
      •   mejor porcentaje de clasificación, reglas con más completitud, entre otras.




     JOSÉ CUARTAS                 INFORMÁTICA                                           6
Ventajas en la Limpieza de datos
• Unas ventajas:
  – Permite     aplicar    modelos     de
    Aprendizaje/Minería de Datos de forma
    más rápida y sencilla.

  – Patrones de más calidad, precisión e
    interoperabilidad.



   JOSÉ CUARTAS   INFORMÁTICA              7
Inconvenientoes en la Limpieza
            datos
• Unos inconvenientes:
  – No es un área totalmente estructurada con
    una metodología concreta para todos los
    problemas.

  – Cada problema puede requerir una manera
    diferente de solución.



   JOSÉ CUARTAS     INFORMÁTICA                 8
Limpieza datos
• Recolección de datos e integración: Se Obtienen los
  datos de diferentes fuentes de información, en este paso
  se resuelven los problemas de representación y
  codificación, integrando los datos desde diferentes
  fuentes con el fin de crear información homogénea, ...

• Transformación de datos: Los datos son transformados
  o consolidados para luego poder extraer información
  realizar operaciones de resúmenes de datos y
  operaciones de agregación, entre otras.



     JOSÉ CUARTAS       INFORMÁTICA                      9
No olvide
Es un procedimiento donde se recurre a métodos
de muchas disciplinas como estadísticas, análisis
exploratorio de datos minería (EDM), bases de
datos, gestión, y los metadatos.

Busque siempre la calidad en los datos, esto
mejora    notablemente   la  obtención   de
conocimiento.



    JOSÉ CUARTAS     INFORMÁTICA               10

Más contenido relacionado

Similar a Limpieza datos optimiza análisis

Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Joaquín Borrego-Díaz
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introduccióntravon1
 
Data set module 3 - spanish
Data set   module 3 - spanishData set   module 3 - spanish
Data set module 3 - spanishData-Set
 
base de datos Farmacologia
base de datos Farmacologiabase de datos Farmacologia
base de datos Farmacologiaoncesistemas2018
 
Base De Datos Farmacológica
Base De Datos FarmacológicaBase De Datos Farmacológica
Base De Datos Farmacológicaoncesistemas2018
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Proyecto nro 2 caso de estudio enfermedades cardiovasculares
Proyecto nro 2   caso de estudio enfermedades cardiovascularesProyecto nro 2   caso de estudio enfermedades cardiovasculares
Proyecto nro 2 caso de estudio enfermedades cardiovascularesDanielPerezFierro
 
Mineria de datos detencion de enfermedades
Mineria de datos detencion de enfermedadesMineria de datos detencion de enfermedades
Mineria de datos detencion de enfermedadesYennyyanethYucraMira
 
Caso de Estudio 2 - Grupo 4
Caso de Estudio 2 - Grupo 4Caso de Estudio 2 - Grupo 4
Caso de Estudio 2 - Grupo 4Trafagal Law
 
Sistemas de Información
Sistemas de Información Sistemas de Información
Sistemas de Información Ana Castañeda
 
SISTEMAS DE LA INFORMACION
SISTEMAS DE LA INFORMACIONSISTEMAS DE LA INFORMACION
SISTEMAS DE LA INFORMACIONCristianYoseri
 

Similar a Limpieza datos optimiza análisis (20)

Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introducción
 
Data set module 3 - spanish
Data set   module 3 - spanishData set   module 3 - spanish
Data set module 3 - spanish
 
informatica medica
informatica medicainformatica medica
informatica medica
 
base de datos Farmacologia
base de datos Farmacologiabase de datos Farmacologia
base de datos Farmacologia
 
Base De Datos Farmacológica
Base De Datos FarmacológicaBase De Datos Farmacológica
Base De Datos Farmacológica
 
Unidad II SIM
Unidad II SIMUnidad II SIM
Unidad II SIM
 
Unidad 2
Unidad 2 Unidad 2
Unidad 2
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Proyecto nro 2 caso de estudio enfermedades cardiovasculares
Proyecto nro 2   caso de estudio enfermedades cardiovascularesProyecto nro 2   caso de estudio enfermedades cardiovasculares
Proyecto nro 2 caso de estudio enfermedades cardiovasculares
 
Minería de Datos Proyecto
Minería de Datos ProyectoMinería de Datos Proyecto
Minería de Datos Proyecto
 
Mineria de datos detencion de enfermedades
Mineria de datos detencion de enfermedadesMineria de datos detencion de enfermedades
Mineria de datos detencion de enfermedades
 
Caso de Estudio 2 - Grupo 4
Caso de Estudio 2 - Grupo 4Caso de Estudio 2 - Grupo 4
Caso de Estudio 2 - Grupo 4
 
Sistemas de Información
Sistemas de Información Sistemas de Información
Sistemas de Información
 
Matemática y Data Science
Matemática y Data ScienceMatemática y Data Science
Matemática y Data Science
 
Data mining
Data miningData mining
Data mining
 
SISTEMAS DE LA INFORMACION
SISTEMAS DE LA INFORMACIONSISTEMAS DE LA INFORMACION
SISTEMAS DE LA INFORMACION
 
MDM_Sesion_1_PPT.pptx
MDM_Sesion_1_PPT.pptxMDM_Sesion_1_PPT.pptx
MDM_Sesion_1_PPT.pptx
 

Más de josecuartas

Seguridad en el almacenamiento de las bases de datos
Seguridad en el almacenamiento de las bases de datosSeguridad en el almacenamiento de las bases de datos
Seguridad en el almacenamiento de las bases de datosjosecuartas
 
Anti patrones SQL, Modelo conceptual
Anti patrones SQL, Modelo conceptualAnti patrones SQL, Modelo conceptual
Anti patrones SQL, Modelo conceptualjosecuartas
 
Tableros de control o Dashboard
Tableros de control o DashboardTableros de control o Dashboard
Tableros de control o Dashboardjosecuartas
 
Visualizacion de datos
Visualizacion de datosVisualizacion de datos
Visualizacion de datosjosecuartas
 
De los datos a la información
De los datos a la informaciónDe los datos a la información
De los datos a la informaciónjosecuartas
 
Datos semiestructurados Xml
Datos semiestructurados XmlDatos semiestructurados Xml
Datos semiestructurados Xmljosecuartas
 
Sql DML Lenguaje de manipulación de datos
Sql DML Lenguaje de manipulación de datos Sql DML Lenguaje de manipulación de datos
Sql DML Lenguaje de manipulación de datos josecuartas
 
Bases de datos temporales
Bases de datos temporalesBases de datos temporales
Bases de datos temporalesjosecuartas
 
Transformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicoTransformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicojosecuartas
 
índices en bases de datos
índices en bases de datosíndices en bases de datos
índices en bases de datosjosecuartas
 
Sql DDL Lenguaje de definición de datos
Sql DDL Lenguaje de definición de datosSql DDL Lenguaje de definición de datos
Sql DDL Lenguaje de definición de datosjosecuartas
 
Seguridad en bases de datos
Seguridad en bases de datosSeguridad en bases de datos
Seguridad en bases de datosjosecuartas
 
Los datos en el disco duro
Los datos en el disco duroLos datos en el disco duro
Los datos en el disco durojosecuartas
 
Digramas de venn aplicado en las bases datos
Digramas de venn aplicado en las bases datosDigramas de venn aplicado en las bases datos
Digramas de venn aplicado en las bases datosjosecuartas
 
Bases de datos avanzado NOSQL
Bases de datos avanzado NOSQLBases de datos avanzado NOSQL
Bases de datos avanzado NOSQLjosecuartas
 
Disco duro bases datos
Disco duro bases datosDisco duro bases datos
Disco duro bases datosjosecuartas
 
Fuga de información
Fuga de informaciónFuga de información
Fuga de informaciónjosecuartas
 
Patrones de arquitectura Software(Capa de Datos)
Patrones de arquitectura Software(Capa de Datos)Patrones de arquitectura Software(Capa de Datos)
Patrones de arquitectura Software(Capa de Datos)josecuartas
 
Sql dinamico14042011
Sql dinamico14042011Sql dinamico14042011
Sql dinamico14042011josecuartas
 

Más de josecuartas (20)

Seguridad en el almacenamiento de las bases de datos
Seguridad en el almacenamiento de las bases de datosSeguridad en el almacenamiento de las bases de datos
Seguridad en el almacenamiento de las bases de datos
 
Anti patrones SQL, Modelo conceptual
Anti patrones SQL, Modelo conceptualAnti patrones SQL, Modelo conceptual
Anti patrones SQL, Modelo conceptual
 
Tableros de control o Dashboard
Tableros de control o DashboardTableros de control o Dashboard
Tableros de control o Dashboard
 
Visualizacion de datos
Visualizacion de datosVisualizacion de datos
Visualizacion de datos
 
De los datos a la información
De los datos a la informaciónDe los datos a la información
De los datos a la información
 
Datos semiestructurados Xml
Datos semiestructurados XmlDatos semiestructurados Xml
Datos semiestructurados Xml
 
Sql DML Lenguaje de manipulación de datos
Sql DML Lenguaje de manipulación de datos Sql DML Lenguaje de manipulación de datos
Sql DML Lenguaje de manipulación de datos
 
Bases de datos temporales
Bases de datos temporalesBases de datos temporales
Bases de datos temporales
 
Transformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicoTransformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logico
 
índices en bases de datos
índices en bases de datosíndices en bases de datos
índices en bases de datos
 
Sql DDL Lenguaje de definición de datos
Sql DDL Lenguaje de definición de datosSql DDL Lenguaje de definición de datos
Sql DDL Lenguaje de definición de datos
 
Seguridad en bases de datos
Seguridad en bases de datosSeguridad en bases de datos
Seguridad en bases de datos
 
Los datos en el disco duro
Los datos en el disco duroLos datos en el disco duro
Los datos en el disco duro
 
Digramas de venn aplicado en las bases datos
Digramas de venn aplicado en las bases datosDigramas de venn aplicado en las bases datos
Digramas de venn aplicado en las bases datos
 
Bases de datos avanzado NOSQL
Bases de datos avanzado NOSQLBases de datos avanzado NOSQL
Bases de datos avanzado NOSQL
 
Disco duro bases datos
Disco duro bases datosDisco duro bases datos
Disco duro bases datos
 
Fuga de información
Fuga de informaciónFuga de información
Fuga de información
 
Patrones de arquitectura Software(Capa de Datos)
Patrones de arquitectura Software(Capa de Datos)Patrones de arquitectura Software(Capa de Datos)
Patrones de arquitectura Software(Capa de Datos)
 
SQL avanzado
SQL avanzadoSQL avanzado
SQL avanzado
 
Sql dinamico14042011
Sql dinamico14042011Sql dinamico14042011
Sql dinamico14042011
 

Último

LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfLA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfNataliaMalky1
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024IES Vicent Andres Estelles
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteJuan Hernandez
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdfLA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdfJAVIER SOLIS NOYOLA
 
Introducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleIntroducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleJonathanCovena1
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfEDILIAGAMBOA
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas123yudy
 
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdfBIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdfCESARMALAGA4
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024gharce
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALEDUCCUniversidadCatl
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfDannyTola1
 
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxPPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxOscarEduardoSanchezC
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfDaniel Ángel Corral de la Mata, Ph.D.
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDUgustavorojas179704
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIAAbelardoVelaAlbrecht1
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docxAgustinaNuez21
 

Último (20)

LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfLA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024
 
Earth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversaryEarth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversary
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parte
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdfLA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
 
DIA INTERNACIONAL DAS FLORESTAS .
DIA INTERNACIONAL DAS FLORESTAS         .DIA INTERNACIONAL DAS FLORESTAS         .
DIA INTERNACIONAL DAS FLORESTAS .
 
Introducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo SostenibleIntroducción:Los objetivos de Desarrollo Sostenible
Introducción:Los objetivos de Desarrollo Sostenible
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdf
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas
 
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdfBIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
BIOLOGIA_banco de preguntas_editorial icfes examen de estado .pdf
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdf
 
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptxPPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
PPT GESTIÓN ESCOLAR 2024 Comités y Compromisos.pptx
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docx
 

Limpieza datos optimiza análisis

  • 2. Limpieza datos ¿Podemos interpretar los datos?¿Qué significan los campos? ¿Cuál es la clave? Las medidas? Como manejar los datos censurados? ¿Los datos se refieren a los mismos períodos de tiempo? No olvide hay fallos como: Errores tipográficos, múltiples formatos, los valores perdidos, no se entiende la especificación, entre otros. JOSÉ CUARTAS INFORMÁTICA 2
  • 3. Limpieza datos En general, se tiene un problema si los datos no significa lo que usted cree. Problemas de calidad de datos son costosas en tiempo y dinero. JOSÉ CUARTAS INFORMÁTICA 3
  • 4. Los malos datos y datos malos. El mal diseño de información .Si compras una medicina que no requiere de receta médica, y no indica cuanto y cuando hay que consumirla, (Busco una solución, voy donde el medico, chaman o alguien que resuelva). "La cultura de la duda“ “La peor decisión es la indecisión” Benjamin Frankiln La mala información. Se tienes la certeza de estar consumiendo la medicina de manera correcta, aunque no sea cierto. Nunca olvide “las decisiones de hoy son las consecuencias de mañana” JOSÉ CUARTAS INFORMÁTICA 4
  • 5. Datos http://es.wikipedia.org/wiki/Dato Cuando los DATOS son VALIDOS hay MAYOR confianza para la TOMA DE DECISIONES. JOSÉ CUARTAS INFORMÁTICA 5
  • 6. Preprocesar y Preparar Datos • Son todas aquellas técnicas de análisis de datos que permite mejorar la calidad de un conjunto de datos. – Esto permite que las técnicas de extracción de conocimiento puedan obtener mayor y mejor información. • mejor porcentaje de clasificación, reglas con más completitud, entre otras. JOSÉ CUARTAS INFORMÁTICA 6
  • 7. Ventajas en la Limpieza de datos • Unas ventajas: – Permite aplicar modelos de Aprendizaje/Minería de Datos de forma más rápida y sencilla. – Patrones de más calidad, precisión e interoperabilidad. JOSÉ CUARTAS INFORMÁTICA 7
  • 8. Inconvenientoes en la Limpieza datos • Unos inconvenientes: – No es un área totalmente estructurada con una metodología concreta para todos los problemas. – Cada problema puede requerir una manera diferente de solución. JOSÉ CUARTAS INFORMÁTICA 8
  • 9. Limpieza datos • Recolección de datos e integración: Se Obtienen los datos de diferentes fuentes de información, en este paso se resuelven los problemas de representación y codificación, integrando los datos desde diferentes fuentes con el fin de crear información homogénea, ... • Transformación de datos: Los datos son transformados o consolidados para luego poder extraer información realizar operaciones de resúmenes de datos y operaciones de agregación, entre otras. JOSÉ CUARTAS INFORMÁTICA 9
  • 10. No olvide Es un procedimiento donde se recurre a métodos de muchas disciplinas como estadísticas, análisis exploratorio de datos minería (EDM), bases de datos, gestión, y los metadatos. Busque siempre la calidad en los datos, esto mejora notablemente la obtención de conocimiento. JOSÉ CUARTAS INFORMÁTICA 10