SlideShare una empresa de Scribd logo
1 de 54
El Proceso de la Minería de Datos Ing. Samuel Oporto Díaz (Mag) [email_address]
Mapa del Curso
Tabla de Contenido ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
METODOLOGIAS PARA LA MINERIA DE DATOS
CRIPS
CRIPS - DM ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Visión general Comprensión del negocio Comprensión de los datos Preparación de los datos Modelación Evaluación Despliegue de resultados DATOS
Fases Determinación de los objetivos. Definición de Criterios de Éxito. Calificación de la Situación. Determinación de las metas de la Minería de datos Recolectar los datos iniciales. Descripción de los datos. Exploración de los Datos. Verificación de la Calidad de los datos. Selección de Datos. Limpieza de los Datos. Construcción de Nuevos Datos. Formateo de los Datos. Selección de la Técnica de Modelación. Generación de Pruebas para el Modelo. Construcción del Modelo. Calificación del Modelo. Aplicación del modelo a la rutina diaria. Monitoreo y mantenimiento. Reporte Final Evaluación del modelo con respecto a los objetivos del proyecto. Evaluación costo-beneficio. Evaluar su aplicación en la realidad Comprensión de negocio Entendimiento de datos Preparación de datos Modelado Evaluación Despliegue de resultados
SEMMA
SEMMA ,[object Object],[object Object],[object Object]
SEMMA ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
SEMMA ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Uso de la metodologías ,[object Object]
Comparación SEMMA CRISP Orientado al desarrollo del proceso de MD Orientado a los objetivos empresariales Se inicia analizando los datos Se inicia analizando los objetivos del negocio Ligada a productos SAS Metodología abierta y gratuita Orientado a una metodología de  gestión de proyectos
EL PROCESO DE LA MINERÍA DE DATOS
El Proceso de la Minería de Datos Explotación Data Selección Conocimiento Patrones Minería de Datos Interpretación/ Evaluación Preparación de Datos Data Pre-procesada Datos Modelos Despliegue inducción deducción
El Proceso de la Minería de Datos ,[object Object],[object Object],[object Object],[object Object],[object Object]
El Proceso de la Minería de Datos Data Objetivo Data Pre-procesada Data Transformada Patrones Fuentes de datos Pre-procesamiento Exploración y transformación Reconocimiento de Patrones Evaluación e Interpretación Data cruda DHW DBMS Texto Evaluación y Entendimiento ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Reportes y Visualización ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
CRIPS
Jerarquía
Fases
Tareas Genéricas y Resultados
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD ( 1 )
Comprensión de negocio
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD ( 2 )
Entendimiento de los Datos
Entendimiento de los Datos Recolección de datos iníciales Descripción de los datos Exploración de los datos Verificación de la calidad de los datos univariada multivariada series de datos
[object Object],[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD ( 3 ) 60% del tiempo
Preparación de los Datos
Preparación de los Datos Limpieza de datos Integración de Datos Transformación de datos Reducción de datos Valores extremos Valores null Valores con ruido Valores inconsistentes Valores mal clasificados Problemas de semántica ¿significa lo mismo? Problemas de temporalidad ¿cuándo fue registrado? Problemas de codificación y formato. Problemas de idioma. Problemas de duplicidad ¿cuál vale? Problema de medio de almacenamiento. Filas: suma y agregación de datos  Columnas: log, sin, exp, tan, etc… Funciones entre columnas.
[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD( 4) D P ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Modelado
Modelos de Minería de Datos ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],P D D D P
[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD( 5)
Evaluación del Modelo
Evaluación de Modelos Matriz de confusión Curva ROC Lift charts
[object Object],[object Object],[object Object],[object Object],[object Object],Fases en el proceso de MD( 6) ,[object Object],[object Object],[object Object]
Explotación de Resultados
ESTÁNDARES PARA LA MINERIA DE DATOS
Estándares ,[object Object],[object Object],[object Object],[object Object],[object Object],CREATE MINING MODEL  [Heart_Health Prediction] [ID] Int Key, [Age] Int, [Smoker] Int, [Salary] Double discretized, [HeartAttack] Int PREDICT,  USING [Decision_Trees_101] INSERT INTO  [Heart_Health Prediction] ([ID], [Age], [Smoker], [Salary]) SELECT [ID],[Age], [Smoker], [Salary]  FROM Patient_Medical M, Patient_Financial F WHERE M.ID = F.ID SELECT  t.[ID], [Heart_Health  Prediction].[HeartAttack] FROM [Heart_Health Prediction] PREDICTION JOIN ( SELECT [ID],[Age],[Smoker],[Salary] FROM Patient_Medical M, Patient_Financial F WHERE M.ID = F.ID) as t ON [Heart_Health Prediction].Age = t.Age AND [Heath_Health Prediction].Smoker = t.Smoker AND [Heart_Health Prediction].Salary = t.Salary Identifica las columnas de entrenamiento, la columna a predecir y el algoritmo de minería de datos El INSERT representa los datos usados para el entrenamiento del modelo Usa el modelo entrenado y los datos actuales para hacer predicciones
Estándares ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Estándares ,[object Object],[object Object],[object Object],[object Object],[object Object]
HERRAMIENTAS DE SOFTWARE PARA MINERÍA DE DATOS
SAS System
SQL Server Data Mining
ORACLE DATA MINING
IBM - DB2 Intelligent Miner
SPSS Data Mining Pack
Clementine
Weka
XLMiner
Bibliografía ,[object Object],[object Object],[object Object],[object Object]
PREGUNTAS
Mg. Samuel Oporto Díaz [email_address] http://www.wiphala.net/oporto

Más contenido relacionado

La actualidad más candente

Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Mapa conceptual Arquitecto de Software
Mapa conceptual Arquitecto de SoftwareMapa conceptual Arquitecto de Software
Mapa conceptual Arquitecto de SoftwareTrabajo92
 
Metodologías CMMI y PMI
Metodologías CMMI y  PMIMetodologías CMMI y  PMI
Metodologías CMMI y PMIMiguel Veces
 
Proceso de Gestión de Riesgos - Soporte Informático
Proceso de Gestión de Riesgos - Soporte InformáticoProceso de Gestión de Riesgos - Soporte Informático
Proceso de Gestión de Riesgos - Soporte InformáticoOscar Felipe Camacho Carrillo
 
Plantilla para realizar un manual de usuario de software
Plantilla para realizar un manual de usuario de software Plantilla para realizar un manual de usuario de software
Plantilla para realizar un manual de usuario de software Yaskelly Yedra
 
Tablero Comando
Tablero ComandoTablero Comando
Tablero Comandoazogue
 
DISEÑO DE SALIDA DE SISTEMAS
DISEÑO DE SALIDA DE SISTEMAS DISEÑO DE SALIDA DE SISTEMAS
DISEÑO DE SALIDA DE SISTEMAS passodobles115
 
Diagrama desecuenciabiblioteca 1
Diagrama desecuenciabiblioteca 1Diagrama desecuenciabiblioteca 1
Diagrama desecuenciabiblioteca 11052403005n
 
Organigrama de un departamento de sistema by ESRL
Organigrama de un departamento de sistema by ESRLOrganigrama de un departamento de sistema by ESRL
Organigrama de un departamento de sistema by ESRLEmilio_Romano
 
Gestión de riesgos de seguridad de la información - ISO 27005
Gestión de riesgos de seguridad de la información - ISO 27005Gestión de riesgos de seguridad de la información - ISO 27005
Gestión de riesgos de seguridad de la información - ISO 27005Maricarmen García de Ureña
 
Modelo de madurez de business intelligence
Modelo de madurez de business intelligenceModelo de madurez de business intelligence
Modelo de madurez de business intelligenceGravitar1
 
Alineación estratégica de TI al negocio
Alineación estratégica de TI al negocioAlineación estratégica de TI al negocio
Alineación estratégica de TI al negocioEnrique Fiorenza
 

La actualidad más candente (20)

Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Mapa conceptual Arquitecto de Software
Mapa conceptual Arquitecto de SoftwareMapa conceptual Arquitecto de Software
Mapa conceptual Arquitecto de Software
 
Metodologías CMMI y PMI
Metodologías CMMI y  PMIMetodologías CMMI y  PMI
Metodologías CMMI y PMI
 
Proceso de Gestión de Riesgos - Soporte Informático
Proceso de Gestión de Riesgos - Soporte InformáticoProceso de Gestión de Riesgos - Soporte Informático
Proceso de Gestión de Riesgos - Soporte Informático
 
ETL
ETLETL
ETL
 
Perfiles UML
Perfiles UMLPerfiles UML
Perfiles UML
 
Plantilla para realizar un manual de usuario de software
Plantilla para realizar un manual de usuario de software Plantilla para realizar un manual de usuario de software
Plantilla para realizar un manual de usuario de software
 
Tablero Comando
Tablero ComandoTablero Comando
Tablero Comando
 
Mefe
MefeMefe
Mefe
 
DISEÑO DE SALIDA DE SISTEMAS
DISEÑO DE SALIDA DE SISTEMAS DISEÑO DE SALIDA DE SISTEMAS
DISEÑO DE SALIDA DE SISTEMAS
 
Sistemas Expertos
Sistemas ExpertosSistemas Expertos
Sistemas Expertos
 
Metodo zopp
Metodo zoppMetodo zopp
Metodo zopp
 
Diagrama desecuenciabiblioteca 1
Diagrama desecuenciabiblioteca 1Diagrama desecuenciabiblioteca 1
Diagrama desecuenciabiblioteca 1
 
Organigrama de un departamento de sistema by ESRL
Organigrama de un departamento de sistema by ESRLOrganigrama de un departamento de sistema by ESRL
Organigrama de un departamento de sistema by ESRL
 
El proceso de la investigacion de mercados
El proceso de la investigacion de mercadosEl proceso de la investigacion de mercados
El proceso de la investigacion de mercados
 
3.5 tipos de riesgos
3.5 tipos de riesgos3.5 tipos de riesgos
3.5 tipos de riesgos
 
Gestión de riesgos de seguridad de la información - ISO 27005
Gestión de riesgos de seguridad de la información - ISO 27005Gestión de riesgos de seguridad de la información - ISO 27005
Gestión de riesgos de seguridad de la información - ISO 27005
 
Sistemas de informacion gerencial diapositivas
Sistemas de informacion gerencial diapositivasSistemas de informacion gerencial diapositivas
Sistemas de informacion gerencial diapositivas
 
Modelo de madurez de business intelligence
Modelo de madurez de business intelligenceModelo de madurez de business intelligence
Modelo de madurez de business intelligence
 
Alineación estratégica de TI al negocio
Alineación estratégica de TI al negocioAlineación estratégica de TI al negocio
Alineación estratégica de TI al negocio
 

Destacado (20)

MIneria de datos
MIneria de datosMIneria de datos
MIneria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentación colombia junio 2011
Presentación colombia   junio 2011Presentación colombia   junio 2011
Presentación colombia junio 2011
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Ejemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaEjemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en Weka
 
Datamingse
DatamingseDatamingse
Datamingse
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con R
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Make Growth Happen for all Employees
Make Growth Happen for all EmployeesMake Growth Happen for all Employees
Make Growth Happen for all Employees
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 

Similar a mineria de datos

Similar a mineria de datos (20)

Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL Server
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Clase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd acClase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd ac
 
02000 metodo validacion
02000 metodo validacion02000 metodo validacion
02000 metodo validacion
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Minería datos con SQL Server 2012
Minería datos con SQL Server 2012Minería datos con SQL Server 2012
Minería datos con SQL Server 2012
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Almacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datosAlmacenes, mineria y análisis de datos
Almacenes, mineria y análisis de datos
 
U3 foro semana 14
U3 foro   semana 14U3 foro   semana 14
U3 foro semana 14
 
Machine Learning en Recursos Humanos
Machine Learning en Recursos HumanosMachine Learning en Recursos Humanos
Machine Learning en Recursos Humanos
 
Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
Diapositiva 1
Diapositiva 1Diapositiva 1
Diapositiva 1
 
Electiva iii parcial 2 - 02-minería de datos
Electiva iii   parcial 2 - 02-minería de datosElectiva iii   parcial 2 - 02-minería de datos
Electiva iii parcial 2 - 02-minería de datos
 
Diapositiva d
Diapositiva dDiapositiva d
Diapositiva d
 
Diapositiva 1
Diapositiva 1Diapositiva 1
Diapositiva 1
 
Modulo 1 - Modulo 2 (subir).pptx
Modulo 1 - Modulo 2 (subir).pptxModulo 1 - Modulo 2 (subir).pptx
Modulo 1 - Modulo 2 (subir).pptx
 
Md session1
Md session1Md session1
Md session1
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 

Más de UNAM Facultad de Contaduría, Administración e Informática

Más de UNAM Facultad de Contaduría, Administración e Informática (20)

Bimbo Logística.pdf
Bimbo Logística.pdfBimbo Logística.pdf
Bimbo Logística.pdf
 
HISTORIA DEL CIELO DE CAMILO FLAMARION.pdf
HISTORIA DEL CIELO DE CAMILO FLAMARION.pdfHISTORIA DEL CIELO DE CAMILO FLAMARION.pdf
HISTORIA DEL CIELO DE CAMILO FLAMARION.pdf
 
Apuntes prospectiva
Apuntes prospectivaApuntes prospectiva
Apuntes prospectiva
 
Caso kit kat
Caso kit katCaso kit kat
Caso kit kat
 
Glosario clase mundial
Glosario clase mundialGlosario clase mundial
Glosario clase mundial
 
Clasificacion de-los-costos
Clasificacion de-los-costosClasificacion de-los-costos
Clasificacion de-los-costos
 
El cross docking como herramienta importante en la cadena de abastecimiento..
El cross   docking como herramienta importante en la cadena de abastecimiento..El cross   docking como herramienta importante en la cadena de abastecimiento..
El cross docking como herramienta importante en la cadena de abastecimiento..
 
Conceptosestrategicosyfinancierosparaelexito
ConceptosestrategicosyfinancierosparaelexitoConceptosestrategicosyfinancierosparaelexito
Conceptosestrategicosyfinancierosparaelexito
 
Admon de la demanda
Admon de la demandaAdmon de la demanda
Admon de la demanda
 
Prototipo de producto
Prototipo de productoPrototipo de producto
Prototipo de producto
 
Los 7 practica
Los 7 practicaLos 7 practica
Los 7 practica
 
Determinacion costos-productos-y-servicios-principales
Determinacion costos-productos-y-servicios-principalesDeterminacion costos-productos-y-servicios-principales
Determinacion costos-productos-y-servicios-principales
 
Admnnistracion de mercados
Admnnistracion de mercadosAdmnnistracion de mercados
Admnnistracion de mercados
 
Los_7_habitos_de_la_gente_altamente_eefectiva
  Los_7_habitos_de_la_gente_altamente_eefectiva  Los_7_habitos_de_la_gente_altamente_eefectiva
Los_7_habitos_de_la_gente_altamente_eefectiva
 
Teoria de inventarios
Teoria de inventariosTeoria de inventarios
Teoria de inventarios
 
Top down and bottom up
Top down and bottom upTop down and bottom up
Top down and bottom up
 
Clasificacion de-los-costos
Clasificacion de-los-costosClasificacion de-los-costos
Clasificacion de-los-costos
 
Glosario de terminos logisticos (1)
Glosario de terminos logisticos (1)Glosario de terminos logisticos (1)
Glosario de terminos logisticos (1)
 
Sistemay mercadosfinancieros
Sistemay mercadosfinancierosSistemay mercadosfinancieros
Sistemay mercadosfinancieros
 
Mba finanzas1 1-eoctablero financieroigt
Mba finanzas1 1-eoctablero financieroigtMba finanzas1 1-eoctablero financieroigt
Mba finanzas1 1-eoctablero financieroigt
 

Último

c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxMartín Ramírez
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfDaniel Ángel Corral de la Mata, Ph.D.
 
La evolucion de la especie humana-primero de secundaria
La evolucion de la especie humana-primero de secundariaLa evolucion de la especie humana-primero de secundaria
La evolucion de la especie humana-primero de secundariamarco carlos cuyo
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfEDILIAGAMBOA
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIAAbelardoVelaAlbrecht1
 
Estrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfEstrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfromanmillans
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdfLA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdfJAVIER SOLIS NOYOLA
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
ÉTICA, NATURALEZA Y SOCIEDADES_3RO_3ER TRIMESTRE.pdf
ÉTICA, NATURALEZA Y SOCIEDADES_3RO_3ER TRIMESTRE.pdfÉTICA, NATURALEZA Y SOCIEDADES_3RO_3ER TRIMESTRE.pdf
ÉTICA, NATURALEZA Y SOCIEDADES_3RO_3ER TRIMESTRE.pdfluisantoniocruzcorte1
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas123yudy
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdfOswaldoGonzalezCruz
 
Plan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPEPlan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPELaura Chacón
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfcoloncopias5
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDUgustavorojas179704
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...fcastellanos3
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfDannyTola1
 

Último (20)

c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
 
La evolucion de la especie humana-primero de secundaria
La evolucion de la especie humana-primero de secundariaLa evolucion de la especie humana-primero de secundaria
La evolucion de la especie humana-primero de secundaria
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdf
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
Estrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfEstrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdf
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdfLA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS.pdf
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
ÉTICA, NATURALEZA Y SOCIEDADES_3RO_3ER TRIMESTRE.pdf
ÉTICA, NATURALEZA Y SOCIEDADES_3RO_3ER TRIMESTRE.pdfÉTICA, NATURALEZA Y SOCIEDADES_3RO_3ER TRIMESTRE.pdf
ÉTICA, NATURALEZA Y SOCIEDADES_3RO_3ER TRIMESTRE.pdf
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
 
Unidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDIUnidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDI
 
Plan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPEPlan Año Escolar Año Escolar 2023-2024. MPPE
Plan Año Escolar Año Escolar 2023-2024. MPPE
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
 
VISITA À PROTEÇÃO CIVIL _
VISITA À PROTEÇÃO CIVIL                  _VISITA À PROTEÇÃO CIVIL                  _
VISITA À PROTEÇÃO CIVIL _
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdf
 
TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 

mineria de datos

  • 1. El Proceso de la Minería de Datos Ing. Samuel Oporto Díaz (Mag) [email_address]
  • 3.
  • 4. METODOLOGIAS PARA LA MINERIA DE DATOS
  • 6.
  • 7. Visión general Comprensión del negocio Comprensión de los datos Preparación de los datos Modelación Evaluación Despliegue de resultados DATOS
  • 8. Fases Determinación de los objetivos. Definición de Criterios de Éxito. Calificación de la Situación. Determinación de las metas de la Minería de datos Recolectar los datos iniciales. Descripción de los datos. Exploración de los Datos. Verificación de la Calidad de los datos. Selección de Datos. Limpieza de los Datos. Construcción de Nuevos Datos. Formateo de los Datos. Selección de la Técnica de Modelación. Generación de Pruebas para el Modelo. Construcción del Modelo. Calificación del Modelo. Aplicación del modelo a la rutina diaria. Monitoreo y mantenimiento. Reporte Final Evaluación del modelo con respecto a los objetivos del proyecto. Evaluación costo-beneficio. Evaluar su aplicación en la realidad Comprensión de negocio Entendimiento de datos Preparación de datos Modelado Evaluación Despliegue de resultados
  • 10.
  • 11.
  • 12.
  • 13.
  • 14. Comparación SEMMA CRISP Orientado al desarrollo del proceso de MD Orientado a los objetivos empresariales Se inicia analizando los datos Se inicia analizando los objetivos del negocio Ligada a productos SAS Metodología abierta y gratuita Orientado a una metodología de gestión de proyectos
  • 15. EL PROCESO DE LA MINERÍA DE DATOS
  • 16. El Proceso de la Minería de Datos Explotación Data Selección Conocimiento Patrones Minería de Datos Interpretación/ Evaluación Preparación de Datos Data Pre-procesada Datos Modelos Despliegue inducción deducción
  • 17.
  • 18.
  • 19. CRIPS
  • 21. Fases
  • 22. Tareas Genéricas y Resultados
  • 23.
  • 25.
  • 27. Entendimiento de los Datos Recolección de datos iníciales Descripción de los datos Exploración de los datos Verificación de la calidad de los datos univariada multivariada series de datos
  • 28.
  • 30. Preparación de los Datos Limpieza de datos Integración de Datos Transformación de datos Reducción de datos Valores extremos Valores null Valores con ruido Valores inconsistentes Valores mal clasificados Problemas de semántica ¿significa lo mismo? Problemas de temporalidad ¿cuándo fue registrado? Problemas de codificación y formato. Problemas de idioma. Problemas de duplicidad ¿cuál vale? Problema de medio de almacenamiento. Filas: suma y agregación de datos Columnas: log, sin, exp, tan, etc… Funciones entre columnas.
  • 31.
  • 33.
  • 34.
  • 36. Evaluación de Modelos Matriz de confusión Curva ROC Lift charts
  • 37.
  • 39. ESTÁNDARES PARA LA MINERIA DE DATOS
  • 40.
  • 41.
  • 42.
  • 43. HERRAMIENTAS DE SOFTWARE PARA MINERÍA DE DATOS
  • 45. SQL Server Data Mining
  • 47. IBM - DB2 Intelligent Miner
  • 50. Weka
  • 52.
  • 54. Mg. Samuel Oporto Díaz [email_address] http://www.wiphala.net/oporto

Notas del editor

  1. Mine for: Selection Aggregation Abstraction Visualization Transformation/Conversion Statistical Analysis “ Cleaning”