SlideShare una empresa de Scribd logo
1 de 33
Descargar para leer sin conexión
Universidad Autónoma del Estado de México
Material didáctico multimedia
Sólo visión
Título del material: La metodología CRISP-DM
Unidad de Aprendizaje Minería de Datos
Licenciatura de Ingeniería en Computación
Facultad de Ingeniería
Elaborado por M en I Sara Vera Noguez
Durante el período intensivo verano 2016
Unidad 5. 2
•Minería de datos
•Unidad 5. Metodología CRISP-
DM y minería de datos
complejos
M en I Sara Vera Noguez
Unidad 5. 3
Contenido
● MetodologíaCRIPS-DM
● Ciclo en espiral para proyectos de minería
Unidad 5. 4
Modelos de proceso para desarrollo de SI
● ¿Qué nos proponen los modelos de procesos par el
desarrollo de software?
● ¿Qué flujos de trabajo tiene la metodología del
Proceso Unificado?
Unidad 5. 5
¿Para qué un proceso?
(Whitten, p. 49, 2008)
Unidad 5. 6
¿Para qué un proceso?
● Los modelos de proceso nos brindan una guía.
● Se pretende:
● Reducir el riesgo del proyecto
● Aumentar la productividad del equipo de trabajo
● Obtener experiencia
(Whitten, p. 49, 2008)
Unidad 5. 7
Qué nos dice el proceso
● Nos brinda un panorama general
● Nos dice que hacer
● No explica cómo hacer las actividades
● Se complementa con las metodologías
Unidad 5. 8
Recordando UP
Fuente: Booch
Unidad 5. 9
Recordando XP
Fuente: Pressman
Unidad 5. 10
Semejanzas y diferencias
● Se basa en el enfoque de sistemas
● El desarrollo surge de necesidades de su contexto
● Los requerimientos son la guía del desarrollo
● El flujo de trabajo (actividad) de diseño e
implementación se basa en las herramientas para la
implementación.
● ¿Cómo implementar minería de datos?
Fuente: Pressman
Unidad 5. 11
La metodología CRISP-DM
Unidad 5. 12
La metodología CRISP-DM
● Comprensión del negocio (Objetivos y requerimientos desde
una perspectiva no técnica)
● Comprensión de los datos (Familiarizarse con los datos teniendo
presente los objetivos del negocio)
● Preparación de los datos (Obtener la vista minable o dataset)
● Modelado (Aplicar las técnicas de minería de datos a los dataset)
● Evaluación (De los modelos de la fase anteriores para
determinar si son útiles a las necesidades del negocio)
● Despliegue (Explotar utilidad de los modelos, integrándolos en
las tareas de toma de decisiones de la organización)
Unidad 5. 13
La metodología CRISP-DM
● Comprensión del negocio (Objetivos y requerimientos
desde una perspectiva no técnica)
Establecimiento de los objetivos del negocio (Contexto
inicial, objetivos, criterios de éxito)
Evaluación de la situación (Inventario de recursos,
requerimientos, supuestos, terminologías propias del
negocio,…)
Establecimiento de los objetivos de la minería de datos
(objetivos y criterios de éxito)
Generación del plan del proyecto (plan, herramientas,
equipo y técnicas)
Unidad 5. 14
La metodología CRISP-DM
● Comprensión del negocio (Esto se puede hacer por
ejemplo como en UP, mediante el modelado
organizacional, o a la manera de XP, mediante charlas
con el personal de la organización)
Unidad 5. 15
La metodología CRISP-DM
● Comprensión de los datos (Familiarizarse con los
datos teniendo presente los objetivos del negocio)
Recopilación inicial de datos
Descripción de los datos
Exploración de los datos
Verificación de calidad de datos
Unidad 5. 16
La metodología CRISP-DM
● Preparación de los datos (Obtener la vista minable o
dataset)
Selección de los datos
Limpieza de datos
Construcción de datos
Integración de datos
Formateo de datos
Unidad 5. 17
La metodología CRISP-DM
● Modelado (Aplicar las técnicas de minería de datos a
los dataset)
Selección de la técnica de modelado
Diseño de la evaluación
Construcción del modelo
Evaluación del modelo
Unidad 5. 18
La metodología CRISP-DM
● Evaluación (De los modelos de la fase anteriores para
determinar si son útiles a las necesidades del negocio)
Evaluación de resultados
Revisar el proceso
Establecimiento de los siguientes pasos o acciones
Unidad 5. 19
La metodología CRISP-DM
● Despliegue (Explotar utilidad de los modelos,
integrándolos en las tareas de toma de decisiones de
la organización)
Planificación de despliegue
Planificación de la monitorización y del
mantenimiento
Generación de informe final
Revisión del proyecto
Unidad 5. 20
Actividad
● De forma individual realiza un resumen de las tareas
que se debe hacer de acuerdo a la metodología
CRISP-DM
Unidad 5. 21
Actividad
● En equipos de tres integrantes propone mecanismo
concretos tomados de UP, XP, bases de datos, UML, u
otra notación o metodología para plasmar los
resultados de las tareas propuestas por CRISP-DM
Unidad 5. 22
Repaso
Unidad 5. 23
Como lo plantea UP
Fuente: Booch
Unidad 5. 24
El proceso de desarrollo
• En pocas palabras es:
● Identificar requerimientos
● Diseñar una solución
● Implementar
● Probar
Unidad 5. 25
Productos generados en UP
● Del modelado del negocio se obtiene un modelo que
incluye diversas vistas de la organización como una
vista externa, una estructural y una de sus procesos
(dinámica); es el insumo para la identificación de los
requisitos
● Del flujo de requisitos se obtiene los requerimientos
funcionales (¿qué?) plasmados en los casos de uso y
los no funcionales (¿con qué?)
Fuente: Booch
Unidad 5. 26
UP
● Flujo de trabajo de análisis y diseño: se analizan los
requerimientos, se especifica la arquitectura de la
solución que incluye módulos, interfaces,
persistencia (diseño de las BD), se planea la
colaboración entre componentes (diagramas de
secuencia y de colaboración), algorítmos.
Unidad 5. 27
UP
● En el flujo de implementación se genera el código que
materializa el diseño.
● El flujo de trabajo de pruebas se realiza a lo largo de
todo el proceso buscando probar o validar los distintos
productos generados
● Finalmente en el despliegue el software es emplazado
en el hardware para su operación cotidiana
Unidad 5. 28
CRISP-DM y UP
Unidad 5. 29
CRISP-DM y UP
Modelado de negocio
Modelado de negocio
Y /o
Requerimientos no funcionales
Conlleva análisis, diseño,
implementación y pruebas
Conlleva análisis, diseño,
implementación y pruebas
Es parte de las pruebas
Se realiza durante el
despliegue
Unidad 5. 30
Actividad
● En equipos contrastar sus propuesta de la actividad
anterior con lo mostrado en la diapositiva número 27
Unidad 5. 31
Conclusión
● Los flujos de trabajo del modelo no cambian
● Se debe incluir en los flujos de trabajo las tareas
propias de la minería de datos
Unidad 5. 32
Bibliografía básica
● HernándezOrallo, J., M. J. Ramírez Quintana, et al.
(2004). Introducción a la Mineria de Datos. España,
Pearson Educación SA.
● Han, D. J. (2007). Principles of Data Mining, MIT Press.
● https://anibalgoicochea.com/2009/08/11/crisp-dm-
una-metodologia-para-proyectos-de-mineria-de-
datos/
Unidad 5. 33
Bibliografía complementaria
● Everitt, B.S. (1994). A Handbook of Statistical Analyses using S-Plus. Chapman and Hall.
● Inmon,W.H. (1996). Building the Datawarehouse. J.Wiley & Sons.
● Han, J. and M. Kamber (2006). Data mining: concepts and techniques, Morgan Kaufmann.
● Kimball, R (1996).The Data WarehouseToolkit. JohnWiley & Sons.
● Hastie, T., R.Tibshirani, et al. (2005). The elements of statistical learning: data mining,
inference and prediction, Springer
● Dunham. H. Margaret (2003). Data Mining. Introductory and AdvancedTopics, Prentice Hall.
● Pyle, D. (1999), "Data Preparation for Data Mining", Morgan Kaufmann, San Francisco, CA.
● Hand, David; Mannila, Heikki; Smyth, Padhraic (2001), Principles of Data Mining, A Bradford
Book.The MIT Press.
● IanWitten and Eibe Frank (2002), Data Mining, Practical Machine LearningTools and
Techniques with Java Implementations, Morgan Kaufmann Publishers.

Más contenido relacionado

Similar a CRISP-DM

Administración de proyectos de ti unfv 2014 1
Administración de proyectos de ti  unfv 2014 1Administración de proyectos de ti  unfv 2014 1
Administración de proyectos de ti unfv 2014 1Juan Blas Veliz
 
Metodología integradora de procesos empresariales
Metodología integradora de procesos empresarialesMetodología integradora de procesos empresariales
Metodología integradora de procesos empresarialeskatyorderiqued
 
Metodologìa integradora de procesos empresariales
Metodologìa integradora de procesos empresarialesMetodologìa integradora de procesos empresariales
Metodologìa integradora de procesos empresarialesLesber DC
 
Protocolo de tesis | Maestría en Medios Interactivos
Protocolo de tesis | Maestría en Medios InteractivosProtocolo de tesis | Maestría en Medios Interactivos
Protocolo de tesis | Maestría en Medios InteractivosHermenegildo Fernández
 
Plan de estudio de planificacion
Plan de estudio de planificacionPlan de estudio de planificacion
Plan de estudio de planificacionJulio
 
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptxINTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptxCabezaDePinga
 
Solución de problemas Empresariales con Sistemas de Información
Solución de problemas Empresariales con Sistemas de InformaciónSolución de problemas Empresariales con Sistemas de Información
Solución de problemas Empresariales con Sistemas de Informaciónvane94
 
Líneas de productos de software y metodo watch
Líneas de productos de software y metodo watchLíneas de productos de software y metodo watch
Líneas de productos de software y metodo watchLisbett Montaño
 
Moprosoft, el modelo mexicano
Moprosoft, el modelo mexicanoMoprosoft, el modelo mexicano
Moprosoft, el modelo mexicanoRodolfo Santara
 
Sistemas_de_Informacion.ppt
Sistemas_de_Informacion.pptSistemas_de_Informacion.ppt
Sistemas_de_Informacion.pptPedroFalcn
 

Similar a CRISP-DM (20)

Modelo psp
Modelo pspModelo psp
Modelo psp
 
inf-162 presentacion
inf-162 presentacioninf-162 presentacion
inf-162 presentacion
 
Administración de proyectos de ti unfv 2014 1
Administración de proyectos de ti  unfv 2014 1Administración de proyectos de ti  unfv 2014 1
Administración de proyectos de ti unfv 2014 1
 
Metodología integradora de procesos empresariales
Metodología integradora de procesos empresarialesMetodología integradora de procesos empresariales
Metodología integradora de procesos empresariales
 
11V03-V1_MEJORADO_2_8H.pptx
11V03-V1_MEJORADO_2_8H.pptx11V03-V1_MEJORADO_2_8H.pptx
11V03-V1_MEJORADO_2_8H.pptx
 
Metodologìa integradora de procesos empresariales
Metodologìa integradora de procesos empresarialesMetodologìa integradora de procesos empresariales
Metodologìa integradora de procesos empresariales
 
Protocolo de tesis | Maestría en Medios Interactivos
Protocolo de tesis | Maestría en Medios InteractivosProtocolo de tesis | Maestría en Medios Interactivos
Protocolo de tesis | Maestría en Medios Interactivos
 
Plan de estudio de planificacion
Plan de estudio de planificacionPlan de estudio de planificacion
Plan de estudio de planificacion
 
Msf
MsfMsf
Msf
 
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptxINTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
INTRODUCCIÓN A LA CIENCIA DE DATOS.pptx
 
SAP
SAPSAP
SAP
 
Curso de Introducción al Modelo MPS.BR
Curso de Introducción al Modelo MPS.BRCurso de Introducción al Modelo MPS.BR
Curso de Introducción al Modelo MPS.BR
 
Metodologia DSDM
Metodologia DSDMMetodologia DSDM
Metodologia DSDM
 
16-Unidad 4: QA-4.2 Evaluación
16-Unidad 4: QA-4.2 Evaluación16-Unidad 4: QA-4.2 Evaluación
16-Unidad 4: QA-4.2 Evaluación
 
Solución de problemas Empresariales con Sistemas de Información
Solución de problemas Empresariales con Sistemas de InformaciónSolución de problemas Empresariales con Sistemas de Información
Solución de problemas Empresariales con Sistemas de Información
 
Líneas de productos de software y metodo watch
Líneas de productos de software y metodo watchLíneas de productos de software y metodo watch
Líneas de productos de software y metodo watch
 
Lectura 3
Lectura 3Lectura 3
Lectura 3
 
Moprosoft, el modelo mexicano
Moprosoft, el modelo mexicanoMoprosoft, el modelo mexicano
Moprosoft, el modelo mexicano
 
Sistemas_de_Informacion.ppt
Sistemas_de_Informacion.pptSistemas_de_Informacion.ppt
Sistemas_de_Informacion.ppt
 
Planifestratecno 2
Planifestratecno 2Planifestratecno 2
Planifestratecno 2
 

Último

stellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino morastellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino moraYessicaBrigithArdila
 
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfeluniversocom
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdfCamilaArzate2
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Ivie
 
Niveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiaNiveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiatongailustraconcienc
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405rodrimarxim
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024eluniversocom
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxYoladsCabarcasTous
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería yocelynsanchezerasmo
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILeluniversocom
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotessald071205mmcnrna9
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptxccordovato
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptxSergiothaine2
 
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADORPREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOReluniversocom
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptxESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptxKatherineFabianLoza1
 
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdfINTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdfmaryisabelpantojavar
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfhernestosoto82
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILeluniversocom
 

Último (20)

stellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino morastellaire vinos de mora SAS proyecto de vino mora
stellaire vinos de mora SAS proyecto de vino mora
 
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdfPREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
PREGUNTA A DEL REFERÉNDUM 21 DE ABRIL.pdf
 
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO    ..pdfMAPA DE RIESGOS DE UN ZOOLOGICO    ..pdf
MAPA DE RIESGOS DE UN ZOOLOGICO ..pdf
 
Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...Presentación informe 'Fondos Next Generation European Union destinados a actu...
Presentación informe 'Fondos Next Generation European Union destinados a actu...
 
Niveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologiaNiveles de organización biologica clase de biologia
Niveles de organización biologica clase de biologia
 
Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405Mapa de riesgos de un taller mecánico 405
Mapa de riesgos de un taller mecánico 405
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
PREGUNTAS Y ANEXOS CONSULTA POPULAR 2024
 
El sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptxEl sistema solar el gran descubrimiento del sistema solar .pptx
El sistema solar el gran descubrimiento del sistema solar .pptx
 
Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería Análisis de un mapa de riesgos de una tortillería
Análisis de un mapa de riesgos de una tortillería
 
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRILPREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
PREGUNTA K DE LA CONSULTA POPULAR 21 DE ABRIL
 
Módulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotesMódulo mapa de riesgos de tienda de abarrotes
Módulo mapa de riesgos de tienda de abarrotes
 
2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx2024 2024 202420242024PPT SESIÓN 03.pptx
2024 2024 202420242024PPT SESIÓN 03.pptx
 
que son los planes de ordenamiento predial POP.pptx
que son los planes de ordenamiento predial  POP.pptxque son los planes de ordenamiento predial  POP.pptx
que son los planes de ordenamiento predial POP.pptx
 
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADORPREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
PREGUNTA E REFÉRENDUM 21 DE ABRIL ECUADOR
 
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRILPREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA H DE CONSULTA POPULAR 21 DE ABRIL
 
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptxESTUDIO DE IMPACTO AMBIENTAL de  explotación minera.pptx
ESTUDIO DE IMPACTO AMBIENTAL de explotación minera.pptx
 
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdfINTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
INTRODUCCION A LA ESTADISTICA RECOLECCION DE DATOS.pdf
 
Croquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdfCroquis de riesgo de trabajo gasolinera.pdf
Croquis de riesgo de trabajo gasolinera.pdf
 
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRILPREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
PREGUNTA G DE CONSULTA POPULAR 21 DE ABRIL
 

CRISP-DM

  • 1. Universidad Autónoma del Estado de México Material didáctico multimedia Sólo visión Título del material: La metodología CRISP-DM Unidad de Aprendizaje Minería de Datos Licenciatura de Ingeniería en Computación Facultad de Ingeniería Elaborado por M en I Sara Vera Noguez Durante el período intensivo verano 2016
  • 2. Unidad 5. 2 •Minería de datos •Unidad 5. Metodología CRISP- DM y minería de datos complejos M en I Sara Vera Noguez
  • 3. Unidad 5. 3 Contenido ● MetodologíaCRIPS-DM ● Ciclo en espiral para proyectos de minería
  • 4. Unidad 5. 4 Modelos de proceso para desarrollo de SI ● ¿Qué nos proponen los modelos de procesos par el desarrollo de software? ● ¿Qué flujos de trabajo tiene la metodología del Proceso Unificado?
  • 5. Unidad 5. 5 ¿Para qué un proceso? (Whitten, p. 49, 2008)
  • 6. Unidad 5. 6 ¿Para qué un proceso? ● Los modelos de proceso nos brindan una guía. ● Se pretende: ● Reducir el riesgo del proyecto ● Aumentar la productividad del equipo de trabajo ● Obtener experiencia (Whitten, p. 49, 2008)
  • 7. Unidad 5. 7 Qué nos dice el proceso ● Nos brinda un panorama general ● Nos dice que hacer ● No explica cómo hacer las actividades ● Se complementa con las metodologías
  • 8. Unidad 5. 8 Recordando UP Fuente: Booch
  • 9. Unidad 5. 9 Recordando XP Fuente: Pressman
  • 10. Unidad 5. 10 Semejanzas y diferencias ● Se basa en el enfoque de sistemas ● El desarrollo surge de necesidades de su contexto ● Los requerimientos son la guía del desarrollo ● El flujo de trabajo (actividad) de diseño e implementación se basa en las herramientas para la implementación. ● ¿Cómo implementar minería de datos? Fuente: Pressman
  • 11. Unidad 5. 11 La metodología CRISP-DM
  • 12. Unidad 5. 12 La metodología CRISP-DM ● Comprensión del negocio (Objetivos y requerimientos desde una perspectiva no técnica) ● Comprensión de los datos (Familiarizarse con los datos teniendo presente los objetivos del negocio) ● Preparación de los datos (Obtener la vista minable o dataset) ● Modelado (Aplicar las técnicas de minería de datos a los dataset) ● Evaluación (De los modelos de la fase anteriores para determinar si son útiles a las necesidades del negocio) ● Despliegue (Explotar utilidad de los modelos, integrándolos en las tareas de toma de decisiones de la organización)
  • 13. Unidad 5. 13 La metodología CRISP-DM ● Comprensión del negocio (Objetivos y requerimientos desde una perspectiva no técnica) Establecimiento de los objetivos del negocio (Contexto inicial, objetivos, criterios de éxito) Evaluación de la situación (Inventario de recursos, requerimientos, supuestos, terminologías propias del negocio,…) Establecimiento de los objetivos de la minería de datos (objetivos y criterios de éxito) Generación del plan del proyecto (plan, herramientas, equipo y técnicas)
  • 14. Unidad 5. 14 La metodología CRISP-DM ● Comprensión del negocio (Esto se puede hacer por ejemplo como en UP, mediante el modelado organizacional, o a la manera de XP, mediante charlas con el personal de la organización)
  • 15. Unidad 5. 15 La metodología CRISP-DM ● Comprensión de los datos (Familiarizarse con los datos teniendo presente los objetivos del negocio) Recopilación inicial de datos Descripción de los datos Exploración de los datos Verificación de calidad de datos
  • 16. Unidad 5. 16 La metodología CRISP-DM ● Preparación de los datos (Obtener la vista minable o dataset) Selección de los datos Limpieza de datos Construcción de datos Integración de datos Formateo de datos
  • 17. Unidad 5. 17 La metodología CRISP-DM ● Modelado (Aplicar las técnicas de minería de datos a los dataset) Selección de la técnica de modelado Diseño de la evaluación Construcción del modelo Evaluación del modelo
  • 18. Unidad 5. 18 La metodología CRISP-DM ● Evaluación (De los modelos de la fase anteriores para determinar si son útiles a las necesidades del negocio) Evaluación de resultados Revisar el proceso Establecimiento de los siguientes pasos o acciones
  • 19. Unidad 5. 19 La metodología CRISP-DM ● Despliegue (Explotar utilidad de los modelos, integrándolos en las tareas de toma de decisiones de la organización) Planificación de despliegue Planificación de la monitorización y del mantenimiento Generación de informe final Revisión del proyecto
  • 20. Unidad 5. 20 Actividad ● De forma individual realiza un resumen de las tareas que se debe hacer de acuerdo a la metodología CRISP-DM
  • 21. Unidad 5. 21 Actividad ● En equipos de tres integrantes propone mecanismo concretos tomados de UP, XP, bases de datos, UML, u otra notación o metodología para plasmar los resultados de las tareas propuestas por CRISP-DM
  • 23. Unidad 5. 23 Como lo plantea UP Fuente: Booch
  • 24. Unidad 5. 24 El proceso de desarrollo • En pocas palabras es: ● Identificar requerimientos ● Diseñar una solución ● Implementar ● Probar
  • 25. Unidad 5. 25 Productos generados en UP ● Del modelado del negocio se obtiene un modelo que incluye diversas vistas de la organización como una vista externa, una estructural y una de sus procesos (dinámica); es el insumo para la identificación de los requisitos ● Del flujo de requisitos se obtiene los requerimientos funcionales (¿qué?) plasmados en los casos de uso y los no funcionales (¿con qué?) Fuente: Booch
  • 26. Unidad 5. 26 UP ● Flujo de trabajo de análisis y diseño: se analizan los requerimientos, se especifica la arquitectura de la solución que incluye módulos, interfaces, persistencia (diseño de las BD), se planea la colaboración entre componentes (diagramas de secuencia y de colaboración), algorítmos.
  • 27. Unidad 5. 27 UP ● En el flujo de implementación se genera el código que materializa el diseño. ● El flujo de trabajo de pruebas se realiza a lo largo de todo el proceso buscando probar o validar los distintos productos generados ● Finalmente en el despliegue el software es emplazado en el hardware para su operación cotidiana
  • 29. Unidad 5. 29 CRISP-DM y UP Modelado de negocio Modelado de negocio Y /o Requerimientos no funcionales Conlleva análisis, diseño, implementación y pruebas Conlleva análisis, diseño, implementación y pruebas Es parte de las pruebas Se realiza durante el despliegue
  • 30. Unidad 5. 30 Actividad ● En equipos contrastar sus propuesta de la actividad anterior con lo mostrado en la diapositiva número 27
  • 31. Unidad 5. 31 Conclusión ● Los flujos de trabajo del modelo no cambian ● Se debe incluir en los flujos de trabajo las tareas propias de la minería de datos
  • 32. Unidad 5. 32 Bibliografía básica ● HernándezOrallo, J., M. J. Ramírez Quintana, et al. (2004). Introducción a la Mineria de Datos. España, Pearson Educación SA. ● Han, D. J. (2007). Principles of Data Mining, MIT Press. ● https://anibalgoicochea.com/2009/08/11/crisp-dm- una-metodologia-para-proyectos-de-mineria-de- datos/
  • 33. Unidad 5. 33 Bibliografía complementaria ● Everitt, B.S. (1994). A Handbook of Statistical Analyses using S-Plus. Chapman and Hall. ● Inmon,W.H. (1996). Building the Datawarehouse. J.Wiley & Sons. ● Han, J. and M. Kamber (2006). Data mining: concepts and techniques, Morgan Kaufmann. ● Kimball, R (1996).The Data WarehouseToolkit. JohnWiley & Sons. ● Hastie, T., R.Tibshirani, et al. (2005). The elements of statistical learning: data mining, inference and prediction, Springer ● Dunham. H. Margaret (2003). Data Mining. Introductory and AdvancedTopics, Prentice Hall. ● Pyle, D. (1999), "Data Preparation for Data Mining", Morgan Kaufmann, San Francisco, CA. ● Hand, David; Mannila, Heikki; Smyth, Padhraic (2001), Principles of Data Mining, A Bradford Book.The MIT Press. ● IanWitten and Eibe Frank (2002), Data Mining, Practical Machine LearningTools and Techniques with Java Implementations, Morgan Kaufmann Publishers.