SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
Minería de Datos con Weka IMinería de Datos con Weka I
Prof. Masun NABHAN HOMSIProf. Masun NABHAN HOMSI
Inscríbete con el siguiente cupón para el curso en UDEMY.COM
con tan sólo 9.99$:
DESCUENTOWEKA_1
https://www.udemy.com/mineria-de-datos-con-weka-i/
• Profesora-Investigadora en el
Departamento de
Computación y Tecnología
de la Información ,
Universidad Simón Bolívar,
Caracas-Venezuela.
• Doctorado en Matemáticas-
Informática, Universidad de
Alepo, Alepo –Siria.
• Profesora-Investigadora en el
Departamento de
Computación y Tecnología
de la Información ,
Universidad Simón Bolívar,
Caracas-Venezuela.
• Doctorado en Matemáticas-
Informática, Universidad de
Alepo, Alepo –Siria.
Masun NABHAN HOMSIMasun NABHAN HOMSI
IntroducciónIntroducción
 Datos
 Información
 Conocimiento
 Datos
 Información
 Conocimiento
• Un dato es una representación simbólica (numérica,
alfabética, algorítmica, espacial, etc.) de un atributo o
variable cuantitativa o cualitativa.
• Es la materia prima de la información.
• La información es un conjunto organizado de datos procesados.
• El conocimiento es un conjunto de información almacenada mediante la
experiencia o el aprendizaje (a posteriori), o a través de la introspección (a priori).
MotivaciónMotivación
• ¿Cuántos
pacientes están en
la unidad de
cuidado intensivo?
• ¿Cuántos ataques
cardiacos fueron
atendido durante
el mes pasado?
• ¿ Quién saldría vivo
de la unidad de
cuidad intensivo?
• Diagnosticar si un
tumor es maligno o
benigno.
• ¿Un cliente que
solicita un
préstamo, es una
buena inversión?
• ¿Cuántos clientes
tienen préstamo?
Información Conocimiento
MotivaciónMotivación
• “Nos estamos ahogando en información, pero estamos hambrientos
de conocimiento” John Naisbitt
• Información es histórica : representa la “memoria de la organización.
• algoritmos clásicos no pueden manejar grandes volúmenes de datos.
• El usuario final no es un experto en aprendizaje automático ni en
estadística.
• “Nos estamos ahogando en información, pero estamos hambrientos
de conocimiento” John Naisbitt
• Información es histórica : representa la “memoria de la organización.
• algoritmos clásicos no pueden manejar grandes volúmenes de datos.
• El usuario final no es un experto en aprendizaje automático ni en
estadística.
SoluciónSolución
Minería de DatosMinería de Datos
Información del cursoInformación del curso
¿A quién va dirigido este curso?
Médicos, profesores, estudiantes, abogados,
etc.
Requisitos necesarios:
No es necesario ningún conocimiento previo
de Minería de Datos, pero con
conocimientos básicos de estadística.
¿A quién va dirigido este curso?
Médicos, profesores, estudiantes, abogados,
etc.
Requisitos necesarios:
No es necesario ningún conocimiento previo
de Minería de Datos, pero con
conocimientos básicos de estadística.
Información del cursoInformación del curso
Objetivo
Este curso permite a los estudiantes
conocer, comprender las técnicas
básicas de minería de datos y saber
cómo se aplican en problemas
concretos de extracción de
conocimiento útil para el análisis y la
toma de decisiones.
Objetivo
Este curso permite a los estudiantes
conocer, comprender las técnicas
básicas de minería de datos y saber
cómo se aplican en problemas
concretos de extracción de
conocimiento útil para el análisis y la
toma de decisiones.
ContenidoContenido
1. Introducción a la Minería
de Datos.
2. Introducción a Weka.
3. Exploración de Datos.
4. Preprocesamiento de
Datos I (Atributos).
5. Preprocesamiento de
Datos II (Instancias)
6. Clasificación.
7. Evaluación.
8. Proyecto Final.
1. Introducción a la Minería
de Datos.
2. Introducción a Weka.
3. Exploración de Datos.
4. Preprocesamiento de
Datos I (Atributos).
5. Preprocesamiento de
Datos II (Instancias)
6. Clasificación.
7. Evaluación.
8. Proyecto Final.
Clase I: Introducción a
Minería de Datos
Clase I: Introducción a
Minería de Datos
¿Qué es la Minería de
Datos?
El proceso de la
Minería de Datos.
Tipologías de Técnicas
de Minería de Datos.
Áreas de aplicación de
la Minería de Datos.
Ejercicios.
¿Qué es la Minería de
Datos?
El proceso de la
Minería de Datos.
Tipologías de Técnicas
de Minería de Datos.
Áreas de aplicación de
la Minería de Datos.
Ejercicios.
Clase II: Introducción a
Weka
Clase II: Introducción a
Weka
Bajar, Instalar y cargar
Weka.
Entorno de trabajo de
Weka.
La interfaz del Explorer.
Cargar Datos y mi
primer clasificador.
Ejercicios.
Bajar, Instalar y cargar
Weka.
Entorno de trabajo de
Weka.
La interfaz del Explorer.
Cargar Datos y mi
primer clasificador.
Ejercicios.
Clase III: Exploración de los
Datos
Clase III: Exploración de los
Datos
Explorar el conjunto de
datos.
Visualización de los
datos
Histograma.
Diagrama de
Dispersión.
Diagarma de Cajas.
Ejercicios
Explorar el conjunto de
datos.
Visualización de los
datos
Histograma.
Diagrama de
Dispersión.
Diagarma de Cajas.
Ejercicios
Clase IV: Preprocesamiento
de Datos I (Atributos)
Clase IV: Preprocesamiento
de Datos I (Atributos)
Remover atributos.
Discretización.
Cambio de tipo de
datos.
Añadir Expresiones.
Datos Faltantes.
Datos atípicos.
Selección de atributos.
Ejercicios.
Remover atributos.
Discretización.
Cambio de tipo de
datos.
Añadir Expresiones.
Datos Faltantes.
Datos atípicos.
Selección de atributos.
Ejercicios.
Clase V: Preprocesamiento
de Datos II (Instancias)
Clase V: Preprocesamiento
de Datos II (Instancias)
Selección de Instancias.
Instancias duplicadas.
Algoritmos de Muestreo:
Muestreo Inferior.
Muestreo Superior.
Preparación de los
conjuntos de datos.
Ejercicios.
Selección de Instancias.
Instancias duplicadas.
Algoritmos de Muestreo:
Muestreo Inferior.
Muestreo Superior.
Preparación de los
conjuntos de datos.
Ejercicios.
Entrenamiento
y Prueba!
Clase VI: ClasificaciónClase VI: Clasificación
Naïve Bayes.
Vecinos más Cercanos.
Árboles de Decisión.
Ejercicios.
Naïve Bayes.
Vecinos más Cercanos.
Árboles de Decisión.
Ejercicios.
Clase VII: EvaluaciónClase VII: Evaluación
Matriz de Confusión.
Sensibilidad vs
Especificidad.
La curva ROC
(Receiver Operating
Characteristic).
Ejercicios.
Matriz de Confusión.
Sensibilidad vs
Especificidad.
La curva ROC
(Receiver Operating
Characteristic).
Ejercicios.
Clase VIII: Proyecto FinalClase VIII: Proyecto Final
Repositorios abiertos de
datasets.
 Predecir quién se va a
divorciar!
Repositorios abiertos de
datasets.
 Predecir quién se va a
divorciar!
MUCHAS GRACIASMUCHAS GRACIAS

Más contenido relacionado

Similar a Minería de Datos con Weka

Silabo bases de_datos_II
Silabo bases de_datos_IISilabo bases de_datos_II
Silabo bases de_datos_IIMarcelo Herrera
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_iiChars Orden
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_iiYoly QC
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_iiWilliam Lozano
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_iiMary Tenelema
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_iiPaúl Cacuango
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_iiDyego de Alvaro
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_iiInés Rosero
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_iiLiliana Charco
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_iiDoris Aguagallo
 
Herramientas y recursos tecnológicos para el Data Science
Herramientas y recursos tecnológicos para el Data ScienceHerramientas y recursos tecnológicos para el Data Science
Herramientas y recursos tecnológicos para el Data ScienceRoman Herrera
 
Tipologías- Técnicas de Minería de Datos
Tipologías- Técnicas de Minería de DatosTipologías- Técnicas de Minería de Datos
Tipologías- Técnicas de Minería de DatosSimon Bolivar University
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con RSoftware Guru
 
2014 01 17e_madridla_fin_sl
2014 01 17e_madridla_fin_sl2014 01 17e_madridla_fin_sl
2014 01 17e_madridla_fin_slDavid Gago
 
Mineria1 2010
Mineria1 2010Mineria1 2010
Mineria1 2010cristian
 
Seminario de tesis i presentacion
Seminario de tesis i presentacionSeminario de tesis i presentacion
Seminario de tesis i presentacionUuren Sanchez
 
La deserción estudiantil y la mineria de datos
La deserción estudiantil y la mineria de datosLa deserción estudiantil y la mineria de datos
La deserción estudiantil y la mineria de datosMARCO POLO SILVA SEGOVIA
 
I summit utpl-taller
I summit utpl-tallerI summit utpl-taller
I summit utpl-tallereccutpl
 

Similar a Minería de Datos con Weka (20)

Silabo bases de_datos_II
Silabo bases de_datos_IISilabo bases de_datos_II
Silabo bases de_datos_II
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
silabo
silabosilabo
silabo
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
Silabo bases de_datos_ii
Silabo bases de_datos_iiSilabo bases de_datos_ii
Silabo bases de_datos_ii
 
Herramientas y recursos tecnológicos para el Data Science
Herramientas y recursos tecnológicos para el Data ScienceHerramientas y recursos tecnológicos para el Data Science
Herramientas y recursos tecnológicos para el Data Science
 
Tipologías- Técnicas de Minería de Datos
Tipologías- Técnicas de Minería de DatosTipologías- Técnicas de Minería de Datos
Tipologías- Técnicas de Minería de Datos
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con R
 
2014 01 17e_madridla_fin_sl
2014 01 17e_madridla_fin_sl2014 01 17e_madridla_fin_sl
2014 01 17e_madridla_fin_sl
 
Mineria1 2010
Mineria1 2010Mineria1 2010
Mineria1 2010
 
Seminario de tesis i presentacion
Seminario de tesis i presentacionSeminario de tesis i presentacion
Seminario de tesis i presentacion
 
La deserción estudiantil y la mineria de datos
La deserción estudiantil y la mineria de datosLa deserción estudiantil y la mineria de datos
La deserción estudiantil y la mineria de datos
 
I summit utpl-taller
I summit utpl-tallerI summit utpl-taller
I summit utpl-taller
 

Último

Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdfDemetrio Ccesa Rayme
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSjlorentemartos
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxMaritzaRetamozoVera
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Carlos Muñoz
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arteRaquel Martín Contreras
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadAlejandrino Halire Ccahuana
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuaDANNYISAACCARVAJALGA
 

Último (20)

Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 2do Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 2do Grado Educacion Primaria 2024 Ccesa007.pdf
 
Neurociencias para Educadores NE24 Ccesa007.pdf
Neurociencias para Educadores  NE24  Ccesa007.pdfNeurociencias para Educadores  NE24  Ccesa007.pdf
Neurociencias para Educadores NE24 Ccesa007.pdf
 
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOSTEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
TEMA 13 ESPAÑA EN DEMOCRACIA:DISTINTOS GOBIERNOS
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docx
 
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arte
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdad
 
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahua
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 

Minería de Datos con Weka

  • 1. Minería de Datos con Weka IMinería de Datos con Weka I Prof. Masun NABHAN HOMSIProf. Masun NABHAN HOMSI Inscríbete con el siguiente cupón para el curso en UDEMY.COM con tan sólo 9.99$: DESCUENTOWEKA_1 https://www.udemy.com/mineria-de-datos-con-weka-i/
  • 2. • Profesora-Investigadora en el Departamento de Computación y Tecnología de la Información , Universidad Simón Bolívar, Caracas-Venezuela. • Doctorado en Matemáticas- Informática, Universidad de Alepo, Alepo –Siria. • Profesora-Investigadora en el Departamento de Computación y Tecnología de la Información , Universidad Simón Bolívar, Caracas-Venezuela. • Doctorado en Matemáticas- Informática, Universidad de Alepo, Alepo –Siria. Masun NABHAN HOMSIMasun NABHAN HOMSI
  • 3. IntroducciónIntroducción  Datos  Información  Conocimiento  Datos  Información  Conocimiento • Un dato es una representación simbólica (numérica, alfabética, algorítmica, espacial, etc.) de un atributo o variable cuantitativa o cualitativa. • Es la materia prima de la información. • La información es un conjunto organizado de datos procesados. • El conocimiento es un conjunto de información almacenada mediante la experiencia o el aprendizaje (a posteriori), o a través de la introspección (a priori).
  • 4. MotivaciónMotivación • ¿Cuántos pacientes están en la unidad de cuidado intensivo? • ¿Cuántos ataques cardiacos fueron atendido durante el mes pasado? • ¿ Quién saldría vivo de la unidad de cuidad intensivo? • Diagnosticar si un tumor es maligno o benigno. • ¿Un cliente que solicita un préstamo, es una buena inversión? • ¿Cuántos clientes tienen préstamo? Información Conocimiento
  • 5. MotivaciónMotivación • “Nos estamos ahogando en información, pero estamos hambrientos de conocimiento” John Naisbitt • Información es histórica : representa la “memoria de la organización. • algoritmos clásicos no pueden manejar grandes volúmenes de datos. • El usuario final no es un experto en aprendizaje automático ni en estadística. • “Nos estamos ahogando en información, pero estamos hambrientos de conocimiento” John Naisbitt • Información es histórica : representa la “memoria de la organización. • algoritmos clásicos no pueden manejar grandes volúmenes de datos. • El usuario final no es un experto en aprendizaje automático ni en estadística.
  • 7. Información del cursoInformación del curso ¿A quién va dirigido este curso? Médicos, profesores, estudiantes, abogados, etc. Requisitos necesarios: No es necesario ningún conocimiento previo de Minería de Datos, pero con conocimientos básicos de estadística. ¿A quién va dirigido este curso? Médicos, profesores, estudiantes, abogados, etc. Requisitos necesarios: No es necesario ningún conocimiento previo de Minería de Datos, pero con conocimientos básicos de estadística.
  • 8. Información del cursoInformación del curso Objetivo Este curso permite a los estudiantes conocer, comprender las técnicas básicas de minería de datos y saber cómo se aplican en problemas concretos de extracción de conocimiento útil para el análisis y la toma de decisiones. Objetivo Este curso permite a los estudiantes conocer, comprender las técnicas básicas de minería de datos y saber cómo se aplican en problemas concretos de extracción de conocimiento útil para el análisis y la toma de decisiones.
  • 9. ContenidoContenido 1. Introducción a la Minería de Datos. 2. Introducción a Weka. 3. Exploración de Datos. 4. Preprocesamiento de Datos I (Atributos). 5. Preprocesamiento de Datos II (Instancias) 6. Clasificación. 7. Evaluación. 8. Proyecto Final. 1. Introducción a la Minería de Datos. 2. Introducción a Weka. 3. Exploración de Datos. 4. Preprocesamiento de Datos I (Atributos). 5. Preprocesamiento de Datos II (Instancias) 6. Clasificación. 7. Evaluación. 8. Proyecto Final.
  • 10. Clase I: Introducción a Minería de Datos Clase I: Introducción a Minería de Datos ¿Qué es la Minería de Datos? El proceso de la Minería de Datos. Tipologías de Técnicas de Minería de Datos. Áreas de aplicación de la Minería de Datos. Ejercicios. ¿Qué es la Minería de Datos? El proceso de la Minería de Datos. Tipologías de Técnicas de Minería de Datos. Áreas de aplicación de la Minería de Datos. Ejercicios.
  • 11. Clase II: Introducción a Weka Clase II: Introducción a Weka Bajar, Instalar y cargar Weka. Entorno de trabajo de Weka. La interfaz del Explorer. Cargar Datos y mi primer clasificador. Ejercicios. Bajar, Instalar y cargar Weka. Entorno de trabajo de Weka. La interfaz del Explorer. Cargar Datos y mi primer clasificador. Ejercicios.
  • 12. Clase III: Exploración de los Datos Clase III: Exploración de los Datos Explorar el conjunto de datos. Visualización de los datos Histograma. Diagrama de Dispersión. Diagarma de Cajas. Ejercicios Explorar el conjunto de datos. Visualización de los datos Histograma. Diagrama de Dispersión. Diagarma de Cajas. Ejercicios
  • 13. Clase IV: Preprocesamiento de Datos I (Atributos) Clase IV: Preprocesamiento de Datos I (Atributos) Remover atributos. Discretización. Cambio de tipo de datos. Añadir Expresiones. Datos Faltantes. Datos atípicos. Selección de atributos. Ejercicios. Remover atributos. Discretización. Cambio de tipo de datos. Añadir Expresiones. Datos Faltantes. Datos atípicos. Selección de atributos. Ejercicios.
  • 14. Clase V: Preprocesamiento de Datos II (Instancias) Clase V: Preprocesamiento de Datos II (Instancias) Selección de Instancias. Instancias duplicadas. Algoritmos de Muestreo: Muestreo Inferior. Muestreo Superior. Preparación de los conjuntos de datos. Ejercicios. Selección de Instancias. Instancias duplicadas. Algoritmos de Muestreo: Muestreo Inferior. Muestreo Superior. Preparación de los conjuntos de datos. Ejercicios. Entrenamiento y Prueba!
  • 15. Clase VI: ClasificaciónClase VI: Clasificación Naïve Bayes. Vecinos más Cercanos. Árboles de Decisión. Ejercicios. Naïve Bayes. Vecinos más Cercanos. Árboles de Decisión. Ejercicios.
  • 16. Clase VII: EvaluaciónClase VII: Evaluación Matriz de Confusión. Sensibilidad vs Especificidad. La curva ROC (Receiver Operating Characteristic). Ejercicios. Matriz de Confusión. Sensibilidad vs Especificidad. La curva ROC (Receiver Operating Characteristic). Ejercicios.
  • 17. Clase VIII: Proyecto FinalClase VIII: Proyecto Final Repositorios abiertos de datasets.  Predecir quién se va a divorciar! Repositorios abiertos de datasets.  Predecir quién se va a divorciar!