Este curso ofrece a los estudiantes la posibilidad de conocer, comprender las técnicas básicas de minería de datos y saber cómo se aplican en problemas concretos de extracción de conocimiento útil para el análisis y la toma de decisiones.
Objetivos
Entender los conceptos y la terminología de las técnicas de minería de datos.
Reconocer los beneficios del uso sistemático de técnicas de extracción de conocimiento para la obtención de modelos y patrones predictivos.
Conocer las fases del Descubrimiento de Conocimiento de Bases de Datos y la importancia de las mismas en el éxito del proceso (en especial las de limpieza y selección de datos).
Conocer las distintas técnicas de aprendizaje automático y estadísticas utilizadas en minería de datos.
Elegir, para un problema concreto, qué técnicas de minería de datos son más apropiadas.
Generar los modelos y patrones elegidos utilizando la herramienta o paquete de minería de datos WEKA.
Evaluar la calidad de un modelo, utilizando técnicas sencillas de evaluación (validación cruzada).
Implementar un algoritmo de minería de datos específico dentro de un proyecto.
Aprender a usar WEKA en la construcción de un modelo predictivo.
Aprender paso a paso y con ejemplos explicativos los siguientes algoritmos de machine learning : Vecinos más Cercanos, Naïve Bayes, Árbol de Decisión y Reglas de Clasificación.
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Minería de Datos con Weka
1. Minería de Datos con Weka IMinería de Datos con Weka I
Prof. Masun NABHAN HOMSIProf. Masun NABHAN HOMSI
Inscríbete con el siguiente cupón para el curso en UDEMY.COM
con tan sólo 9.99$:
DESCUENTOWEKA_1
https://www.udemy.com/mineria-de-datos-con-weka-i/
2. • Profesora-Investigadora en el
Departamento de
Computación y Tecnología
de la Información ,
Universidad Simón Bolívar,
Caracas-Venezuela.
• Doctorado en Matemáticas-
Informática, Universidad de
Alepo, Alepo –Siria.
• Profesora-Investigadora en el
Departamento de
Computación y Tecnología
de la Información ,
Universidad Simón Bolívar,
Caracas-Venezuela.
• Doctorado en Matemáticas-
Informática, Universidad de
Alepo, Alepo –Siria.
Masun NABHAN HOMSIMasun NABHAN HOMSI
3. IntroducciónIntroducción
Datos
Información
Conocimiento
Datos
Información
Conocimiento
• Un dato es una representación simbólica (numérica,
alfabética, algorítmica, espacial, etc.) de un atributo o
variable cuantitativa o cualitativa.
• Es la materia prima de la información.
• La información es un conjunto organizado de datos procesados.
• El conocimiento es un conjunto de información almacenada mediante la
experiencia o el aprendizaje (a posteriori), o a través de la introspección (a priori).
4. MotivaciónMotivación
• ¿Cuántos
pacientes están en
la unidad de
cuidado intensivo?
• ¿Cuántos ataques
cardiacos fueron
atendido durante
el mes pasado?
• ¿ Quién saldría vivo
de la unidad de
cuidad intensivo?
• Diagnosticar si un
tumor es maligno o
benigno.
• ¿Un cliente que
solicita un
préstamo, es una
buena inversión?
• ¿Cuántos clientes
tienen préstamo?
Información Conocimiento
5. MotivaciónMotivación
• “Nos estamos ahogando en información, pero estamos hambrientos
de conocimiento” John Naisbitt
• Información es histórica : representa la “memoria de la organización.
• algoritmos clásicos no pueden manejar grandes volúmenes de datos.
• El usuario final no es un experto en aprendizaje automático ni en
estadística.
• “Nos estamos ahogando en información, pero estamos hambrientos
de conocimiento” John Naisbitt
• Información es histórica : representa la “memoria de la organización.
• algoritmos clásicos no pueden manejar grandes volúmenes de datos.
• El usuario final no es un experto en aprendizaje automático ni en
estadística.
7. Información del cursoInformación del curso
¿A quién va dirigido este curso?
Médicos, profesores, estudiantes, abogados,
etc.
Requisitos necesarios:
No es necesario ningún conocimiento previo
de Minería de Datos, pero con
conocimientos básicos de estadística.
¿A quién va dirigido este curso?
Médicos, profesores, estudiantes, abogados,
etc.
Requisitos necesarios:
No es necesario ningún conocimiento previo
de Minería de Datos, pero con
conocimientos básicos de estadística.
8. Información del cursoInformación del curso
Objetivo
Este curso permite a los estudiantes
conocer, comprender las técnicas
básicas de minería de datos y saber
cómo se aplican en problemas
concretos de extracción de
conocimiento útil para el análisis y la
toma de decisiones.
Objetivo
Este curso permite a los estudiantes
conocer, comprender las técnicas
básicas de minería de datos y saber
cómo se aplican en problemas
concretos de extracción de
conocimiento útil para el análisis y la
toma de decisiones.
9. ContenidoContenido
1. Introducción a la Minería
de Datos.
2. Introducción a Weka.
3. Exploración de Datos.
4. Preprocesamiento de
Datos I (Atributos).
5. Preprocesamiento de
Datos II (Instancias)
6. Clasificación.
7. Evaluación.
8. Proyecto Final.
1. Introducción a la Minería
de Datos.
2. Introducción a Weka.
3. Exploración de Datos.
4. Preprocesamiento de
Datos I (Atributos).
5. Preprocesamiento de
Datos II (Instancias)
6. Clasificación.
7. Evaluación.
8. Proyecto Final.
10. Clase I: Introducción a
Minería de Datos
Clase I: Introducción a
Minería de Datos
¿Qué es la Minería de
Datos?
El proceso de la
Minería de Datos.
Tipologías de Técnicas
de Minería de Datos.
Áreas de aplicación de
la Minería de Datos.
Ejercicios.
¿Qué es la Minería de
Datos?
El proceso de la
Minería de Datos.
Tipologías de Técnicas
de Minería de Datos.
Áreas de aplicación de
la Minería de Datos.
Ejercicios.
11. Clase II: Introducción a
Weka
Clase II: Introducción a
Weka
Bajar, Instalar y cargar
Weka.
Entorno de trabajo de
Weka.
La interfaz del Explorer.
Cargar Datos y mi
primer clasificador.
Ejercicios.
Bajar, Instalar y cargar
Weka.
Entorno de trabajo de
Weka.
La interfaz del Explorer.
Cargar Datos y mi
primer clasificador.
Ejercicios.
12. Clase III: Exploración de los
Datos
Clase III: Exploración de los
Datos
Explorar el conjunto de
datos.
Visualización de los
datos
Histograma.
Diagrama de
Dispersión.
Diagarma de Cajas.
Ejercicios
Explorar el conjunto de
datos.
Visualización de los
datos
Histograma.
Diagrama de
Dispersión.
Diagarma de Cajas.
Ejercicios
13. Clase IV: Preprocesamiento
de Datos I (Atributos)
Clase IV: Preprocesamiento
de Datos I (Atributos)
Remover atributos.
Discretización.
Cambio de tipo de
datos.
Añadir Expresiones.
Datos Faltantes.
Datos atípicos.
Selección de atributos.
Ejercicios.
Remover atributos.
Discretización.
Cambio de tipo de
datos.
Añadir Expresiones.
Datos Faltantes.
Datos atípicos.
Selección de atributos.
Ejercicios.
14. Clase V: Preprocesamiento
de Datos II (Instancias)
Clase V: Preprocesamiento
de Datos II (Instancias)
Selección de Instancias.
Instancias duplicadas.
Algoritmos de Muestreo:
Muestreo Inferior.
Muestreo Superior.
Preparación de los
conjuntos de datos.
Ejercicios.
Selección de Instancias.
Instancias duplicadas.
Algoritmos de Muestreo:
Muestreo Inferior.
Muestreo Superior.
Preparación de los
conjuntos de datos.
Ejercicios.
Entrenamiento
y Prueba!
15. Clase VI: ClasificaciónClase VI: Clasificación
Naïve Bayes.
Vecinos más Cercanos.
Árboles de Decisión.
Ejercicios.
Naïve Bayes.
Vecinos más Cercanos.
Árboles de Decisión.
Ejercicios.
16. Clase VII: EvaluaciónClase VII: Evaluación
Matriz de Confusión.
Sensibilidad vs
Especificidad.
La curva ROC
(Receiver Operating
Characteristic).
Ejercicios.
Matriz de Confusión.
Sensibilidad vs
Especificidad.
La curva ROC
(Receiver Operating
Characteristic).
Ejercicios.
17. Clase VIII: Proyecto FinalClase VIII: Proyecto Final
Repositorios abiertos de
datasets.
Predecir quién se va a
divorciar!
Repositorios abiertos de
datasets.
Predecir quién se va a
divorciar!