SlideShare una empresa de Scribd logo
1 de 29
Minería de Datos Para el común de los mortales Antonio soto Director General @antoniosql
Agenda Introducción a Minería de Datos Problemas de Negocio Tareas de Minería de Datos Ciclo de un Proyecto de Minería de Datos Clasificación de Algoritmos de SQL Server Data Mining Minería de Datos aplicada utilizando Office
Introducción a Minería de Datos ¿Qué es la Minería de Datos? Problemas de Negocio Tareas de Minería de Datos Ciclo de un Proyecto de Minería de Datos
¿Qué es la Minería de Datos? «La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos» Fuente: Wikipedia
¿Qué es la Minería de Datos? (II) Deducir conocimiento examinando los datos y realizando predicciones «examinar datos» examinar ejemplos de hechos conocidos sobre «casos» utilizando sus atributos – «variables» «conocimiento»: Patrones, Clusters, Reglas, Árboles de Decisión, Redes Neuronales, Reglas de Asociación,…. OLAP: Análisis orientado al modelo DM: Análisis orientado al dato Nombres alternativos: Análisis Predictivo
Problemas de Negocio Generación de Recomendaciones ¿Qué productos o servicios deberíamos de ofrecer a nuestros clientes? Detección de anomalías Detección de fraude Análisis de Rotación ¿Qué clientes son más proclives de irse a la competencia? Gestión de Riesgos ¿Debería de concederse el préstamo? Segmentación de clientes Clasificación de nuestros clientes Anuncios Orientados Personalización de anuncios, contenido,… Previsión ¿Cuánto venderemos el próximo trimestre?
Tareas de Minería de Datos (I) Clasificación Se asigna una categoría a cada caso. Cada caso tiene un conjunto de atributos uno de ellos es el atributo clase. Se busca un modelo que describa el atributo clase como una función de los atributos de salida Agrupación También conocido como segmentación Identifica grupos naturales basándose en un conjunto de atributos Asociación También conocido como análisis de cesta de la compra Regresión Similar a clasificación pero con el objetivo de buscar patrones para determinar un valor numérico Ej.: Predicción de la velocidad del viento basada en temperatura presión de aire y humedad
Tareas de Minería de Datos (II) Previsión La entrada es un conjunto de valores a lo largo del tiempo de los que extrae valores futuros Análisis de secuencia Busca patrones en una serie de eventos llamada secuencia Ej. Secuencia de navegación en Web Análisis de desviaciones Busca casos «raros» diferentes a los demás
Ciclo de un Proyecto de Minería (I) Formulación del Problema de Negocio Recolección de Datos Limpieza y Transformación de Datos Transformación numérica Agrupación Agregación Manejo de valores «perdidos» Eliminar os «extremos» Creación del Modelo Selección del Algoritmo Prueba y Error en muchos casos
Ciclo de un Proyecto de Minería (II) Evaluación del Modelo Evaluar la fiabilidad del modelo dentro de nuestro negocio Reporting y Predicción Integración en Aplicaciones Gestión del Modelo Dependiendo del escenario puede ser muy volátil Planificar «Entrenamiento»
Clasificación de Algoritmos
Clasificación de Algoritmos Tipos de Algoritmos Algoritmos de SQL Server Data Mining Clasificación de Algoritmos
Tipos de Algoritmos De Forecasting.  Dada una tendencia ¿Cuál es la previsión? Supervisados.  Conocemos la respuesta ¿Qué está correlacionado? No Supervisados.  Desconocemos la respuesta ¿Cuáles son los grupos?
Algoritmos (I) Decision Trees El más popular Utilizado para clasificación Clustering Encuentra agrupaciones naturales Sequence Clustering Agrupo una secuencia de eventos discretos en grupos naturales basado en similaridad Entender como los visitantes usan una web
Algoritmos (II) Naïve Bayes Clasificación en escenarios similares a Decision Trees Linear Regression Encuentra la mejor línea recta posible a través de una serie de puntos Usado para análisis predictivo Logistic Regression Se adapta a un factor exponencial Usado para análisis predictivo
Algoritmos (III) Association Rules Análisis de Cesta de la compra Time Series Algoritmo de previsión usado para previsión a corto y largo plazo Podemos usar varios escenarios para predecir escenarios “what if” Neural Network Tareas de Clasificación y Regresión Más sofisticado que Decision Trees y Naïve Bayes
Clasificación de Algoritmos
Minería de Datos en Office
Minería de Datos en Office Tareas de Preparación de Datos TableAnalysis Tools Data Modeling Tools Visores Testeo y Validación
Tareas de Preparación de Datos Explorar Datos Información estadística básica Limpieza de datos Outliers Re-label Datos de Ejemplo
Preparando los datos
TableAnalysis Tools (I)
TableAnalysis Tools(II)
Data Modeling Tools
Data Modeling Tools
Visores de Modelo Cluster Diagram Cluster Profiles OtrosVisores ,[object Object]
Neural   network
 Association rules
 Time seriesCluster Characteristics Cluster Discrimination

Más contenido relacionado

La actualidad más candente

Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
Minería de datos
Minería de datosMinería de datos
Minería de datosKeopx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datossaibelr
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos04071977
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datosArnoldo Gil
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kddYaz_Cuapio
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisMundo Contact
 

La actualidad más candente (20)

Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos - UAGRM
Mineria de datos - UAGRMMineria de datos - UAGRM
Mineria de datos - UAGRM
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 

Destacado

Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 
Data Mining
Data MiningData Mining
Data Miningbrobelo
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSlalopg
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?Scoremind
 
Modelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesModelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesÁngel M. Felicísimo
 
Minería de datos
Minería de datosMinería de datos
Minería de datosanag catal
 
Make Growth Happen for all Employees
Make Growth Happen for all EmployeesMake Growth Happen for all Employees
Make Growth Happen for all EmployeesTalent Innovations
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes socialesMaría Muñoz Parra
 
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017Carol Smith
 

Destacado (14)

Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Data Mining
Data MiningData Mining
Data Mining
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
 
Modelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesModelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicaciones
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1Mapa conceptual mineria de datos 1
Mapa conceptual mineria de datos 1
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Make Growth Happen for all Employees
Make Growth Happen for all EmployeesMake Growth Happen for all Employees
Make Growth Happen for all Employees
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Diapositivas
DiapositivasDiapositivas
Diapositivas
 
Técnicas e Instrumentos de Recolección de Datos
Técnicas e Instrumentos de Recolección de DatosTécnicas e Instrumentos de Recolección de Datos
Técnicas e Instrumentos de Recolección de Datos
 
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
AI and Machine Learning Demystified by Carol Smith at Midwest UX 2017
 

Similar a Minería de datos

La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD travon1
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data MiningAndres Eyherabide
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textosJesús Tramullas
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerEduardo Castro
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesDeysi Hdz
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introduccióntravon1
 
Mineria de datos ensayo
Mineria de datos ensayoMineria de datos ensayo
Mineria de datos ensayocarimi
 
Revista TicNews Marzo 2015
Revista TicNews Marzo 2015Revista TicNews Marzo 2015
Revista TicNews Marzo 2015Edicion Ticnews
 
20080506 Acm Jornadas Ponencia
20080506 Acm Jornadas Ponencia20080506 Acm Jornadas Ponencia
20080506 Acm Jornadas Ponenciahrodriguez
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLPI ONG
 

Similar a Minería de datos (20)

Técnicas de análisis de datos
Técnicas de análisis de datosTécnicas de análisis de datos
Técnicas de análisis de datos
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Web mining
Web miningWeb mining
Web mining
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Data mining triptico
Data mining tripticoData mining triptico
Data mining triptico
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL Server
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Unidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De DesicionesUnidad2 Bases De Datos Para L Toma De Desiciones
Unidad2 Bases De Datos Para L Toma De Desiciones
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introducción
 
Data
DataData
Data
 
Mineria de datos ensayo
Mineria de datos ensayoMineria de datos ensayo
Mineria de datos ensayo
 
Revista TicNews Marzo 2015
Revista TicNews Marzo 2015Revista TicNews Marzo 2015
Revista TicNews Marzo 2015
 
20080506 Acm Jornadas Ponencia
20080506 Acm Jornadas Ponencia20080506 Acm Jornadas Ponencia
20080506 Acm Jornadas Ponencia
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
 
MD: Clase9
MD: Clase9MD: Clase9
MD: Clase9
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 

Más de Antonio Soto

Gestiona la Información en Tu Empresa
Gestiona la Información en Tu EmpresaGestiona la Información en Tu Empresa
Gestiona la Información en Tu EmpresaAntonio Soto
 
Power BI para desarrolladores netcoreconf
Power BI para desarrolladores netcoreconfPower BI para desarrolladores netcoreconf
Power BI para desarrolladores netcoreconfAntonio Soto
 
04 Soluciones Basadas En Enterprise Search
04 Soluciones Basadas En Enterprise Search04 Soluciones Basadas En Enterprise Search
04 Soluciones Basadas En Enterprise SearchAntonio Soto
 
Trucos, OptimizacióN Y Buenas PráCticas Para Sql
Trucos, OptimizacióN Y Buenas PráCticas Para SqlTrucos, OptimizacióN Y Buenas PráCticas Para Sql
Trucos, OptimizacióN Y Buenas PráCticas Para SqlAntonio Soto
 
Migración SQL Server
Migración SQL ServerMigración SQL Server
Migración SQL ServerAntonio Soto
 

Más de Antonio Soto (8)

Gestiona la Información en Tu Empresa
Gestiona la Información en Tu EmpresaGestiona la Información en Tu Empresa
Gestiona la Información en Tu Empresa
 
Azure360
Azure360Azure360
Azure360
 
Power BI para desarrolladores netcoreconf
Power BI para desarrolladores netcoreconfPower BI para desarrolladores netcoreconf
Power BI para desarrolladores netcoreconf
 
Exchange2010
Exchange2010Exchange2010
Exchange2010
 
04 Soluciones Basadas En Enterprise Search
04 Soluciones Basadas En Enterprise Search04 Soluciones Basadas En Enterprise Search
04 Soluciones Basadas En Enterprise Search
 
Sql Data Services
Sql Data ServicesSql Data Services
Sql Data Services
 
Trucos, OptimizacióN Y Buenas PráCticas Para Sql
Trucos, OptimizacióN Y Buenas PráCticas Para SqlTrucos, OptimizacióN Y Buenas PráCticas Para Sql
Trucos, OptimizacióN Y Buenas PráCticas Para Sql
 
Migración SQL Server
Migración SQL ServerMigración SQL Server
Migración SQL Server
 

Último

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 

Último (10)

Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 

Minería de datos

  • 1. Minería de Datos Para el común de los mortales Antonio soto Director General @antoniosql
  • 2. Agenda Introducción a Minería de Datos Problemas de Negocio Tareas de Minería de Datos Ciclo de un Proyecto de Minería de Datos Clasificación de Algoritmos de SQL Server Data Mining Minería de Datos aplicada utilizando Office
  • 3. Introducción a Minería de Datos ¿Qué es la Minería de Datos? Problemas de Negocio Tareas de Minería de Datos Ciclo de un Proyecto de Minería de Datos
  • 4. ¿Qué es la Minería de Datos? «La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos» Fuente: Wikipedia
  • 5. ¿Qué es la Minería de Datos? (II) Deducir conocimiento examinando los datos y realizando predicciones «examinar datos» examinar ejemplos de hechos conocidos sobre «casos» utilizando sus atributos – «variables» «conocimiento»: Patrones, Clusters, Reglas, Árboles de Decisión, Redes Neuronales, Reglas de Asociación,…. OLAP: Análisis orientado al modelo DM: Análisis orientado al dato Nombres alternativos: Análisis Predictivo
  • 6. Problemas de Negocio Generación de Recomendaciones ¿Qué productos o servicios deberíamos de ofrecer a nuestros clientes? Detección de anomalías Detección de fraude Análisis de Rotación ¿Qué clientes son más proclives de irse a la competencia? Gestión de Riesgos ¿Debería de concederse el préstamo? Segmentación de clientes Clasificación de nuestros clientes Anuncios Orientados Personalización de anuncios, contenido,… Previsión ¿Cuánto venderemos el próximo trimestre?
  • 7. Tareas de Minería de Datos (I) Clasificación Se asigna una categoría a cada caso. Cada caso tiene un conjunto de atributos uno de ellos es el atributo clase. Se busca un modelo que describa el atributo clase como una función de los atributos de salida Agrupación También conocido como segmentación Identifica grupos naturales basándose en un conjunto de atributos Asociación También conocido como análisis de cesta de la compra Regresión Similar a clasificación pero con el objetivo de buscar patrones para determinar un valor numérico Ej.: Predicción de la velocidad del viento basada en temperatura presión de aire y humedad
  • 8. Tareas de Minería de Datos (II) Previsión La entrada es un conjunto de valores a lo largo del tiempo de los que extrae valores futuros Análisis de secuencia Busca patrones en una serie de eventos llamada secuencia Ej. Secuencia de navegación en Web Análisis de desviaciones Busca casos «raros» diferentes a los demás
  • 9. Ciclo de un Proyecto de Minería (I) Formulación del Problema de Negocio Recolección de Datos Limpieza y Transformación de Datos Transformación numérica Agrupación Agregación Manejo de valores «perdidos» Eliminar os «extremos» Creación del Modelo Selección del Algoritmo Prueba y Error en muchos casos
  • 10. Ciclo de un Proyecto de Minería (II) Evaluación del Modelo Evaluar la fiabilidad del modelo dentro de nuestro negocio Reporting y Predicción Integración en Aplicaciones Gestión del Modelo Dependiendo del escenario puede ser muy volátil Planificar «Entrenamiento»
  • 12. Clasificación de Algoritmos Tipos de Algoritmos Algoritmos de SQL Server Data Mining Clasificación de Algoritmos
  • 13. Tipos de Algoritmos De Forecasting. Dada una tendencia ¿Cuál es la previsión? Supervisados. Conocemos la respuesta ¿Qué está correlacionado? No Supervisados. Desconocemos la respuesta ¿Cuáles son los grupos?
  • 14. Algoritmos (I) Decision Trees El más popular Utilizado para clasificación Clustering Encuentra agrupaciones naturales Sequence Clustering Agrupo una secuencia de eventos discretos en grupos naturales basado en similaridad Entender como los visitantes usan una web
  • 15. Algoritmos (II) Naïve Bayes Clasificación en escenarios similares a Decision Trees Linear Regression Encuentra la mejor línea recta posible a través de una serie de puntos Usado para análisis predictivo Logistic Regression Se adapta a un factor exponencial Usado para análisis predictivo
  • 16. Algoritmos (III) Association Rules Análisis de Cesta de la compra Time Series Algoritmo de previsión usado para previsión a corto y largo plazo Podemos usar varios escenarios para predecir escenarios “what if” Neural Network Tareas de Clasificación y Regresión Más sofisticado que Decision Trees y Naïve Bayes
  • 18. Minería de Datos en Office
  • 19. Minería de Datos en Office Tareas de Preparación de Datos TableAnalysis Tools Data Modeling Tools Visores Testeo y Validación
  • 20. Tareas de Preparación de Datos Explorar Datos Información estadística básica Limpieza de datos Outliers Re-label Datos de Ejemplo
  • 26.
  • 27. Neural network
  • 29. Time seriesCluster Characteristics Cluster Discrimination
  • 30. Testeo y Validación Accuracy Chart Classification Matrix Profit Chart
  • 31. Resumen Problemas de Negocio que podemos resolver Que Tareas de Minería de Datos podemos aplicar Ciclo de un Proyecto de Minería de Datos Clasificación de Algoritmos de SQL Server Data Mining Minería de Datos aplicada utilizando Office
  • 32. Minería de Datos Para el común de los mortales Antonio soto Director General @antoniosql

Notas del editor

  1. http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datosLet’s start with some basic definitions. First of all, what the term “Data Mining” means? A well-formed definition was posted by Michael J. A. Berry & Gordon S. Linoff: “Data mining is the process of exploration and analysis, by automatic or semiautomatic means, of large quantities of data in order to discover patterns and rules”. Another definition comes from Raplh Kimball: “Data mining is a collection of powerful analysis techniques for making sense out of very large datasets”. Of course we have a definition by another guru, Bill Inmon: “Data Mining / Data Exploration is the usage of historical data to discover and exploit important business relationships”.
  2. So we can say, we are deducing some hidden knowledge by examining, or training the data. Our unit of examination is called “case”, which can be interpreted as one appearance of an entity, or a row in a table. The knowledge is patterns and rules. In the process we are using attributes of a case, in the data mining terminology called “variables”. Additional goal of DM is to perform predictions based on found patterns.For better understanding we can compare Data Mining to OLAP. While OLAP is a model-driven analysis, where we build the model in advance (what if it is irrelevant?), the Data Mining is a data-driven analysis, where we search from the model in our data.
  3. Para cada uno de los problemas anteriores, podemos aplicar varias tareas. En algunos casos una respuesta será obvia con la aplicación de una única tarea. En otros casos será necesario explorar y combinar múltiples tareas para llegar a una solución.