SlideShare una empresa de Scribd logo
Aplicaciones de minería de
          datos

                Por:
    M.C. Leopoldo González Rosas
         www.cnys.com.mx
   campodeEncinos.wordpress.com
Agenda
• Presentación
• Motivación
• ¿qué es minería de datos?
  – Disciplinas involucradas
• Aplicaciones
  – Bibliotecas
  – Universidades
  – otras
• ¿cómo funciona?
  – Arquitectura de inteligencia de negocios
Agenda (cont.)
  – Metodología: El proceso de descubrimiento de
    conocimiento en bases de datos (KDD)
  – Recolección/preparación de datos
  – Algoritmos
  – Modelo predictivo y su interpretación
  – Utilizando los resultados
     • Toma de decisiones
     • Sistemas operacionales
• Software de minería de datos
• Minería de datos y ética
• Conclusión
Presentación
 Yo:
   Formación académica:
         Licenciatura en Ciencias de la computación – BUAP FCC
         Maestría en Ciencias con especialidad en Ingeniería en Sistemas - UDLAP
   Experiencia profesional
        CNyS S.C. - Consultoría (BI, BD, PM, desarrollo de software)
        gedas VW (BI, preventas, consultoría, LP)
        BBVA Bancomer (BI, LP)
        SFA Puebla (soporte técnico BD)
   Experiencia académica
     Programación
     Bases de datos / Inteligencia de negocios
     Universidades: UDLAP, UPAEP, BUAP
   Áreas de interés
     Bases de datos e inteligencia de negocios
     Desarrollo de software
     Proceso de enseñanza - aprendizaje
Motivación
• “Knowing is not enough; we must apply.
  Willing is not enough; we must do.”.
  Goethe
 Generamos datos de manera exponencial
   Era de información
 Obtener el conocimiento
  oculto en esos datos
   Datos  información  conocimiento
 Competir en este mundo de
  negocios globalizado
¿qué es minería de datos?
• Minería LA PREDICCION PARAproceso por el cual
      USAR
           de datos es el MEJORAR Y GANAR EN LOS
  generamos un modelo que sirva para la
                       NEGOCIOS
  predicción,
  – este modelo se genera a partir de datos
    aplicándoles algún algoritmo que construye el
    modelo.
• El modelo se evalúa para saber que tan
  certero será respecto a sus predicciones y
  posteriormente
• se utiliza para predecir el comportamiento
  de cualquier dato nuevo
¿qué es minería de datos? (cont.)
• Es la extracción de información
  implícita, previamente desconocida y
  potencialmente útil a partir de datos
  [Witten I.H. et al, 2011]
• Es una disciplina joven y de rápido
  crecimiento, conocida como KDD, …
  DM como la evolución de TI. [Han J. et
  al, 2012]
• Es la extracción automatizada de
  información escondida a partir de
  (grandes) bases de datos. Te permite
  ser proactivo. Prospectivo en lugar de
  retrospectivo[Thearling K.]
Minería de datos - disciplinas
ejemplo: reglas if-then
if tasaProducciónLagrimas = reducida
  then recomendacion = ninguna
Else
   if edad=joven and astigmatismo=no
   then recomendación = suaves
ejemplo: árbol de decisión
Aplicación en bibliotecas MBA
ID          PRODUCTOS

OCT-1   1   QA      QB

OCT-1   2   QC      QD

OCT-1   3   QE      QA

OCT-1   4   QB      QC

OCT-1   5   QD      QE   QA

OCT-2   6   QB      QC

OCT-2   7   QD      QE

OCT-2   8   QA      QB

OCT-2   9   QC      QA   QB

OCT-2   10 QC       QA   QB

OCT-2   11 QC       QA   QB

OCT-2   12 QC       QD   QE
Aplicación en bibliotecas DT
Aplicación en universidades
Aplicación universidades
Otras aplicaciones
• Marketing
• Predicción de ventas, precios, acciones e índices
  financieros.
• Detección de fraudes en tarjetas de crédito
• Clasificación y filtrado de documentos, e-mails y
  noticias.
• Análisis de llamadas en Centros de atención
  telefónica.
• Clasificación automática de Quejas y
  Sugerencias de Clientes.
Arquitectura de inteligencia de
             negocios
• Software del sistema (system software)
  – Sistemas operativos, DBMS, compiladores
• Software de aplicación (app software)
  – Operacional
    • OLTP y batch
    • Office, nomina, ventas, ERP
  – Para la toma de decisiones -> inteligencia
    de negocios
Arquitectura
Metodología: KDD
Metodología (cont.)
1) Establecer de manera precisa el problema a resolver
    - No gastes dinero, antes de comprar un software
       primero establece que es lo que quieres resolver
2) Exploración inicial
    -preparación y limpieza de datos
    -transformaciones de datos
    - Probar con estadística descriptiva para conocer datos
3) Construcción del modelo y validación
    - Probar algunos modelos y elegir el mejor para el
       problema que se está resolviendo
4) Liberación
    - Una vez construido el modelo se puede usar muchas
       veces
    - Los árboles de decisión son fáciles de liberar
Recolección/preparación de datos

• Extraer, transformar, cargar
  – Posiblemente ya existe un almacén de datos
• Limpieza / calidad de datos
• Transformaciones para la minería
  – “Discretizar” (ejemplo: E B R M)
• Muestra(s) -> vistas minables
  – Cómo se obtiene
  – Tamaño de la muestra
Algoritmos de minería de datos
• Clasificación – predicen una o más variables discretas,
  basandose en los otros atributos en el conjunto de datos.
  Ejemplo: árboles de decisión
• Regresion – predice una o más variables continuas, como
  perdida o ganancia, basandose en los otros atributos en el
  conjunto de datos.
• Segmentación – divide datos en grupos o clusters de
  articulos que tienen propiedades similares.
• Asociación - encuentran correlaciones entre los diferentes
  atributos de un conjunto de datos. Sirven para crear reglas
  de asociación por ejemplo para MBA.
• Análisis de secuencia – encuentra secuencias frecuentes o
  episodios en datos, como en un flujo de rutas Web.
Modelo predictivo y su interpretación



If temperatura = agradable then humedad = normal
Utilizando los resultados
• Se recorre el modelo cada vez que se desea
  predecir
  – Por ejemplo para decidir a quien otorgarle un
    apoyo adicional
  – Por ejemplo para decidir si se le presta o no
    dinero a alguien
• El modelo se puede usar para calificar a los
  datos de los sistemas operacionales para:
  – Por ejemplo: identificar “Preferentes”
  – Por ejemplo: identificar “ evasores fiscales”
Software de DM
•   Weka y pentaho
•   Rapid Miner
•   Microsoft SQL Server 2008 R2
•   sas enterprise miner
•   IBM spss
•   Oracle data mining
Minería de datos y ética
•Es difícil hacer que los datos sean “anónimos”
   – 85% de la gente puede ser identificada por su
     C.P., fecha de nacimiento y genero
•La minería de datos se usa para discriminar
  •Ejemplo: aplicación de prestamos: usar información como sexo,
  religión o raza no es ético
•La situación etica depende de la aplicación
  •Ejemplo: la misma información esta bien en aplicaciones medicas
•Los atributos pueden contener información
problematica
  –Ejemplo: el CP se puede correlacionar con la raza
Conclusiones
• Minería de datos se ha venido estudiando e
  investigando pero no se esta aplicando en los
  diversos problemas de nuestro país
  – Educación, salud, el campo, eliminar la pobreza
• Mientras tenemos científicos trabajando en este
  tema, debemos preparar a las personas que lo
  aplicarán. (astrónomos y astronautas)
• Es una tecnología que ya está al alcance de todo
  el mundo
• ¿Y el e-commerce? ¿Y la nube? ¿y las iPads? …
GRACIAS POR SU ATENCIÓN




  lgr811@cnys.com.mx
   lgr811@yahoo.com
Bibliografía
• campodeEncinos.wordpress.com
• http://catarina.udlap.mx/u_dl_a/tales/documentos/msp/gonzalez
  _r_l/
• http://www.uppuebla.edu.mx/Revista/revista10.pdf
• http://hmi.ucsd.edu/pdf/HMI_2009_ConsumerReport_Dec9_2009
  .pdf
• http://www.cs.waikato.ac.nz/~ml/weka/book.html
• Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard Pfahringer,
  Peter Reutemann, Ian H. Witten (2009); The WEKA Data Mining
  Software: An Update; SIGKDD Explorations, Volume 11, Issue 1
• Kiron D. et al. Analytics:the widening divide – how companies are
  achieving competitive advantage through analytics. MIT
  Sloan/IBM research report fall 2011
• http://www.kdnuggets.com/software/suites.html
• http://ccita2010.utmetropolitana.edu.mx/recursos/Recursos_digit
  ales.pdf

Más contenido relacionado

La actualidad más candente

Modelo de datos
Modelo de datosModelo de datos
Modelo de datos
Cristian Salazar C.
 
Investigación de Mercados / Capitulo III
Investigación de Mercados / Capitulo IIIInvestigación de Mercados / Capitulo III
Investigación de Mercados / Capitulo III
gustavoiniguezm
 
INVESTIGACIÓN COMERCIAL
INVESTIGACIÓN COMERCIALINVESTIGACIÓN COMERCIAL
INVESTIGACIÓN COMERCIAL
Ghisele
 
Ejecucion de la estrategia.. grupo1
Ejecucion de la estrategia.. grupo1Ejecucion de la estrategia.. grupo1
Ejecucion de la estrategia.. grupo1
Gaby Vargas
 
Diapositivas base de datos
Diapositivas base de datosDiapositivas base de datos
Diapositivas base de datos
catherine4ad
 
PLAN DE NEGOCIOS SEMINARIO 18-01.pdf
PLAN DE NEGOCIOS SEMINARIO 18-01.pdfPLAN DE NEGOCIOS SEMINARIO 18-01.pdf
PLAN DE NEGOCIOS SEMINARIO 18-01.pdf
LupitaCevallos1
 
Tipos de variables
Tipos de variablesTipos de variables
Tipos de variables
Escarlett Hevia
 
Bioestadistica tabala de frecuencia
Bioestadistica tabala de frecuenciaBioestadistica tabala de frecuencia
Bioestadistica tabala de frecuencia
Yndira Gisell Ruíz León
 
Cuadro de mando integral Balanced Scorecard
Cuadro de mando integral Balanced ScorecardCuadro de mando integral Balanced Scorecard
Cuadro de mando integral Balanced Scorecard
Juan Carlos Hoyos Calderón
 
Amazon vs. walmart
Amazon vs. walmartAmazon vs. walmart
Amazon vs. walmart
MaricieloGarciaSando
 
Sql presentacion
Sql presentacionSql presentacion
Sql presentacion
M. Angel Esteban
 
Plan Estrategico
Plan EstrategicoPlan Estrategico
Canales de distribucion
Canales de distribucion Canales de distribucion
Canales de distribucion
gloria esther
 
Objetivos básicos del sistema de información...!
Objetivos básicos del sistema de información...!Objetivos básicos del sistema de información...!
Objetivos básicos del sistema de información...!
alejasebas
 
Presentacion bases de datos
Presentacion bases de datosPresentacion bases de datos
Presentacion bases de datos
Diego Alexander Aguirre Forero
 
Análisis del entorno
Análisis del entornoAnálisis del entorno
Análisis del entorno
bajacamping
 
Mapa mental estudio de mercado
Mapa mental estudio de mercadoMapa mental estudio de mercado
Mapa mental estudio de mercado
DenyAlvarez
 
Ejemplo Mercado
Ejemplo MercadoEjemplo Mercado
Ejemplo Mercado
Web World Company WWC
 
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación (Inv. Mercados) Tema 3 - Formulación del diseño de investigación
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación
mdelriomejia
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
David Alayón
 

La actualidad más candente (20)

Modelo de datos
Modelo de datosModelo de datos
Modelo de datos
 
Investigación de Mercados / Capitulo III
Investigación de Mercados / Capitulo IIIInvestigación de Mercados / Capitulo III
Investigación de Mercados / Capitulo III
 
INVESTIGACIÓN COMERCIAL
INVESTIGACIÓN COMERCIALINVESTIGACIÓN COMERCIAL
INVESTIGACIÓN COMERCIAL
 
Ejecucion de la estrategia.. grupo1
Ejecucion de la estrategia.. grupo1Ejecucion de la estrategia.. grupo1
Ejecucion de la estrategia.. grupo1
 
Diapositivas base de datos
Diapositivas base de datosDiapositivas base de datos
Diapositivas base de datos
 
PLAN DE NEGOCIOS SEMINARIO 18-01.pdf
PLAN DE NEGOCIOS SEMINARIO 18-01.pdfPLAN DE NEGOCIOS SEMINARIO 18-01.pdf
PLAN DE NEGOCIOS SEMINARIO 18-01.pdf
 
Tipos de variables
Tipos de variablesTipos de variables
Tipos de variables
 
Bioestadistica tabala de frecuencia
Bioestadistica tabala de frecuenciaBioestadistica tabala de frecuencia
Bioestadistica tabala de frecuencia
 
Cuadro de mando integral Balanced Scorecard
Cuadro de mando integral Balanced ScorecardCuadro de mando integral Balanced Scorecard
Cuadro de mando integral Balanced Scorecard
 
Amazon vs. walmart
Amazon vs. walmartAmazon vs. walmart
Amazon vs. walmart
 
Sql presentacion
Sql presentacionSql presentacion
Sql presentacion
 
Plan Estrategico
Plan EstrategicoPlan Estrategico
Plan Estrategico
 
Canales de distribucion
Canales de distribucion Canales de distribucion
Canales de distribucion
 
Objetivos básicos del sistema de información...!
Objetivos básicos del sistema de información...!Objetivos básicos del sistema de información...!
Objetivos básicos del sistema de información...!
 
Presentacion bases de datos
Presentacion bases de datosPresentacion bases de datos
Presentacion bases de datos
 
Análisis del entorno
Análisis del entornoAnálisis del entorno
Análisis del entorno
 
Mapa mental estudio de mercado
Mapa mental estudio de mercadoMapa mental estudio de mercado
Mapa mental estudio de mercado
 
Ejemplo Mercado
Ejemplo MercadoEjemplo Mercado
Ejemplo Mercado
 
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación (Inv. Mercados) Tema 3 - Formulación del diseño de investigación
(Inv. Mercados) Tema 3 - Formulación del diseño de investigación
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 

Destacado

Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
Universidad Autonoma de Chihuahua
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
lalopg
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
elsemieni
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuenciales
Marilyn Jaramillo
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
majitol
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)
Alexander Jimenez
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
Jesús Tramullas
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Néstor González
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
Mundo Contact
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
ufrj
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con Knime
OpenAnalytics Spain
 
Datos mineria chilena cesco
Datos mineria chilena cescoDatos mineria chilena cesco
Datos mineria chilena cesco
Proyecto San Jorge
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
asuoc
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics Spain
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
Software Guru
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
María Muñoz Parra
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
dataminingperu
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
Antonio Soto
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
edmaga
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
Escoles Universitàries Gimbernat i Tomàs Cerdà
 

Destacado (20)

Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuenciales
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con Knime
 
Datos mineria chilena cesco
Datos mineria chilena cescoDatos mineria chilena cesco
Datos mineria chilena cesco
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 

Similar a aplicaciones de minería de datos

Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining
Data MiningData Mining
Data Mining
Ernesto Mislej
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
Andres Eyherabide
 
IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
Franklin Parrales Bravo
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Facultad de Informática UCM
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Joaquín Borrego-Díaz
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Pentaho
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
amdia
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
LuisAzofeifa6
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0
Pedro Contreras Flores
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
DarnelyC
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Universidad Nacional del Nordeste
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
Eduardo Castro
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
Eduardo Castro
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
LPI ONG
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Anyeni Garay
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecas
Felipe Vera (Prodigio Consultores)
 
Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
ADPTechnology
 
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1
Pedro Aaron
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
ICEMD
 

Similar a aplicaciones de minería de datos (20)

Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Data Mining
Data MiningData Mining
Data Mining
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecas
 
Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
 
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 

aplicaciones de minería de datos

  • 1. Aplicaciones de minería de datos Por: M.C. Leopoldo González Rosas www.cnys.com.mx campodeEncinos.wordpress.com
  • 2. Agenda • Presentación • Motivación • ¿qué es minería de datos? – Disciplinas involucradas • Aplicaciones – Bibliotecas – Universidades – otras • ¿cómo funciona? – Arquitectura de inteligencia de negocios
  • 3. Agenda (cont.) – Metodología: El proceso de descubrimiento de conocimiento en bases de datos (KDD) – Recolección/preparación de datos – Algoritmos – Modelo predictivo y su interpretación – Utilizando los resultados • Toma de decisiones • Sistemas operacionales • Software de minería de datos • Minería de datos y ética • Conclusión
  • 4. Presentación  Yo:  Formación académica:  Licenciatura en Ciencias de la computación – BUAP FCC  Maestría en Ciencias con especialidad en Ingeniería en Sistemas - UDLAP  Experiencia profesional  CNyS S.C. - Consultoría (BI, BD, PM, desarrollo de software)  gedas VW (BI, preventas, consultoría, LP)  BBVA Bancomer (BI, LP)  SFA Puebla (soporte técnico BD)  Experiencia académica  Programación  Bases de datos / Inteligencia de negocios  Universidades: UDLAP, UPAEP, BUAP  Áreas de interés  Bases de datos e inteligencia de negocios  Desarrollo de software  Proceso de enseñanza - aprendizaje
  • 5. Motivación • “Knowing is not enough; we must apply. Willing is not enough; we must do.”. Goethe  Generamos datos de manera exponencial  Era de información  Obtener el conocimiento oculto en esos datos  Datos  información  conocimiento  Competir en este mundo de negocios globalizado
  • 6. ¿qué es minería de datos? • Minería LA PREDICCION PARAproceso por el cual USAR de datos es el MEJORAR Y GANAR EN LOS generamos un modelo que sirva para la NEGOCIOS predicción, – este modelo se genera a partir de datos aplicándoles algún algoritmo que construye el modelo. • El modelo se evalúa para saber que tan certero será respecto a sus predicciones y posteriormente • se utiliza para predecir el comportamiento de cualquier dato nuevo
  • 7. ¿qué es minería de datos? (cont.) • Es la extracción de información implícita, previamente desconocida y potencialmente útil a partir de datos [Witten I.H. et al, 2011] • Es una disciplina joven y de rápido crecimiento, conocida como KDD, … DM como la evolución de TI. [Han J. et al, 2012] • Es la extracción automatizada de información escondida a partir de (grandes) bases de datos. Te permite ser proactivo. Prospectivo en lugar de retrospectivo[Thearling K.]
  • 8. Minería de datos - disciplinas
  • 9. ejemplo: reglas if-then if tasaProducciónLagrimas = reducida then recomendacion = ninguna Else if edad=joven and astigmatismo=no then recomendación = suaves
  • 10. ejemplo: árbol de decisión
  • 11. Aplicación en bibliotecas MBA ID PRODUCTOS OCT-1 1 QA QB OCT-1 2 QC QD OCT-1 3 QE QA OCT-1 4 QB QC OCT-1 5 QD QE QA OCT-2 6 QB QC OCT-2 7 QD QE OCT-2 8 QA QB OCT-2 9 QC QA QB OCT-2 10 QC QA QB OCT-2 11 QC QA QB OCT-2 12 QC QD QE
  • 15. Otras aplicaciones • Marketing • Predicción de ventas, precios, acciones e índices financieros. • Detección de fraudes en tarjetas de crédito • Clasificación y filtrado de documentos, e-mails y noticias. • Análisis de llamadas en Centros de atención telefónica. • Clasificación automática de Quejas y Sugerencias de Clientes.
  • 16. Arquitectura de inteligencia de negocios • Software del sistema (system software) – Sistemas operativos, DBMS, compiladores • Software de aplicación (app software) – Operacional • OLTP y batch • Office, nomina, ventas, ERP – Para la toma de decisiones -> inteligencia de negocios
  • 19. Metodología (cont.) 1) Establecer de manera precisa el problema a resolver - No gastes dinero, antes de comprar un software primero establece que es lo que quieres resolver 2) Exploración inicial -preparación y limpieza de datos -transformaciones de datos - Probar con estadística descriptiva para conocer datos 3) Construcción del modelo y validación - Probar algunos modelos y elegir el mejor para el problema que se está resolviendo 4) Liberación - Una vez construido el modelo se puede usar muchas veces - Los árboles de decisión son fáciles de liberar
  • 20. Recolección/preparación de datos • Extraer, transformar, cargar – Posiblemente ya existe un almacén de datos • Limpieza / calidad de datos • Transformaciones para la minería – “Discretizar” (ejemplo: E B R M) • Muestra(s) -> vistas minables – Cómo se obtiene – Tamaño de la muestra
  • 21. Algoritmos de minería de datos • Clasificación – predicen una o más variables discretas, basandose en los otros atributos en el conjunto de datos. Ejemplo: árboles de decisión • Regresion – predice una o más variables continuas, como perdida o ganancia, basandose en los otros atributos en el conjunto de datos. • Segmentación – divide datos en grupos o clusters de articulos que tienen propiedades similares. • Asociación - encuentran correlaciones entre los diferentes atributos de un conjunto de datos. Sirven para crear reglas de asociación por ejemplo para MBA. • Análisis de secuencia – encuentra secuencias frecuentes o episodios en datos, como en un flujo de rutas Web.
  • 22. Modelo predictivo y su interpretación If temperatura = agradable then humedad = normal
  • 23. Utilizando los resultados • Se recorre el modelo cada vez que se desea predecir – Por ejemplo para decidir a quien otorgarle un apoyo adicional – Por ejemplo para decidir si se le presta o no dinero a alguien • El modelo se puede usar para calificar a los datos de los sistemas operacionales para: – Por ejemplo: identificar “Preferentes” – Por ejemplo: identificar “ evasores fiscales”
  • 24. Software de DM • Weka y pentaho • Rapid Miner • Microsoft SQL Server 2008 R2 • sas enterprise miner • IBM spss • Oracle data mining
  • 25. Minería de datos y ética •Es difícil hacer que los datos sean “anónimos” – 85% de la gente puede ser identificada por su C.P., fecha de nacimiento y genero •La minería de datos se usa para discriminar •Ejemplo: aplicación de prestamos: usar información como sexo, religión o raza no es ético •La situación etica depende de la aplicación •Ejemplo: la misma información esta bien en aplicaciones medicas •Los atributos pueden contener información problematica –Ejemplo: el CP se puede correlacionar con la raza
  • 26. Conclusiones • Minería de datos se ha venido estudiando e investigando pero no se esta aplicando en los diversos problemas de nuestro país – Educación, salud, el campo, eliminar la pobreza • Mientras tenemos científicos trabajando en este tema, debemos preparar a las personas que lo aplicarán. (astrónomos y astronautas) • Es una tecnología que ya está al alcance de todo el mundo • ¿Y el e-commerce? ¿Y la nube? ¿y las iPads? …
  • 27. GRACIAS POR SU ATENCIÓN lgr811@cnys.com.mx lgr811@yahoo.com
  • 28. Bibliografía • campodeEncinos.wordpress.com • http://catarina.udlap.mx/u_dl_a/tales/documentos/msp/gonzalez _r_l/ • http://www.uppuebla.edu.mx/Revista/revista10.pdf • http://hmi.ucsd.edu/pdf/HMI_2009_ConsumerReport_Dec9_2009 .pdf • http://www.cs.waikato.ac.nz/~ml/weka/book.html • Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard Pfahringer, Peter Reutemann, Ian H. Witten (2009); The WEKA Data Mining Software: An Update; SIGKDD Explorations, Volume 11, Issue 1 • Kiron D. et al. Analytics:the widening divide – how companies are achieving competitive advantage through analytics. MIT Sloan/IBM research report fall 2011 • http://www.kdnuggets.com/software/suites.html • http://ccita2010.utmetropolitana.edu.mx/recursos/Recursos_digit ales.pdf