SlideShare una empresa de Scribd logo
1 de 28
Descargar para leer sin conexión
Aplicaciones de minería de
          datos

                Por:
    M.C. Leopoldo González Rosas
         www.cnys.com.mx
   campodeEncinos.wordpress.com
Agenda
• Presentación
• Motivación
• ¿qué es minería de datos?
  – Disciplinas involucradas
• Aplicaciones
  – Bibliotecas
  – Universidades
  – otras
• ¿cómo funciona?
  – Arquitectura de inteligencia de negocios
Agenda (cont.)
  – Metodología: El proceso de descubrimiento de
    conocimiento en bases de datos (KDD)
  – Recolección/preparación de datos
  – Algoritmos
  – Modelo predictivo y su interpretación
  – Utilizando los resultados
     • Toma de decisiones
     • Sistemas operacionales
• Software de minería de datos
• Minería de datos y ética
• Conclusión
Presentación
 Yo:
   Formación académica:
         Licenciatura en Ciencias de la computación – BUAP FCC
         Maestría en Ciencias con especialidad en Ingeniería en Sistemas - UDLAP
   Experiencia profesional
        CNyS S.C. - Consultoría (BI, BD, PM, desarrollo de software)
        gedas VW (BI, preventas, consultoría, LP)
        BBVA Bancomer (BI, LP)
        SFA Puebla (soporte técnico BD)
   Experiencia académica
     Programación
     Bases de datos / Inteligencia de negocios
     Universidades: UDLAP, UPAEP, BUAP
   Áreas de interés
     Bases de datos e inteligencia de negocios
     Desarrollo de software
     Proceso de enseñanza - aprendizaje
Motivación
• “Knowing is not enough; we must apply.
  Willing is not enough; we must do.”.
  Goethe
 Generamos datos de manera exponencial
   Era de información
 Obtener el conocimiento
  oculto en esos datos
   Datos  información  conocimiento
 Competir en este mundo de
  negocios globalizado
¿qué es minería de datos?
• Minería LA PREDICCION PARAproceso por el cual
      USAR
           de datos es el MEJORAR Y GANAR EN LOS
  generamos un modelo que sirva para la
                       NEGOCIOS
  predicción,
  – este modelo se genera a partir de datos
    aplicándoles algún algoritmo que construye el
    modelo.
• El modelo se evalúa para saber que tan
  certero será respecto a sus predicciones y
  posteriormente
• se utiliza para predecir el comportamiento
  de cualquier dato nuevo
¿qué es minería de datos? (cont.)
• Es la extracción de información
  implícita, previamente desconocida y
  potencialmente útil a partir de datos
  [Witten I.H. et al, 2011]
• Es una disciplina joven y de rápido
  crecimiento, conocida como KDD, …
  DM como la evolución de TI. [Han J. et
  al, 2012]
• Es la extracción automatizada de
  información escondida a partir de
  (grandes) bases de datos. Te permite
  ser proactivo. Prospectivo en lugar de
  retrospectivo[Thearling K.]
Minería de datos - disciplinas
ejemplo: reglas if-then
if tasaProducciónLagrimas = reducida
  then recomendacion = ninguna
Else
   if edad=joven and astigmatismo=no
   then recomendación = suaves
ejemplo: árbol de decisión
Aplicación en bibliotecas MBA
ID          PRODUCTOS

OCT-1   1   QA      QB

OCT-1   2   QC      QD

OCT-1   3   QE      QA

OCT-1   4   QB      QC

OCT-1   5   QD      QE   QA

OCT-2   6   QB      QC

OCT-2   7   QD      QE

OCT-2   8   QA      QB

OCT-2   9   QC      QA   QB

OCT-2   10 QC       QA   QB

OCT-2   11 QC       QA   QB

OCT-2   12 QC       QD   QE
Aplicación en bibliotecas DT
Aplicación en universidades
Aplicación universidades
Otras aplicaciones
• Marketing
• Predicción de ventas, precios, acciones e índices
  financieros.
• Detección de fraudes en tarjetas de crédito
• Clasificación y filtrado de documentos, e-mails y
  noticias.
• Análisis de llamadas en Centros de atención
  telefónica.
• Clasificación automática de Quejas y
  Sugerencias de Clientes.
Arquitectura de inteligencia de
             negocios
• Software del sistema (system software)
  – Sistemas operativos, DBMS, compiladores
• Software de aplicación (app software)
  – Operacional
    • OLTP y batch
    • Office, nomina, ventas, ERP
  – Para la toma de decisiones -> inteligencia
    de negocios
Arquitectura
Metodología: KDD
Metodología (cont.)
1) Establecer de manera precisa el problema a resolver
    - No gastes dinero, antes de comprar un software
       primero establece que es lo que quieres resolver
2) Exploración inicial
    -preparación y limpieza de datos
    -transformaciones de datos
    - Probar con estadística descriptiva para conocer datos
3) Construcción del modelo y validación
    - Probar algunos modelos y elegir el mejor para el
       problema que se está resolviendo
4) Liberación
    - Una vez construido el modelo se puede usar muchas
       veces
    - Los árboles de decisión son fáciles de liberar
Recolección/preparación de datos

• Extraer, transformar, cargar
  – Posiblemente ya existe un almacén de datos
• Limpieza / calidad de datos
• Transformaciones para la minería
  – “Discretizar” (ejemplo: E B R M)
• Muestra(s) -> vistas minables
  – Cómo se obtiene
  – Tamaño de la muestra
Algoritmos de minería de datos
• Clasificación – predicen una o más variables discretas,
  basandose en los otros atributos en el conjunto de datos.
  Ejemplo: árboles de decisión
• Regresion – predice una o más variables continuas, como
  perdida o ganancia, basandose en los otros atributos en el
  conjunto de datos.
• Segmentación – divide datos en grupos o clusters de
  articulos que tienen propiedades similares.
• Asociación - encuentran correlaciones entre los diferentes
  atributos de un conjunto de datos. Sirven para crear reglas
  de asociación por ejemplo para MBA.
• Análisis de secuencia – encuentra secuencias frecuentes o
  episodios en datos, como en un flujo de rutas Web.
Modelo predictivo y su interpretación



If temperatura = agradable then humedad = normal
Utilizando los resultados
• Se recorre el modelo cada vez que se desea
  predecir
  – Por ejemplo para decidir a quien otorgarle un
    apoyo adicional
  – Por ejemplo para decidir si se le presta o no
    dinero a alguien
• El modelo se puede usar para calificar a los
  datos de los sistemas operacionales para:
  – Por ejemplo: identificar “Preferentes”
  – Por ejemplo: identificar “ evasores fiscales”
Software de DM
•   Weka y pentaho
•   Rapid Miner
•   Microsoft SQL Server 2008 R2
•   sas enterprise miner
•   IBM spss
•   Oracle data mining
Minería de datos y ética
•Es difícil hacer que los datos sean “anónimos”
   – 85% de la gente puede ser identificada por su
     C.P., fecha de nacimiento y genero
•La minería de datos se usa para discriminar
  •Ejemplo: aplicación de prestamos: usar información como sexo,
  religión o raza no es ético
•La situación etica depende de la aplicación
  •Ejemplo: la misma información esta bien en aplicaciones medicas
•Los atributos pueden contener información
problematica
  –Ejemplo: el CP se puede correlacionar con la raza
Conclusiones
• Minería de datos se ha venido estudiando e
  investigando pero no se esta aplicando en los
  diversos problemas de nuestro país
  – Educación, salud, el campo, eliminar la pobreza
• Mientras tenemos científicos trabajando en este
  tema, debemos preparar a las personas que lo
  aplicarán. (astrónomos y astronautas)
• Es una tecnología que ya está al alcance de todo
  el mundo
• ¿Y el e-commerce? ¿Y la nube? ¿y las iPads? …
GRACIAS POR SU ATENCIÓN




  lgr811@cnys.com.mx
   lgr811@yahoo.com
Bibliografía
• campodeEncinos.wordpress.com
• http://catarina.udlap.mx/u_dl_a/tales/documentos/msp/gonzalez
  _r_l/
• http://www.uppuebla.edu.mx/Revista/revista10.pdf
• http://hmi.ucsd.edu/pdf/HMI_2009_ConsumerReport_Dec9_2009
  .pdf
• http://www.cs.waikato.ac.nz/~ml/weka/book.html
• Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard Pfahringer,
  Peter Reutemann, Ian H. Witten (2009); The WEKA Data Mining
  Software: An Update; SIGKDD Explorations, Volume 11, Issue 1
• Kiron D. et al. Analytics:the widening divide – how companies are
  achieving competitive advantage through analytics. MIT
  Sloan/IBM research report fall 2011
• http://www.kdnuggets.com/software/suites.html
• http://ccita2010.utmetropolitana.edu.mx/recursos/Recursos_digit
  ales.pdf

Más contenido relacionado

La actualidad más candente

Sistemas De Información Gerencial
Sistemas De Información GerencialSistemas De Información Gerencial
Sistemas De Información Gerencialwww.cathedratic.com
 
Cobit- elementos- objetivos- usos- ventajas y desventajas
Cobit- elementos- objetivos- usos- ventajas y desventajasCobit- elementos- objetivos- usos- ventajas y desventajas
Cobit- elementos- objetivos- usos- ventajas y desventajasEstherlenyVargas
 
Unidad 4: Administración de datos en dispositivos móviles
Unidad 4: Administración de datos en dispositivos móvilesUnidad 4: Administración de datos en dispositivos móviles
Unidad 4: Administración de datos en dispositivos móvilesJuan Anaya
 
Presentacion Migracion de Sistemas Computacionales
Presentacion Migracion de Sistemas ComputacionalesPresentacion Migracion de Sistemas Computacionales
Presentacion Migracion de Sistemas ComputacionalesJesus Jimenez
 
Bases de Datos para Dispositivos Móviles - Unidad II: Arquitectura de Base de...
Bases de Datos para Dispositivos Móviles - Unidad II: Arquitectura de Base de...Bases de Datos para Dispositivos Móviles - Unidad II: Arquitectura de Base de...
Bases de Datos para Dispositivos Móviles - Unidad II: Arquitectura de Base de...José Antonio Sandoval Acosta
 
Caso de estudio - aderezo
Caso de estudio - aderezoCaso de estudio - aderezo
Caso de estudio - aderezocindyb22
 
Capitulo 10 auditoria en base de datos
Capitulo 10 auditoria en base de datosCapitulo 10 auditoria en base de datos
Capitulo 10 auditoria en base de datosoamz
 
Informe final de Auditoria Informatica
Informe final de Auditoria InformaticaInforme final de Auditoria Informatica
Informe final de Auditoria InformaticaAmd Cdmas
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Auditoria en desarrollo de sistemas diapo[1]
Auditoria en desarrollo de sistemas diapo[1]Auditoria en desarrollo de sistemas diapo[1]
Auditoria en desarrollo de sistemas diapo[1]caramelomix
 
3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptxRam Vazquez
 
Mapa conceptual sistema de información de una organización
Mapa conceptual sistema de información de una organizaciónMapa conceptual sistema de información de una organización
Mapa conceptual sistema de información de una organizaciónDIEGO OJEDA
 
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISSSISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISSNATHALY ARIAS
 
Aprendizaje de máquina
Aprendizaje de máquinaAprendizaje de máquina
Aprendizaje de máquinaHugo Banda
 
Mapa conceptual de sistema informacion
Mapa conceptual de sistema informacionMapa conceptual de sistema informacion
Mapa conceptual de sistema informacionluisguzman_73
 
Caso practico Auditoria de Sistemas Informaticos
Caso practico Auditoria de Sistemas InformaticosCaso practico Auditoria de Sistemas Informaticos
Caso practico Auditoria de Sistemas InformaticosEduardo Gonzalez
 

La actualidad más candente (20)

Sistemas De Información Gerencial
Sistemas De Información GerencialSistemas De Información Gerencial
Sistemas De Información Gerencial
 
Cobit- elementos- objetivos- usos- ventajas y desventajas
Cobit- elementos- objetivos- usos- ventajas y desventajasCobit- elementos- objetivos- usos- ventajas y desventajas
Cobit- elementos- objetivos- usos- ventajas y desventajas
 
Unidad 4: Administración de datos en dispositivos móviles
Unidad 4: Administración de datos en dispositivos móvilesUnidad 4: Administración de datos en dispositivos móviles
Unidad 4: Administración de datos en dispositivos móviles
 
Presentacion Migracion de Sistemas Computacionales
Presentacion Migracion de Sistemas ComputacionalesPresentacion Migracion de Sistemas Computacionales
Presentacion Migracion de Sistemas Computacionales
 
Bases de Datos para Dispositivos Móviles - Unidad II: Arquitectura de Base de...
Bases de Datos para Dispositivos Móviles - Unidad II: Arquitectura de Base de...Bases de Datos para Dispositivos Móviles - Unidad II: Arquitectura de Base de...
Bases de Datos para Dispositivos Móviles - Unidad II: Arquitectura de Base de...
 
Caso de estudio - aderezo
Caso de estudio - aderezoCaso de estudio - aderezo
Caso de estudio - aderezo
 
Capitulo 10 auditoria en base de datos
Capitulo 10 auditoria en base de datosCapitulo 10 auditoria en base de datos
Capitulo 10 auditoria en base de datos
 
Informe final de Auditoria Informatica
Informe final de Auditoria InformaticaInforme final de Auditoria Informatica
Informe final de Auditoria Informatica
 
PPT EXAMEN RIESGOS.pdf
PPT EXAMEN RIESGOS.pdfPPT EXAMEN RIESGOS.pdf
PPT EXAMEN RIESGOS.pdf
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Auditoria en desarrollo de sistemas diapo[1]
Auditoria en desarrollo de sistemas diapo[1]Auditoria en desarrollo de sistemas diapo[1]
Auditoria en desarrollo de sistemas diapo[1]
 
3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx3.1 Representación de conocimiento mediante reglas.pptx
3.1 Representación de conocimiento mediante reglas.pptx
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Mapa conceptual sistema de información de una organización
Mapa conceptual sistema de información de una organizaciónMapa conceptual sistema de información de una organización
Mapa conceptual sistema de información de una organización
 
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISSSISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
SISTEMAS DE INFORMACIÓN GERENCIAL CASO ESTUDIO: IAMFISS
 
Aprendizaje de máquina
Aprendizaje de máquinaAprendizaje de máquina
Aprendizaje de máquina
 
Mapa conceptual de sistema informacion
Mapa conceptual de sistema informacionMapa conceptual de sistema informacion
Mapa conceptual de sistema informacion
 
Caso practico Auditoria de Sistemas Informaticos
Caso practico Auditoria de Sistemas InformaticosCaso practico Auditoria de Sistemas Informaticos
Caso practico Auditoria de Sistemas Informaticos
 
Organizaciones Duales en la Empresa
Organizaciones Duales en la EmpresaOrganizaciones Duales en la Empresa
Organizaciones Duales en la Empresa
 
Informe Técnico de Auditoría
Informe Técnico de AuditoríaInforme Técnico de Auditoría
Informe Técnico de Auditoría
 

Destacado

Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos04071977
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSlalopg
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuencialesMarilyn Jaramillo
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosmajitol
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Alexander Jimenez
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textosJesús Tramullas
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisMundo Contact
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpenAnalytics Spain
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datosasuoc
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes socialesMaría Muñoz Parra
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentaciónedmaga
 

Destacado (20)

Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos secuenciales
Mineria de datos secuencialesMineria de datos secuenciales
Mineria de datos secuenciales
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
 
Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)Componente de weka (mineria datos ing. software)
Componente de weka (mineria datos ing. software)
 
Minería de datos y textos
Minería de datos y textosMinería de datos y textos
Minería de datos y textos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con Knime
 
Datos mineria chilena cesco
Datos mineria chilena cescoDatos mineria chilena cesco
Datos mineria chilena cesco
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos en redes sociales
Minería de datos en redes socialesMinería de datos en redes sociales
Minería de datos en redes sociales
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 

Similar a aplicaciones de minería de datos

Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data MiningAndres Eyherabide
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Facultad de Informática UCM
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Joaquín Borrego-Díaz
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Pentaho
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analyticsamdia
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Pedro Contreras Flores
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdfDarnelyC
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresUniversidad Nacional del Nordeste
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLPI ONG
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasFelipe Vera (Prodigio Consultores)
 
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Pedro Aaron
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big DataICEMD
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptxJuanCarlosRomanPerez1
 

Similar a aplicaciones de minería de datos (20)

Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Data Mining
Data MiningData Mining
Data Mining
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
IN Unidad 3: Minería de datos
IN Unidad 3: Minería de datosIN Unidad 3: Minería de datos
IN Unidad 3: Minería de datos
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
Predictive Analytics with Pentaho Data Mining - Análisis Predictivo con Penta...
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecas
 
Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
 
Minería de Datos - Unidad 1
Minería de Datos - Unidad 1Minería de Datos - Unidad 1
Minería de Datos - Unidad 1
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx01. Introducción a la Analítica de Datos.pptx
01. Introducción a la Analítica de Datos.pptx
 

aplicaciones de minería de datos

  • 1. Aplicaciones de minería de datos Por: M.C. Leopoldo González Rosas www.cnys.com.mx campodeEncinos.wordpress.com
  • 2. Agenda • Presentación • Motivación • ¿qué es minería de datos? – Disciplinas involucradas • Aplicaciones – Bibliotecas – Universidades – otras • ¿cómo funciona? – Arquitectura de inteligencia de negocios
  • 3. Agenda (cont.) – Metodología: El proceso de descubrimiento de conocimiento en bases de datos (KDD) – Recolección/preparación de datos – Algoritmos – Modelo predictivo y su interpretación – Utilizando los resultados • Toma de decisiones • Sistemas operacionales • Software de minería de datos • Minería de datos y ética • Conclusión
  • 4. Presentación  Yo:  Formación académica:  Licenciatura en Ciencias de la computación – BUAP FCC  Maestría en Ciencias con especialidad en Ingeniería en Sistemas - UDLAP  Experiencia profesional  CNyS S.C. - Consultoría (BI, BD, PM, desarrollo de software)  gedas VW (BI, preventas, consultoría, LP)  BBVA Bancomer (BI, LP)  SFA Puebla (soporte técnico BD)  Experiencia académica  Programación  Bases de datos / Inteligencia de negocios  Universidades: UDLAP, UPAEP, BUAP  Áreas de interés  Bases de datos e inteligencia de negocios  Desarrollo de software  Proceso de enseñanza - aprendizaje
  • 5. Motivación • “Knowing is not enough; we must apply. Willing is not enough; we must do.”. Goethe  Generamos datos de manera exponencial  Era de información  Obtener el conocimiento oculto en esos datos  Datos  información  conocimiento  Competir en este mundo de negocios globalizado
  • 6. ¿qué es minería de datos? • Minería LA PREDICCION PARAproceso por el cual USAR de datos es el MEJORAR Y GANAR EN LOS generamos un modelo que sirva para la NEGOCIOS predicción, – este modelo se genera a partir de datos aplicándoles algún algoritmo que construye el modelo. • El modelo se evalúa para saber que tan certero será respecto a sus predicciones y posteriormente • se utiliza para predecir el comportamiento de cualquier dato nuevo
  • 7. ¿qué es minería de datos? (cont.) • Es la extracción de información implícita, previamente desconocida y potencialmente útil a partir de datos [Witten I.H. et al, 2011] • Es una disciplina joven y de rápido crecimiento, conocida como KDD, … DM como la evolución de TI. [Han J. et al, 2012] • Es la extracción automatizada de información escondida a partir de (grandes) bases de datos. Te permite ser proactivo. Prospectivo en lugar de retrospectivo[Thearling K.]
  • 8. Minería de datos - disciplinas
  • 9. ejemplo: reglas if-then if tasaProducciónLagrimas = reducida then recomendacion = ninguna Else if edad=joven and astigmatismo=no then recomendación = suaves
  • 10. ejemplo: árbol de decisión
  • 11. Aplicación en bibliotecas MBA ID PRODUCTOS OCT-1 1 QA QB OCT-1 2 QC QD OCT-1 3 QE QA OCT-1 4 QB QC OCT-1 5 QD QE QA OCT-2 6 QB QC OCT-2 7 QD QE OCT-2 8 QA QB OCT-2 9 QC QA QB OCT-2 10 QC QA QB OCT-2 11 QC QA QB OCT-2 12 QC QD QE
  • 15. Otras aplicaciones • Marketing • Predicción de ventas, precios, acciones e índices financieros. • Detección de fraudes en tarjetas de crédito • Clasificación y filtrado de documentos, e-mails y noticias. • Análisis de llamadas en Centros de atención telefónica. • Clasificación automática de Quejas y Sugerencias de Clientes.
  • 16. Arquitectura de inteligencia de negocios • Software del sistema (system software) – Sistemas operativos, DBMS, compiladores • Software de aplicación (app software) – Operacional • OLTP y batch • Office, nomina, ventas, ERP – Para la toma de decisiones -> inteligencia de negocios
  • 19. Metodología (cont.) 1) Establecer de manera precisa el problema a resolver - No gastes dinero, antes de comprar un software primero establece que es lo que quieres resolver 2) Exploración inicial -preparación y limpieza de datos -transformaciones de datos - Probar con estadística descriptiva para conocer datos 3) Construcción del modelo y validación - Probar algunos modelos y elegir el mejor para el problema que se está resolviendo 4) Liberación - Una vez construido el modelo se puede usar muchas veces - Los árboles de decisión son fáciles de liberar
  • 20. Recolección/preparación de datos • Extraer, transformar, cargar – Posiblemente ya existe un almacén de datos • Limpieza / calidad de datos • Transformaciones para la minería – “Discretizar” (ejemplo: E B R M) • Muestra(s) -> vistas minables – Cómo se obtiene – Tamaño de la muestra
  • 21. Algoritmos de minería de datos • Clasificación – predicen una o más variables discretas, basandose en los otros atributos en el conjunto de datos. Ejemplo: árboles de decisión • Regresion – predice una o más variables continuas, como perdida o ganancia, basandose en los otros atributos en el conjunto de datos. • Segmentación – divide datos en grupos o clusters de articulos que tienen propiedades similares. • Asociación - encuentran correlaciones entre los diferentes atributos de un conjunto de datos. Sirven para crear reglas de asociación por ejemplo para MBA. • Análisis de secuencia – encuentra secuencias frecuentes o episodios en datos, como en un flujo de rutas Web.
  • 22. Modelo predictivo y su interpretación If temperatura = agradable then humedad = normal
  • 23. Utilizando los resultados • Se recorre el modelo cada vez que se desea predecir – Por ejemplo para decidir a quien otorgarle un apoyo adicional – Por ejemplo para decidir si se le presta o no dinero a alguien • El modelo se puede usar para calificar a los datos de los sistemas operacionales para: – Por ejemplo: identificar “Preferentes” – Por ejemplo: identificar “ evasores fiscales”
  • 24. Software de DM • Weka y pentaho • Rapid Miner • Microsoft SQL Server 2008 R2 • sas enterprise miner • IBM spss • Oracle data mining
  • 25. Minería de datos y ética •Es difícil hacer que los datos sean “anónimos” – 85% de la gente puede ser identificada por su C.P., fecha de nacimiento y genero •La minería de datos se usa para discriminar •Ejemplo: aplicación de prestamos: usar información como sexo, religión o raza no es ético •La situación etica depende de la aplicación •Ejemplo: la misma información esta bien en aplicaciones medicas •Los atributos pueden contener información problematica –Ejemplo: el CP se puede correlacionar con la raza
  • 26. Conclusiones • Minería de datos se ha venido estudiando e investigando pero no se esta aplicando en los diversos problemas de nuestro país – Educación, salud, el campo, eliminar la pobreza • Mientras tenemos científicos trabajando en este tema, debemos preparar a las personas que lo aplicarán. (astrónomos y astronautas) • Es una tecnología que ya está al alcance de todo el mundo • ¿Y el e-commerce? ¿Y la nube? ¿y las iPads? …
  • 27. GRACIAS POR SU ATENCIÓN lgr811@cnys.com.mx lgr811@yahoo.com
  • 28. Bibliografía • campodeEncinos.wordpress.com • http://catarina.udlap.mx/u_dl_a/tales/documentos/msp/gonzalez _r_l/ • http://www.uppuebla.edu.mx/Revista/revista10.pdf • http://hmi.ucsd.edu/pdf/HMI_2009_ConsumerReport_Dec9_2009 .pdf • http://www.cs.waikato.ac.nz/~ml/weka/book.html • Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard Pfahringer, Peter Reutemann, Ian H. Witten (2009); The WEKA Data Mining Software: An Update; SIGKDD Explorations, Volume 11, Issue 1 • Kiron D. et al. Analytics:the widening divide – how companies are achieving competitive advantage through analytics. MIT Sloan/IBM research report fall 2011 • http://www.kdnuggets.com/software/suites.html • http://ccita2010.utmetropolitana.edu.mx/recursos/Recursos_digit ales.pdf