Minería de DatosRafael  Zamora  GarridoJulio  2009
2Ejemplos de objetivos de Minería de Datos
3¿Qué es Data Mining?
4¿Qué es Data Mining?La minería de datos utiliza diversas técnicaspara analizar y procesar los datos:
5Técnicas de Minería de DatosEl objetivo del clusteringes definir grupos (o clusters) dentro de los cuales los casos (o los clientes) sean lo más parecidos posible. Por otra parte, los diferentes clusters deben ser, entre sí, lo más distintos posible.Ejemplo:Podemos definir dos clusters: los clientes más rentables y los clientes menos rentables. Dentro del cluster de los clientes más rentables, todos los clientes deben tener una rentabilidad por encima de un determinado umbral.La segmentación es la división (o partición) de la totalidad de los datos en segmentos, según determinados criterios.Ejemplo: Clientes de bancaComo ejemplo de segmentación, podemos considerar una base de datos de clientes de banca. Una segmentación útil sería en términos de rentabilidad: podríamos identificar tres grupos, los más rentables, los de rentabilidad media y los menos rentables. Para cada grupo podríamos identificar una serie de características. Por ejemplo, en el grupo de los clientes más rentables, la media de edad del cliente es de 49 años, mientras que en el grupo de los clientes menos rentables, la media de edad es de 27 años..Nota: No hay que confundir clusteringcon segmentación. La segmentación se usa para identificar grupos que tienen características comunes.
6Técnicas de Minería de DatosConsiste en examinar las características de una entidad nueva y asignarle una clase predefinida. Por ejemplo: Clasificar a un nuevo cliente según su riesgo de crédito (alto, medio, bajo).Ejemplo:Un ejemplo de una técnica de clasificación es la inducción de reglas; otro ejemplo es la red neuronal.La inducción de reglasLa inducción de reglas crea un modelo construido a partir de reglas tipo if-then-else (si-entonces-si no). En general funciona tanto para valores numéricos como para valores categóricos. Los modelos tienen una serie de variables de entrada y una o más variables desalida, pero en contraste con las redes neuronales, se puede ver cómo llegan al resultado o salida. Por ejemplo, un modelo muy sencillo tendría tres variables de entrada, edad, estado civil, cuenta de ahorro, y una de salida, contrata hipoteca. Las dos reglas de proceso (el modelo de datos) podrían ser:"Si edad es entre 18 y 40 años yestado civil es casadoy cuenta de ahorro = sientonces contrata hipoteca⇒ si (18450,78%)"o"Si edad es mayor de 40 añosy estado civil es casadoy tiene cuenta de ahorro = noentonces contrata hipoteca⇒ no (17490,66%)".
7Técnicas de Minería de Datos Las asociaciones se identifican basándose en frecuencias entre los casos.
 Se pueden identificar manualmente, pero hay herramientas que pueden hacerlo de forma automática.
 Es una técnica particularmente útil en el análisis tipo "cesta de la compra" de ventas en supermercados y tiendas en general, y permite identificar productos que se suelen comprar juntos.A partir de un conjunto de datos históricos con resultado conocido, se pretende modelizar estos datos para conocer resultados futuros.Variables de EntradaUn modelo predictivo tiene unas variables de entrada, tiene una o más variables de salida, y tiene un proceso intermedio que actúa sobre las entradas para producir la salida. Variables de SalidaProcesoEjemplo:Los clientes más probables a comprar un nuevo producto,
 el pronóstico de un paciente,
 las agrupaciones de clientes más rentables, etc. 8Modelos CRM

Mineria de Datos

  • 1.
    Minería de DatosRafael Zamora GarridoJulio 2009
  • 2.
    2Ejemplos de objetivosde Minería de Datos
  • 3.
  • 4.
    4¿Qué es DataMining?La minería de datos utiliza diversas técnicaspara analizar y procesar los datos:
  • 5.
    5Técnicas de Mineríade DatosEl objetivo del clusteringes definir grupos (o clusters) dentro de los cuales los casos (o los clientes) sean lo más parecidos posible. Por otra parte, los diferentes clusters deben ser, entre sí, lo más distintos posible.Ejemplo:Podemos definir dos clusters: los clientes más rentables y los clientes menos rentables. Dentro del cluster de los clientes más rentables, todos los clientes deben tener una rentabilidad por encima de un determinado umbral.La segmentación es la división (o partición) de la totalidad de los datos en segmentos, según determinados criterios.Ejemplo: Clientes de bancaComo ejemplo de segmentación, podemos considerar una base de datos de clientes de banca. Una segmentación útil sería en términos de rentabilidad: podríamos identificar tres grupos, los más rentables, los de rentabilidad media y los menos rentables. Para cada grupo podríamos identificar una serie de características. Por ejemplo, en el grupo de los clientes más rentables, la media de edad del cliente es de 49 años, mientras que en el grupo de los clientes menos rentables, la media de edad es de 27 años..Nota: No hay que confundir clusteringcon segmentación. La segmentación se usa para identificar grupos que tienen características comunes.
  • 6.
    6Técnicas de Mineríade DatosConsiste en examinar las características de una entidad nueva y asignarle una clase predefinida. Por ejemplo: Clasificar a un nuevo cliente según su riesgo de crédito (alto, medio, bajo).Ejemplo:Un ejemplo de una técnica de clasificación es la inducción de reglas; otro ejemplo es la red neuronal.La inducción de reglasLa inducción de reglas crea un modelo construido a partir de reglas tipo if-then-else (si-entonces-si no). En general funciona tanto para valores numéricos como para valores categóricos. Los modelos tienen una serie de variables de entrada y una o más variables desalida, pero en contraste con las redes neuronales, se puede ver cómo llegan al resultado o salida. Por ejemplo, un modelo muy sencillo tendría tres variables de entrada, edad, estado civil, cuenta de ahorro, y una de salida, contrata hipoteca. Las dos reglas de proceso (el modelo de datos) podrían ser:"Si edad es entre 18 y 40 años yestado civil es casadoy cuenta de ahorro = sientonces contrata hipoteca⇒ si (18450,78%)"o"Si edad es mayor de 40 añosy estado civil es casadoy tiene cuenta de ahorro = noentonces contrata hipoteca⇒ no (17490,66%)".
  • 7.
    7Técnicas de Mineríade Datos Las asociaciones se identifican basándose en frecuencias entre los casos.
  • 8.
    Se puedenidentificar manualmente, pero hay herramientas que pueden hacerlo de forma automática.
  • 9.
    Es unatécnica particularmente útil en el análisis tipo "cesta de la compra" de ventas en supermercados y tiendas en general, y permite identificar productos que se suelen comprar juntos.A partir de un conjunto de datos históricos con resultado conocido, se pretende modelizar estos datos para conocer resultados futuros.Variables de EntradaUn modelo predictivo tiene unas variables de entrada, tiene una o más variables de salida, y tiene un proceso intermedio que actúa sobre las entradas para producir la salida. Variables de SalidaProcesoEjemplo:Los clientes más probables a comprar un nuevo producto,
  • 10.
    el pronósticode un paciente,
  • 11.
    las agrupacionesde clientes más rentables, etc. 8Modelos CRM