Este documento describe la minería de datos, sus aplicaciones, retos y oportunidades. Primero, explica las ventajas competitivas de la minería de datos y una metodología general. Luego, presenta dos aplicaciones específicas de la minería de datos en televisoras y bancos. Finalmente, concluye que existen múltiples áreas de oportunidad pero también la necesidad de recursos humanos capacitados.
4. Crecimiento Exponencial
Tamaño de la base de datos de UPS
•
para registro de envios: 17 terabytes
Libros en “The Library of Congress”:
•
17 millones
Espacio por libro: 1 Mega
Espacio requerido: 17 terabytes
Elemento 1900 2000 % crecim.
Población 1.6 billones 6 billones 3.75
Velocidad terrerste 100 millas/hr 400 millas/hr 4
Distancia 25,000 millas 475,000 1,500
Velocidad aérea 200 millas/hr 25,000 millas/hr 12,500
Datos 10s Mega bytes 10s Tera bytes 100,000
4
5. Habilitadores Tecnológicos
Costo por megabyte en disco
hace diez años: ≈ $50.00 USD
actualmente: ≈ $0.10 USD
Costo de un terabyte :
actualmente: ≈ $100,000 USD
Velocidad de procesamiento
Computadora Alaska a 1.35
Gigaherts a $1,500 USD
Memoria RAM
PC con memoria RAM de 128M a
1 Giga por menos de $2,000 USD
5
7. Elementos de competitividad
Negocios
Inteligencia de Negocios
Aprendizaje organizacional (CRM)
OLTP RDB, DWH, DM OLAP
Sentidos Razonamiento
Memoria
Minería de datos
Aprendizaje 7
8. Elementos de competitividad
Aprender sobre los clientes y utilizar
lo aprendido sobre los clientes para
aumentar la rentabilidad de la
compañía y hacerles a los clientes la
vida más fácil
B2B
Tipos de cliente
B2C
8
9. Elementos de Competitividad
Adquisición Activación Admón de la relación Cliente
perdido
Cliente Cliente Cliente Cliente Retiro
prospecto nuevo establecido rentable voluntario
Mercado Cliente Cliente Cliente
meta nuevo inicial potencial
Cliente Retiro
bajo valor forzado
Winback
Campañas winback
Respuesta a Nivel de compra Cancelaciones forzadas
Campañas de
campañas de
adquisición
adquisición Ventas cruzadas Cero compras
Solicitudes Upgrades
9
Cancelación voluntaria
10. Minería De Datos
Proceso para la
extracción de
patrones
significativos en
grandes volumenes
de datos El pasado es un buen
predictor del futuro
Hay datos disponibles
Los datos contienen lo
que queremos predecir
10
11. Uso de la Minería de Datos
tarea
síntesis análisis
especifcar diseñar ensambar predecir identificar controlar
planear configurar modificar clasificar diagnosticar monitorear
Tipos de tareas
11
12. Uso de la Minería de Datos
BD Anunciantes
Demográficos
Cola de anuncios Perfil de anunciantes
Anunciantes
Minería Agentes
De datos Personales
Edos financ Anuncios
Clientes
Perfiles genéricos
Generadores de contenido
Blackboard
Tiendas
Experto en
Mercadotecnia
12
13. Metodología de Minería de
Datos
Herramientas
y técnicas
Obtención y preparación
de datos Construir modelo
Definición del problema y
establecimiento de metas
Resultados Usar modelo
Evaluar resultados
13
14. Identificación de problemas
Incrementar en un 5% el volumen de
ventas del producto A en la región 5 en
los siguientes 3 meses
Reducir en un 10% el desperdicio de
materia prima en la producción del
producto Y en la línea de ensamble 3
durante el mes de Octubre
Encontrar las características
demográficas de la población que
comprará el producto Z en la zona norte
durante el próximo año
Metas de negocio concretas
14
15. Preparar los datos
Archivo
RDBMS
Data
marts Preparar
datos
Data
warehouse
Tabla de datamining
Hoja
Excel
Diversas fuentes de datos
15
16. Modelación
Conjunto
de Modelo
entrenamiento
inicial
Construir
Conjunto
de Modelo
depuración
modelo depurado
Conjunto
de Modelo
prueba
probado
Usar Predicciones
Datos reales modelo
Construir y usar el modelo
16
17. Técnicas y herramientas
Arboles de decisión
Entropía Enterprise Miner SAS
Gini Clementine SPSS
Redes Bayesianas Mine Set SGI
Clasificador Bayesiano Intelligent Miner IBM
Redes neuronales CART Salford Systems
Retropropagación See5
Mapas autoorganizados Bonsai
Prospect
17
18. Aplicación de Minería de Datos
Pronosticar el rating de
los programas de un
canal de televisión
Pronosticar el número de
televisores encendidos
Pronosticar el porcentaje
de participación (share)
Definición del problema
18
19. Aplicación de Minería de Datos
Telereport
Preparación
IBOPE BD
de datos
Oracle
Ratings por Tabla de
programa por
canal DM
Presentación de Programación Construcción RN
resultados de RetroProp
Pronósticos KB
Uso de la RN
19
20. Aplicación de Minería de Datos
Encendidos
Totales
Calcula
Share Otros Encendidos
Canales y
Share por Canal Calcula Pronósticos
y ratings por canal de Ratings
y
20
21. Aplicación de Minería de Datos
Pronóstico de efectivo en
cajeros automáticos
Si se dota el cajero con pocos
fondos, se quedará sin
dinero y dará un mal
servicio al cliente
Si se dota el cajero con mucho
dinero, habrá un costo
financiero asociado con el
dinero improductivo
Definición del problema
21
22. Aplicación de Minería de Datos
Meta de negocio:
Actualmente: 3 pesos por cada
peso entregado, y 5% de
cajeros sin dinero
Meta: 2 pesos por cada peso
entregado y 2.5% de cajeros
sin dinero
22
23. Aplicación de Minería de Datos
Sistema Preparación
cajeros
BD de datos
Pronóstico por Tabla de
Cajero y por
día DM
Presentación de Programación Construcción RN
resultados de Kohonen
Pronósticos KB
Uso de la RN
23
24. Conclusiones
Múltiples áreas de
oportunidad
Necesidad de recursos
humanos capacitados en
el uso tecnologías
inteligentes
24
25. Conclusiones
Ciencias de lo artificial: Diseño
Inteligencia Artificial
Matemáticas Ingeniería del
Conocimiento
Lógica Ingeniero en Minería de
Sistemas Datos
Cibernética y Inteligentes
Teoría de HCI
Información
Logística y
Robótica DSS
Computabilidad
25