2. Motivaciones
Muchosdatos (digitalesydisponibles)
- Web data (contenidoyuso)
- comercioelectrónico, transaccionesbancarias
- Sensores, satélites, telescópios, simulaciones
- Bioinformática
- Social media
- Mobile
Computadoras/procesamientobaratas
- procesamiento en la nube (PASS)
- poder de cómputoen unadesktop
Empresascuyo valor reside en el usointeligente de los
datosgeneradosporsusclientes.
Amazon, Facebook, Google, Linkedin, Netflix
7puentes.com Data Mining
3. Data Science & Big Data
Nueva generación de problemas
- Web & Social media
- Mobile
- Sistemas de Recomendación
El Científico de Datos (data scientist)
- Formación en IA, estadísticas, algoritmos, base de datos,
gestiónproyectos, arquitecturasdistribuidas, visualización de datos.
- Maestrías de DM en Argentina
- Cursos online de 1er nivel. Stanford, MIT, Udacity
Competitions
- Netflix prize
- Kaggle&Infochimps
7puentes.com Data Mining
4. Maestría en Explotación de Datosy
Descubrimiento del Conocimiento
Objetivos:
- FormaciónCarrera de EspecializaciónyMaestría
- Investigación: Proyectos
- Consultoría: Cooperaciónycomplementación
- Jornadas de DM: +250 inscriptosxaño
Títulos
- Carrera de especialización: 1 Año
Especialistaunavezaprobadaslasseisasignaturas del primer año.- -
Maestría: 1 AñoAdicional
Magister aprobadaslasseisasignaturas de segundoañoy la defensa
de unaTesis
- Matrícula: +50 inscriptosanuales
7puentes.com Data Mining
5. Maestría en Explotación de Datosy
Descubrimiento del Conocimiento
Admisión:
- Graduados de la UBA con titulo de grado de carreras de cuatroaños
de duraciónygraduados de otrasinstituciones con títulosequivalentes,
- Graduadosde carreras de duraciónmenorluego de
aprobarprerrequisitosocursos de nivelación
- Importante:Vocacióninterdisciplinaria de la Maestría.
Dictado:
- Presencial
- ClasesTeórico-Prácticas
- Asistenciano- obligatoria
- Apoyomediante la Web yprácticas de Laboratorio
- Alumnosregularesyvocacionales
7puentes.com Data Mining
6. Pipeline KDD
[RAW DATA] Selección de Datos
[TARGET DATA] Procesamiento
[PREPOS DATA] Transformación
[TRANSF DATA] Data Mining
[MODEL] Interpretación / Evaluación
[KNOWLEDGE]
7puentes.com Sistemas de Recomendación
8. Tareas
Modelosdescriptivos
- Reconocerpatronessubyacentes en los
datosydarlesunaexplicaciónen español.
- Cuáles son las variables quemejorexplican el fenómeno
Modelospredictivos
- Utilizar la evidenciaparainferircomportamiento en el
futuro (Lógicainductiva)
- Utilizar variables conocidasparainferir el valor de lasque
no se conocen
7puentes.com Data Mining
9. Tareas
Modelosdescriptivos
- Clustering
- Association Rule(*)
- Sequential Pattern(*)
Modelospredictivos
- Clasificación
- Regresión
- Sistemas de Recomendación
7puentes.com Data Mining
11. Modelo de Aprendizaje
Aprendizaje = Mejorar la ejecución de
unatareautilizando la experiencia
- Mejorar la tareaT,
- Con la performance medida a través de
lasmétricasP,
- Basándonos en la experienciaE.
7puentes.com Data Mining
14. Clasificación / Regresión: Ejemplo 1
Direct Marketing
- Targeting: Reconocerdentro de unapoblación
los máspropensos a comprar un producto
- Utilizarhistoria de consumo
- Modelo de clasificación{buy, not-buy}
- Selección de variables
- Modelo de scoring
7puentes.com Data Mining
15. Clasificación / Regresión: Ejemplo 2
Detección de Fraude
- Reconocercasos de
fraudeocomportamientosospechoso en patrones
de consumo.
- Tarjetas de crédito, consumosmédicos, etc.
- Etiquetarpatrones en el
pasadocaracterizadoscomofraude
- Inferirpatrones de conducta similar
- Modelos online. Monitoreo.Tablero de control
7puentes.com Data Mining
16. Clasificación / Regresión: Ejemplo 3
Customer Attrition/Churn
- Reconocer la poblaciónpropensa a abandonar
el servicioabonado.
- Empresas de servicios, CRM.
- Cómo se
comportaronaquellosqueabandonaronel servicio?
- Frecuencia de llamadas al call-center,
consumos claves, pococonsumo vs.
altísimoconsumo.
- Detección de divorcios
7puentes.com Data Mining
17. Clasificación / Regresión: Ejemplo 4
Credit scoring
- Clasificaryasignarpuntaje a los abonados al
servicio.
- (Re)Asignaciónde créditos
- Historiacrediticia
- Indicadoresdemográficos
- Estimación de valor de cuota, mora,
repagoydemásindicadores
7puentes.com Data Mining
18. Clasificación / Regresión: Ejemplo 5
Clasificación de emails
- Categorizarcorreosentrantes / buzones de
sugerencia.
- Asignaciónautomática de responsables
- Pregunta-Respuesta
7puentes.com Data Mining
19. Clasificación / Regresión: Ejemplo 6
Análisis de sentimiento
-
Clasificardocumentossegúnsuorientaciónsubjetiv
a.
- Minado de opiniones
- Buzz monitoring en redessociales
7puentes.com Data Mining
21. Clustering: Ejemplo 1
Market Segmentation
- Dividir a unapoblación en subconjuntoscon
característicassimilares
- Similaridad en cuanto a patrones de consumo
vs. característicasdemográficas.
- Campañasmásenfocadas
- Describir/Explicar los clusters
- Armado de planes de telefoníacelula
- Clusters de sucursalesopuntos de venta
7puentes.com Data Mining
22. Clustering: Ejemplo 2
Clustering de documentos
- Dividir a un corpus en colecciones de
documentossimilares
- Resultados de un motor de
búsquedamásexplicativos
- Communities managers tools
- Eliminaciónduplicados (near-duplicates)
- News aggregators
7puentes.com Data Mining
24. Rules: Ejemplo 1
Marketing & Sales
- Descubirpatrones de
consumosasociadosyconstruirpromociones a
partir de eso
- Productossimilares (restaurantes, libros, discos)
- Productoscomplementarios (accesoriospara el
celular / consola de videojuegos)
- Ciclos de vida
Básico ->deportivo -> 4 puertas -> familiar -> de
lujo ->deportivo ->básico
7puentes.com Data Mining
25. Rules: Ejemplo 2
Mantenimiento
- Descubirpatrones de necesidad de
productos/serviciosasociados al mantenimiento
- Cambio de aceite, neumáticos, cambio de
correa de distribución…
- Adelantarse a la necesidad
de productos de
mantenimiento
7puentes.com Data Mining
26. Rules: Ejemplo 3
Publicidadpersonalizada
- PresentarADspersonalizadosparacadacliente.
- Detectardentro de lasofertas de publicidad, la
másadecuadapara el usuario
- Y en el contexto de consumo: a la noche, dese
un dispositivomóvil, desdesu casa olugar de
trabajo
7puentes.com Data Mining
27. Desafíosactuales
Big Data Complejidad
Escalabilidad Dimensionalidad
Arquitecturaselásticas Streaming
DB & file systems Calidad
distribuidosen el cloud Múltiplesfuentes
Privacidad
Confidenciabilidad
Permisosyuso
7puentes.com Data Mining