SlideShare una empresa de Scribd logo
1 de 28
Data
Mining
@AETTI 2012
Lic. Ernesto Mislej
ernesto@7puentes.com - @fetnelio

AETTI 2012
Agosto 2012 – Tucumán –Argentina

                 7puentes.com
Motivaciones

Muchosdatos (digitalesydisponibles)
 - Web data (contenidoyuso)
 - comercioelectrónico, transaccionesbancarias
 - Sensores, satélites, telescópios, simulaciones
 - Bioinformática
 - Social media
 - Mobile

Computadoras/procesamientobaratas
 - procesamiento en la nube (PASS)
 - poder de cómputoen unadesktop

Empresascuyo valor reside en el usointeligente de los
 datosgeneradosporsusclientes.
 Amazon, Facebook, Google, Linkedin, Netflix

  7puentes.com                                          Data Mining
Data Science & Big Data

Nueva generación de problemas
 - Web & Social media
 - Mobile
 - Sistemas de Recomendación

El Científico de Datos (data scientist)
 - Formación en IA, estadísticas, algoritmos, base de datos,
 gestiónproyectos, arquitecturasdistribuidas, visualización de datos.
 - Maestrías de DM en Argentina
 - Cursos online de 1er nivel. Stanford, MIT, Udacity

Competitions
 - Netflix prize
 - Kaggle&Infochimps


  7puentes.com                                               Data Mining
Maestría en Explotación de Datosy
   Descubrimiento del Conocimiento
Objetivos:
 - FormaciónCarrera de EspecializaciónyMaestría
 - Investigación: Proyectos
 - Consultoría: Cooperaciónycomplementación
 - Jornadas de DM: +250 inscriptosxaño

Títulos
 - Carrera de especialización: 1 Año
 Especialistaunavezaprobadaslasseisasignaturas del primer año.- -
 Maestría: 1 AñoAdicional
 Magister aprobadaslasseisasignaturas de segundoañoy la defensa
 de unaTesis
 - Matrícula: +50 inscriptosanuales



  7puentes.com                                           Data Mining
Maestría en Explotación de Datosy
   Descubrimiento del Conocimiento
Admisión:
 - Graduados de la UBA con titulo de grado de carreras de cuatroaños
 de duraciónygraduados de otrasinstituciones con títulosequivalentes,
 - Graduadosde carreras de duraciónmenorluego de
 aprobarprerrequisitosocursos de nivelación
 - Importante:Vocacióninterdisciplinaria de la Maestría.

Dictado:
 - Presencial
 - ClasesTeórico-Prácticas
 - Asistenciano- obligatoria
 - Apoyomediante la Web yprácticas de Laboratorio
 - Alumnosregularesyvocacionales



  7puentes.com                                             Data Mining
Pipeline KDD


[RAW DATA] Selección de Datos


    [TARGET DATA] Procesamiento


        [PREPOS DATA] Transformación


             [TRANSF DATA] Data Mining


                 [MODEL] Interpretación / Evaluación



                            [KNOWLEDGE]

 7puentes.com                                     Sistemas de Recomendación
Orígenes




7puentes.com              Data Mining
Tareas

Modelosdescriptivos
 - Reconocerpatronessubyacentes en los
 datosydarlesunaexplicaciónen español.
 - Cuáles son las variables quemejorexplican el fenómeno

Modelospredictivos
 - Utilizar la evidenciaparainferircomportamiento en el
 futuro (Lógicainductiva)
 - Utilizar variables conocidasparainferir el valor de lasque
 no se conocen




  7puentes.com                                      Data Mining
Tareas

Modelosdescriptivos
 - Clustering
 - Association Rule(*)
 - Sequential Pattern(*)

Modelospredictivos
 - Clasificación
 - Regresión
 - Sistemas de Recomendación




  7puentes.com                      Data Mining
Modelo de Aprendizaje




7puentes.com                       Data Mining
Modelo de Aprendizaje

Aprendizaje = Mejorar la ejecución de
 unatareautilizando la experiencia

- Mejorar la tareaT,

- Con la performance medida a través de
 lasmétricasP,

- Basándonos en la experienciaE.

 7puentes.com                       Data Mining
Lógicainductiva




7puentes.com                     Data Mining
Clasificación / Regresión




7puentes.com                         Data Mining
Clasificación / Regresión: Ejemplo 1

Direct Marketing
 - Targeting: Reconocerdentro de unapoblación
 los máspropensos a comprar un producto
 - Utilizarhistoria de consumo
 - Modelo de clasificación{buy, not-buy}
 - Selección de variables
 - Modelo de scoring




 7puentes.com                           Data Mining
Clasificación / Regresión: Ejemplo 2

Detección de Fraude
 - Reconocercasos de
 fraudeocomportamientosospechoso en patrones
 de consumo.
 - Tarjetas de crédito, consumosmédicos, etc.
 - Etiquetarpatrones en el
 pasadocaracterizadoscomofraude
 - Inferirpatrones de conducta similar
 - Modelos online. Monitoreo.Tablero de control



 7puentes.com                            Data Mining
Clasificación / Regresión: Ejemplo 3

Customer Attrition/Churn
 - Reconocer la poblaciónpropensa a abandonar
 el servicioabonado.
 - Empresas de servicios, CRM.
 - Cómo se
 comportaronaquellosqueabandonaronel servicio?
 - Frecuencia de llamadas al call-center,
 consumos claves, pococonsumo vs.
 altísimoconsumo.
 - Detección de divorcios

 7puentes.com                          Data Mining
Clasificación / Regresión: Ejemplo 4

Credit scoring
 - Clasificaryasignarpuntaje a los abonados al
 servicio.
 - (Re)Asignaciónde créditos
 - Historiacrediticia
 - Indicadoresdemográficos
 - Estimación de valor de cuota, mora,
 repagoydemásindicadores




  7puentes.com                             Data Mining
Clasificación / Regresión: Ejemplo 5

Clasificación de emails
 - Categorizarcorreosentrantes / buzones de
 sugerencia.
 - Asignaciónautomática de responsables
 - Pregunta-Respuesta




 7puentes.com                            Data Mining
Clasificación / Regresión: Ejemplo 6

Análisis de sentimiento
 -
 Clasificardocumentossegúnsuorientaciónsubjetiv
 a.
 - Minado de opiniones
 - Buzz monitoring en redessociales




 7puentes.com                           Data Mining
Clustering




7puentes.com                Data Mining
Clustering: Ejemplo 1

Market Segmentation
 - Dividir a unapoblación en subconjuntoscon
 característicassimilares
 - Similaridad en cuanto a patrones de consumo
 vs. característicasdemográficas.
 - Campañasmásenfocadas
 - Describir/Explicar los clusters
 - Armado de planes de telefoníacelula
 - Clusters de sucursalesopuntos de venta



 7puentes.com                            Data Mining
Clustering: Ejemplo 2

Clustering de documentos
 - Dividir a un corpus en colecciones de
 documentossimilares
 - Resultados de un motor de
 búsquedamásexplicativos
 - Communities managers tools
 - Eliminaciónduplicados (near-duplicates)
 - News aggregators




  7puentes.com                               Data Mining
Association Rule / Sequential Pattern




7puentes.com                    Data Mining
Rules: Ejemplo 1

Marketing & Sales
 - Descubirpatrones de
 consumosasociadosyconstruirpromociones a
 partir de eso
 - Productossimilares (restaurantes, libros, discos)
 - Productoscomplementarios (accesoriospara el
 celular / consola de videojuegos)
 - Ciclos de vida
 Básico ->deportivo -> 4 puertas -> familiar -> de
 lujo ->deportivo ->básico

  7puentes.com                              Data Mining
Rules: Ejemplo 2

Mantenimiento
 - Descubirpatrones de necesidad de
 productos/serviciosasociados al mantenimiento
 - Cambio de aceite, neumáticos, cambio de
 correa de distribución…
 - Adelantarse a la necesidad
 de productos de
 mantenimiento




 7puentes.com                            Data Mining
Rules: Ejemplo 3

Publicidadpersonalizada
 - PresentarADspersonalizadosparacadacliente.
 - Detectardentro de lasofertas de publicidad, la
 másadecuadapara el usuario
 - Y en el contexto de consumo: a la noche, dese
 un dispositivomóvil, desdesu casa olugar de
 trabajo




  7puentes.com                             Data Mining
Desafíosactuales

Big Data                   Complejidad
 Escalabilidad              Dimensionalidad
 Arquitecturaselásticas     Streaming
 DB & file systems          Calidad
 distribuidosen el cloud    Múltiplesfuentes

Privacidad
 Confidenciabilidad
 Permisosyuso



  7puentes.com                             Data Mining
Gracias
porvuestra
atención
Lic. Ernesto Mislej
ernesto@7puentes.com - @fetnelio




                 7puentes.com

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Proyecto mineria de_datos_caso_2
Proyecto mineria de_datos_caso_2Proyecto mineria de_datos_caso_2
Proyecto mineria de_datos_caso_2
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Mining
 
MIneria de datos
MIneria de datosMIneria de datos
MIneria de datos
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 
Ensayo sobre data mining
Ensayo sobre data miningEnsayo sobre data mining
Ensayo sobre data mining
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 

Destacado (16)

Unidad 3 tsbd olap
Unidad 3 tsbd olapUnidad 3 tsbd olap
Unidad 3 tsbd olap
 
Cubo
CuboCubo
Cubo
 
Data Mining en Forman
Data Mining en FormanData Mining en Forman
Data Mining en Forman
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
OLAP
OLAPOLAP
OLAP
 
Introduccion a Machine Learning
Introduccion a Machine LearningIntroduccion a Machine Learning
Introduccion a Machine Learning
 
Curso de Nivelación de Algoritmos - Clase 1
Curso de Nivelación de Algoritmos - Clase 1Curso de Nivelación de Algoritmos - Clase 1
Curso de Nivelación de Algoritmos - Clase 1
 
Curso de Nivelación de Algoritmos - Clase 2
Curso de Nivelación de Algoritmos - Clase 2Curso de Nivelación de Algoritmos - Clase 2
Curso de Nivelación de Algoritmos - Clase 2
 
Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3
 
Introducción a Text Mining
Introducción a Text MiningIntroducción a Text Mining
Introducción a Text Mining
 
Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
 
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
Text Mining: Segmentaciónd de Usuarios de Twitter. Lima Metropolitana.
 
Desmitificando el Big Data
Desmitificando el Big DataDesmitificando el Big Data
Desmitificando el Big Data
 
Modelo CMMI
Modelo CMMIModelo CMMI
Modelo CMMI
 
Big data diapositivas
Big data diapositivasBig data diapositivas
Big data diapositivas
 

Similar a Data Mining

Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouseEduardo Castro
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azureEduardo Castro
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analyticsamdia
 
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data MiningGerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data MiningSunnely Sequera
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big DataICEMD
 
Introducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big DataIntroducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big DataDavid Hurtado
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datosdataminingperu
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datosdataminingperu
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxJavierNavarrete43
 
Big Data para procesos. De TV3 a cualquier PYME
Big Data para procesos. De TV3 a cualquier PYMEBig Data para procesos. De TV3 a cualquier PYME
Big Data para procesos. De TV3 a cualquier PYMEOpenBigDataManagement
 
Curso de Minería de Datos
Curso de Minería de Datos Curso de Minería de Datos
Curso de Minería de Datos dataminingperu
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackEduardo Castro
 
Sistema de información ensayo
Sistema de información ensayoSistema de información ensayo
Sistema de información ensayoANilez Solrak
 
Sistema de información ensayo
Sistema de información ensayoSistema de información ensayo
Sistema de información ensayoANilez Solrak
 
Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid MinerLPI ONG
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014Eduardo Castro
 
Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stackEduardo Castro
 

Similar a Data Mining (20)

Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Actividades de aprendizaje22
Actividades de aprendizaje22Actividades de aprendizaje22
Actividades de aprendizaje22
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data MiningGerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
Introducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big DataIntroducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big Data
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datos
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datos
 
Big-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptxBig-Data-aplicado-a-los-Negocios (1).pptx
Big-Data-aplicado-a-los-Negocios (1).pptx
 
Big Data para procesos. De TV3 a cualquier PYME
Big Data para procesos. De TV3 a cualquier PYMEBig Data para procesos. De TV3 a cualquier PYME
Big Data para procesos. De TV3 a cualquier PYME
 
Curso de Minería de Datos
Curso de Minería de Datos Curso de Minería de Datos
Curso de Minería de Datos
 
Resumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data StackResumen del Microsoft Big Data Stack
Resumen del Microsoft Big Data Stack
 
Sistema de información ensayo
Sistema de información ensayoSistema de información ensayo
Sistema de información ensayo
 
Sistema de información ensayo
Sistema de información ensayoSistema de información ensayo
Sistema de información ensayo
 
222222222222
222222222222222222222222
222222222222
 
Taller práctico de Analítica Predictiva con Rapid Miner
Taller práctico de Analítica Predictiva  con Rapid MinerTaller práctico de Analítica Predictiva  con Rapid Miner
Taller práctico de Analítica Predictiva con Rapid Miner
 
Big data con SQL Server 2014
Big data con SQL Server 2014Big data con SQL Server 2014
Big data con SQL Server 2014
 
Introduccion a Big Data stack
Introduccion a Big Data stackIntroduccion a Big Data stack
Introduccion a Big Data stack
 

Más de Ernesto Mislej

Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónErnesto Mislej
 
Tópicos de Big Data - Sistemas de Recomendación
Tópicos de Big Data - Sistemas de RecomendaciónTópicos de Big Data - Sistemas de Recomendación
Tópicos de Big Data - Sistemas de RecomendaciónErnesto Mislej
 
Tópicos de Big Data - Link Analysis
Tópicos de Big Data - Link AnalysisTópicos de Big Data - Link Analysis
Tópicos de Big Data - Link AnalysisErnesto Mislej
 
Tópicos de Big Data - Items Similares
Tópicos de Big Data - Items SimilaresTópicos de Big Data - Items Similares
Tópicos de Big Data - Items SimilaresErnesto Mislej
 
Data Science & Big Data
Data Science & Big DataData Science & Big Data
Data Science & Big DataErnesto Mislej
 
Innovación en Big Data
Innovación en Big DataInnovación en Big Data
Innovación en Big DataErnesto Mislej
 
Dime qué tuiteas y te diré quién eres. DataFest 2013
Dime qué tuiteas y te diré quién eres. DataFest 2013Dime qué tuiteas y te diré quién eres. DataFest 2013
Dime qué tuiteas y te diré quién eres. DataFest 2013Ernesto Mislej
 
A quienes les gustó esta charla también les gustó... Cómo los Sistemas de Rec...
A quienes les gustó esta charla también les gustó... Cómo los Sistemas de Rec...A quienes les gustó esta charla también les gustó... Cómo los Sistemas de Rec...
A quienes les gustó esta charla también les gustó... Cómo los Sistemas de Rec...Ernesto Mislej
 
Opinion Mining #datafestAr
Opinion Mining #datafestArOpinion Mining #datafestAr
Opinion Mining #datafestArErnesto Mislej
 
Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4Ernesto Mislej
 
Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5Ernesto Mislej
 
Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011Ernesto Mislej
 
Análisis Inteligente de Textos
Análisis Inteligente de TextosAnálisis Inteligente de Textos
Análisis Inteligente de TextosErnesto Mislej
 

Más de Ernesto Mislej (14)

Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Tópicos de Big Data - Sistemas de Recomendación
Tópicos de Big Data - Sistemas de RecomendaciónTópicos de Big Data - Sistemas de Recomendación
Tópicos de Big Data - Sistemas de Recomendación
 
Tópicos de Big Data - Link Analysis
Tópicos de Big Data - Link AnalysisTópicos de Big Data - Link Analysis
Tópicos de Big Data - Link Analysis
 
Tópicos de Big Data - Items Similares
Tópicos de Big Data - Items SimilaresTópicos de Big Data - Items Similares
Tópicos de Big Data - Items Similares
 
Data Science & Big Data
Data Science & Big DataData Science & Big Data
Data Science & Big Data
 
Innovación en Big Data
Innovación en Big DataInnovación en Big Data
Innovación en Big Data
 
Dime qué tuiteas y te diré quién eres. DataFest 2013
Dime qué tuiteas y te diré quién eres. DataFest 2013Dime qué tuiteas y te diré quién eres. DataFest 2013
Dime qué tuiteas y te diré quién eres. DataFest 2013
 
A quienes les gustó esta charla también les gustó... Cómo los Sistemas de Rec...
A quienes les gustó esta charla también les gustó... Cómo los Sistemas de Rec...A quienes les gustó esta charla también les gustó... Cómo los Sistemas de Rec...
A quienes les gustó esta charla también les gustó... Cómo los Sistemas de Rec...
 
Opinion Mining #datafestAr
Opinion Mining #datafestArOpinion Mining #datafestAr
Opinion Mining #datafestAr
 
Opinion Mining
Opinion MiningOpinion Mining
Opinion Mining
 
Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4
 
Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5
 
Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011Recommender Systems! @ASAI 2011
Recommender Systems! @ASAI 2011
 
Análisis Inteligente de Textos
Análisis Inteligente de TextosAnálisis Inteligente de Textos
Análisis Inteligente de Textos
 

Data Mining

  • 1. Data Mining @AETTI 2012 Lic. Ernesto Mislej ernesto@7puentes.com - @fetnelio AETTI 2012 Agosto 2012 – Tucumán –Argentina 7puentes.com
  • 2. Motivaciones Muchosdatos (digitalesydisponibles) - Web data (contenidoyuso) - comercioelectrónico, transaccionesbancarias - Sensores, satélites, telescópios, simulaciones - Bioinformática - Social media - Mobile Computadoras/procesamientobaratas - procesamiento en la nube (PASS) - poder de cómputoen unadesktop Empresascuyo valor reside en el usointeligente de los datosgeneradosporsusclientes. Amazon, Facebook, Google, Linkedin, Netflix 7puentes.com Data Mining
  • 3. Data Science & Big Data Nueva generación de problemas - Web & Social media - Mobile - Sistemas de Recomendación El Científico de Datos (data scientist) - Formación en IA, estadísticas, algoritmos, base de datos, gestiónproyectos, arquitecturasdistribuidas, visualización de datos. - Maestrías de DM en Argentina - Cursos online de 1er nivel. Stanford, MIT, Udacity Competitions - Netflix prize - Kaggle&Infochimps 7puentes.com Data Mining
  • 4. Maestría en Explotación de Datosy Descubrimiento del Conocimiento Objetivos: - FormaciónCarrera de EspecializaciónyMaestría - Investigación: Proyectos - Consultoría: Cooperaciónycomplementación - Jornadas de DM: +250 inscriptosxaño Títulos - Carrera de especialización: 1 Año Especialistaunavezaprobadaslasseisasignaturas del primer año.- - Maestría: 1 AñoAdicional Magister aprobadaslasseisasignaturas de segundoañoy la defensa de unaTesis - Matrícula: +50 inscriptosanuales 7puentes.com Data Mining
  • 5. Maestría en Explotación de Datosy Descubrimiento del Conocimiento Admisión: - Graduados de la UBA con titulo de grado de carreras de cuatroaños de duraciónygraduados de otrasinstituciones con títulosequivalentes, - Graduadosde carreras de duraciónmenorluego de aprobarprerrequisitosocursos de nivelación - Importante:Vocacióninterdisciplinaria de la Maestría. Dictado: - Presencial - ClasesTeórico-Prácticas - Asistenciano- obligatoria - Apoyomediante la Web yprácticas de Laboratorio - Alumnosregularesyvocacionales 7puentes.com Data Mining
  • 6. Pipeline KDD [RAW DATA] Selección de Datos [TARGET DATA] Procesamiento [PREPOS DATA] Transformación [TRANSF DATA] Data Mining [MODEL] Interpretación / Evaluación [KNOWLEDGE] 7puentes.com Sistemas de Recomendación
  • 8. Tareas Modelosdescriptivos - Reconocerpatronessubyacentes en los datosydarlesunaexplicaciónen español. - Cuáles son las variables quemejorexplican el fenómeno Modelospredictivos - Utilizar la evidenciaparainferircomportamiento en el futuro (Lógicainductiva) - Utilizar variables conocidasparainferir el valor de lasque no se conocen 7puentes.com Data Mining
  • 9. Tareas Modelosdescriptivos - Clustering - Association Rule(*) - Sequential Pattern(*) Modelospredictivos - Clasificación - Regresión - Sistemas de Recomendación 7puentes.com Data Mining
  • 11. Modelo de Aprendizaje Aprendizaje = Mejorar la ejecución de unatareautilizando la experiencia - Mejorar la tareaT, - Con la performance medida a través de lasmétricasP, - Basándonos en la experienciaE. 7puentes.com Data Mining
  • 14. Clasificación / Regresión: Ejemplo 1 Direct Marketing - Targeting: Reconocerdentro de unapoblación los máspropensos a comprar un producto - Utilizarhistoria de consumo - Modelo de clasificación{buy, not-buy} - Selección de variables - Modelo de scoring 7puentes.com Data Mining
  • 15. Clasificación / Regresión: Ejemplo 2 Detección de Fraude - Reconocercasos de fraudeocomportamientosospechoso en patrones de consumo. - Tarjetas de crédito, consumosmédicos, etc. - Etiquetarpatrones en el pasadocaracterizadoscomofraude - Inferirpatrones de conducta similar - Modelos online. Monitoreo.Tablero de control 7puentes.com Data Mining
  • 16. Clasificación / Regresión: Ejemplo 3 Customer Attrition/Churn - Reconocer la poblaciónpropensa a abandonar el servicioabonado. - Empresas de servicios, CRM. - Cómo se comportaronaquellosqueabandonaronel servicio? - Frecuencia de llamadas al call-center, consumos claves, pococonsumo vs. altísimoconsumo. - Detección de divorcios 7puentes.com Data Mining
  • 17. Clasificación / Regresión: Ejemplo 4 Credit scoring - Clasificaryasignarpuntaje a los abonados al servicio. - (Re)Asignaciónde créditos - Historiacrediticia - Indicadoresdemográficos - Estimación de valor de cuota, mora, repagoydemásindicadores 7puentes.com Data Mining
  • 18. Clasificación / Regresión: Ejemplo 5 Clasificación de emails - Categorizarcorreosentrantes / buzones de sugerencia. - Asignaciónautomática de responsables - Pregunta-Respuesta 7puentes.com Data Mining
  • 19. Clasificación / Regresión: Ejemplo 6 Análisis de sentimiento - Clasificardocumentossegúnsuorientaciónsubjetiv a. - Minado de opiniones - Buzz monitoring en redessociales 7puentes.com Data Mining
  • 20. Clustering 7puentes.com Data Mining
  • 21. Clustering: Ejemplo 1 Market Segmentation - Dividir a unapoblación en subconjuntoscon característicassimilares - Similaridad en cuanto a patrones de consumo vs. característicasdemográficas. - Campañasmásenfocadas - Describir/Explicar los clusters - Armado de planes de telefoníacelula - Clusters de sucursalesopuntos de venta 7puentes.com Data Mining
  • 22. Clustering: Ejemplo 2 Clustering de documentos - Dividir a un corpus en colecciones de documentossimilares - Resultados de un motor de búsquedamásexplicativos - Communities managers tools - Eliminaciónduplicados (near-duplicates) - News aggregators 7puentes.com Data Mining
  • 23. Association Rule / Sequential Pattern 7puentes.com Data Mining
  • 24. Rules: Ejemplo 1 Marketing & Sales - Descubirpatrones de consumosasociadosyconstruirpromociones a partir de eso - Productossimilares (restaurantes, libros, discos) - Productoscomplementarios (accesoriospara el celular / consola de videojuegos) - Ciclos de vida Básico ->deportivo -> 4 puertas -> familiar -> de lujo ->deportivo ->básico 7puentes.com Data Mining
  • 25. Rules: Ejemplo 2 Mantenimiento - Descubirpatrones de necesidad de productos/serviciosasociados al mantenimiento - Cambio de aceite, neumáticos, cambio de correa de distribución… - Adelantarse a la necesidad de productos de mantenimiento 7puentes.com Data Mining
  • 26. Rules: Ejemplo 3 Publicidadpersonalizada - PresentarADspersonalizadosparacadacliente. - Detectardentro de lasofertas de publicidad, la másadecuadapara el usuario - Y en el contexto de consumo: a la noche, dese un dispositivomóvil, desdesu casa olugar de trabajo 7puentes.com Data Mining
  • 27. Desafíosactuales Big Data Complejidad Escalabilidad Dimensionalidad Arquitecturaselásticas Streaming DB & file systems Calidad distribuidosen el cloud Múltiplesfuentes Privacidad Confidenciabilidad Permisosyuso 7puentes.com Data Mining