SlideShare una empresa de Scribd logo
Modelos de DataMiningBernardo A. Robelo Jirónbernardorobelo.blogspot.com
AgendaAlgoritmosAplicacionesPracticas de los AlgoritmosGuia de Ejercicios
Algoritmos1. Association Rules2. Clustering3. Sequence Clustering4. Decision Trees5. Linear Regression6. Time Series7. Naive Bayes8. Neural Network9. Logistic Regression
Association rules (Reglas de asociación)Este se suele usar casi exclusivamente para análisis de carro de compra. Detecta asociaciones comunes entre elementos (por ejemplo, quien compra cerveza suele comprar también maní salado).Usos típicos:Análisis de carro de compraOfrecer recomendaciones al comprador: ¿has comprado cerveza, seguro que no quieres maní salado?
ClusteringSirve sobre todo para buscar elementos afines dentro de un conjunto. Por ejemplo, podemos usarlo para saber que en una población hay hombres y mujeres jóvenes solteros,  hombres mayores solteros, hombres y mujeres mayores casados... pero no mujeres mayores solteras.Usos Típicos:Segmentar un mercado.Validaciones (las entradas que no pertenecen a un cluster, pueden ser elementos anómalos).
Sequence clusteringEs bastante específico para detectar secuencias típicas dentro de un conjunto de eventos. Por ejemplo... saber en qué orden hace click la gente en las noticias de una web, puede ayudarnos a ordenar los titulares de arriba a abajo y de derecha a izquierda.Usos típicos:Estudio de secuencias de eventosDetección de algunas anomalías de comportamiento (eventos que llegan fuera de secuencia)
DecisionTrees(Árboles de decisión)Los árboles de decisión son clarísimamente una herramienta potentísima de clasificación... de hecho, son probablemente el mejor algoritmo que podemos utilizar para clasificar. Básicamente, construyen un árbol del que se pueden extraer reglas, del estilo: "Si eres hombre, tienes unos ingresos superiores a 'X', y eres comprador de revistas de carros... la probabilidad de que tengas carro es del 90%".Usos Típicos Clasificación en generalValidaciones. Podemos detectar elementos anómalos en función de si encajan o no con las reglas surgidas del árbol Por ejemplo, "si tienes carro y casa, menos de 20 años probablemente mientas…"Predecir el valor de un atributo con precisión
Time Series (Series temporales)Este algoritmo es específico para predecir el valor de una magnitud en función del tiempo.Por ejemplo:Análisis bursátiles... ¿subirá o bajará el petróleo mañana?Predicción de una magnitud analógica, en general.
Algoritmo Naive BayesEste algoritmo es el primero se suele utilizar para explorar datos. Básicamente, este algoritmo busca correlaciones entre atributos.Cuando no tenemos muy claro qué atributo se puede predecir en función de otros, una técnica muy habitual es tratar de utilizar el algoritmo de NaiveBayes tratando de predecir el valor de todos los atributos en función de todos los atributos (un "todos contra todos").Otra ventaja de este algoritmo es fácil de implementar... pero su desventaja es que no es muy preciso. Usos Típicos:Exploración inicial de los datosTareas de clasificación, en las que el rendimiento sea crítico.
Neural Network (Redesneuronales)Al igual que los árboles de decisión, este algoritmo también resuelve problemas de clasificación y regresión. Puede ser adecuado para detectar patrones no lineales, difícilmente descriptibles por medio de reglas. Se usa como alternativa al algoritmo de arboles de decisión: lo mejor es probar ambos sobre un mismo problema y utilizar el que mayor acierto nos de en sus predicciones.Usos Típicos: Las mismas tareas que los árboles de decisión, cuando los grupos en los que se divide la población no son lineales. Regresiones (es similar a la clasificación, pero cuando se trata de predecir una magnitud continúa).
Guia de Ejercicios
EnfocandosuFuerza de VentasEl departamento de marketing de Adventure Works desea aumentar las ventas dirigiendo una campaña de correo directo a clientes específicos. Mediante el análisis de los atributos de clientes conocidos, la empresa espera determinar los patrones que posteriormente se aplicarán a clientes potenciales. La empresa pretende utilizar los patrones hallados para predecir qué clientes potenciales tienen más probabilidades de comprar un producto.Además, el departamento de marketing desea encontrar las posibles agrupaciones lógicas de clientes que se encuentran en la base de datos, como, por ejemplo, aquellos que siguen pautas demográficas y de compra similares.La base de datos de la empresa, Adventure Works DW, contiene una lista de clientes antiguos y una lista de clientes nuevos potenciales.Necesitamos	- Un conjunto de modelos de minería de datos que sugerirá los clientes que tienen una mayor probabilidad de serlo entre una lista de clientes potenciales.	- Una agrupación de clientes actuales.  bernardorobelo.blogspot.comVer Video de Solución en:
Prevision de VentasComo analista de ventas de Adventure Works, se le ha solicitado una previsión de las ventas de modelos individuales de bicicletas para el próximo año. En concreto, debe obtener los picos en las ventas de bicicletas y determinar qué regiones lideran las ventas y cuáles van por detrás. Además, debe determinar si las ventas de diferentes modelos varían en función de la época del año.Para hallar la información solicitada, en esta lección examinará los datos mensuales de la empresa y dividirá las ventas en tres regiones: Europa, Norteamérica y el Pacífico.- ¿En qué época del año se produce un pico en las ventas?- ¿Cómo interactúan las ventas de los diferentes modelos de bicicleta a lo largo del año?- ¿Existe un patrón de ventas para las tres regiones?bernardorobelo.blogspot.comVer Video de Solución en:
PromoviendoVentasCruzadasEl departamento de marketing de Adventure Works desea mejorar el sitio Web de la empresa para promover las ventas cruzadas.Antes de actualizar el sitio, necesitan crear un modelo de minería de datos que pueda predecir los productos cuya adquisición podría interesar a los clientes, basándose en otros productos que ya se encuentran en los carros de compra en línea de los clientes. Estas predicciones también ayudarán al departamento de marketing a agrupar en el sitio Web aquellos artículos que los clientes suelen comprar juntos. Se Solicita :Obtener un modelo de minería de datos con el que podrá predecir artículos adicionales que pueden aparecer en una cesta de la compra o que un cliente podría querer agregar a la cesta de la compra. Contar con un completo modelo de minería de datos que muestra grupos de artículos de transacciones históricas del cliente.bernardorobelo.blogspot.comVer Video de Solución en:
MejorandoSitio WebEl departamento de marketing de Adventure Works desea saber cómo se mueven los clientes por el sitio Web de Adventure Works. La empresa cree que existe un patrón según el cual los clientes incluyen productos en las cestas de la compra. El algoritmo de clústeres de secuencia de Microsoft permite determinar las secuencias que los clientes siguen para agregar artículos a las cestas. Posteriormente, esta información se puede utilizar para mejorar el flujo del sitio Web y propiciar que los clientes adquieran productos adicionales.Se Solicita: Obtener un modelo de minería de datos que le permitirá predecir cuál será el siguiente artículo que los clientes incluirán en sus cestas de la compra.bernardorobelo.blogspot.comVer Video de Solución en:
Modelos de DataMiningBernardo A. Robelo Jirónbernardorobelo.blogspot.com

Más contenido relacionado

La actualidad más candente

HBase Tutorial For Beginners | HBase Architecture | HBase Tutorial | Hadoop T...
HBase Tutorial For Beginners | HBase Architecture | HBase Tutorial | Hadoop T...HBase Tutorial For Beginners | HBase Architecture | HBase Tutorial | Hadoop T...
HBase Tutorial For Beginners | HBase Architecture | HBase Tutorial | Hadoop T...
Simplilearn
 
1. Apache HIVE
1. Apache HIVE1. Apache HIVE
1. Apache HIVE
Anuja Gunale
 
Apache Hive
Apache HiveApache Hive
Apache Hive
tusharsinghal58
 
NE7012- SOCIAL NETWORK ANALYSIS
NE7012- SOCIAL NETWORK ANALYSISNE7012- SOCIAL NETWORK ANALYSIS
NE7012- SOCIAL NETWORK ANALYSIS
rathnaarul
 
Big data analytics - hadoop
Big data analytics - hadoopBig data analytics - hadoop
Big data analytics - hadoop
Vishwajeet Jadeja
 
Data Mining: Applying data mining
Data Mining: Applying data miningData Mining: Applying data mining
Data Mining: Applying data mining
DataminingTools Inc
 
Three Big Data Case Studies
Three Big Data Case StudiesThree Big Data Case Studies
Three Big Data Case Studies
Atidan Technologies Pvt Ltd (India)
 
Information retrival system and PageRank algorithm
Information retrival system and PageRank algorithmInformation retrival system and PageRank algorithm
Information retrival system and PageRank algorithm
Rupali Bhatnagar
 
Lect 1 introduction
Lect 1 introductionLect 1 introduction
Lect 1 introduction
hktripathy
 
Top ten big data security and privacy challenges
Top ten big data security and privacy challengesTop ten big data security and privacy challenges
Top ten big data security and privacy challenges
Bee_Ware
 
Big Data - The 5 Vs Everyone Must Know
Big Data - The 5 Vs Everyone Must KnowBig Data - The 5 Vs Everyone Must Know
Big Data - The 5 Vs Everyone Must Know
Bernard Marr
 
Big Data Ppt PowerPoint Presentation Slides
Big Data Ppt PowerPoint Presentation Slides Big Data Ppt PowerPoint Presentation Slides
Big Data Ppt PowerPoint Presentation Slides
SlideTeam
 
Apache PIG
Apache PIGApache PIG
Apache PIG
Prashant Gupta
 
Fraud Detection with Amazon SageMaker
Fraud Detection with Amazon SageMakerFraud Detection with Amazon SageMaker
Fraud Detection with Amazon SageMaker
Amazon Web Services
 
BIG DATA and USE CASES
BIG DATA and USE CASESBIG DATA and USE CASES
BIG DATA and USE CASES
Bhaskara Reddy Sannapureddy
 
Big data ppt
Big data pptBig data ppt
Big data ppt
Deepika ParthaSarathy
 
Big data
Big dataBig data
Big data
Samira Riki
 
What Is Hadoop | Hadoop Tutorial For Beginners | Edureka
What Is Hadoop | Hadoop Tutorial For Beginners | EdurekaWhat Is Hadoop | Hadoop Tutorial For Beginners | Edureka
What Is Hadoop | Hadoop Tutorial For Beginners | Edureka
Edureka!
 
Big Data & The Cloud
Big Data & The CloudBig Data & The Cloud
Big Data & The Cloud
Amazon Web Services
 
Apache HBase™
Apache HBase™Apache HBase™
Apache HBase™
Prashant Gupta
 

La actualidad más candente (20)

HBase Tutorial For Beginners | HBase Architecture | HBase Tutorial | Hadoop T...
HBase Tutorial For Beginners | HBase Architecture | HBase Tutorial | Hadoop T...HBase Tutorial For Beginners | HBase Architecture | HBase Tutorial | Hadoop T...
HBase Tutorial For Beginners | HBase Architecture | HBase Tutorial | Hadoop T...
 
1. Apache HIVE
1. Apache HIVE1. Apache HIVE
1. Apache HIVE
 
Apache Hive
Apache HiveApache Hive
Apache Hive
 
NE7012- SOCIAL NETWORK ANALYSIS
NE7012- SOCIAL NETWORK ANALYSISNE7012- SOCIAL NETWORK ANALYSIS
NE7012- SOCIAL NETWORK ANALYSIS
 
Big data analytics - hadoop
Big data analytics - hadoopBig data analytics - hadoop
Big data analytics - hadoop
 
Data Mining: Applying data mining
Data Mining: Applying data miningData Mining: Applying data mining
Data Mining: Applying data mining
 
Three Big Data Case Studies
Three Big Data Case StudiesThree Big Data Case Studies
Three Big Data Case Studies
 
Information retrival system and PageRank algorithm
Information retrival system and PageRank algorithmInformation retrival system and PageRank algorithm
Information retrival system and PageRank algorithm
 
Lect 1 introduction
Lect 1 introductionLect 1 introduction
Lect 1 introduction
 
Top ten big data security and privacy challenges
Top ten big data security and privacy challengesTop ten big data security and privacy challenges
Top ten big data security and privacy challenges
 
Big Data - The 5 Vs Everyone Must Know
Big Data - The 5 Vs Everyone Must KnowBig Data - The 5 Vs Everyone Must Know
Big Data - The 5 Vs Everyone Must Know
 
Big Data Ppt PowerPoint Presentation Slides
Big Data Ppt PowerPoint Presentation Slides Big Data Ppt PowerPoint Presentation Slides
Big Data Ppt PowerPoint Presentation Slides
 
Apache PIG
Apache PIGApache PIG
Apache PIG
 
Fraud Detection with Amazon SageMaker
Fraud Detection with Amazon SageMakerFraud Detection with Amazon SageMaker
Fraud Detection with Amazon SageMaker
 
BIG DATA and USE CASES
BIG DATA and USE CASESBIG DATA and USE CASES
BIG DATA and USE CASES
 
Big data ppt
Big data pptBig data ppt
Big data ppt
 
Big data
Big dataBig data
Big data
 
What Is Hadoop | Hadoop Tutorial For Beginners | Edureka
What Is Hadoop | Hadoop Tutorial For Beginners | EdurekaWhat Is Hadoop | Hadoop Tutorial For Beginners | Edureka
What Is Hadoop | Hadoop Tutorial For Beginners | Edureka
 
Big Data & The Cloud
Big Data & The CloudBig Data & The Cloud
Big Data & The Cloud
 
Apache HBase™
Apache HBase™Apache HBase™
Apache HBase™
 

Destacado

Data Mining. Extracción de Conocimiento en Grandes Bases de Datos
Data Mining. Extracción de Conocimiento en Grandes Bases de DatosData Mining. Extracción de Conocimiento en Grandes Bases de Datos
Data Mining. Extracción de Conocimiento en Grandes Bases de Datos
Roberto Espinosa
 
Data Mining
Data Mining Data Mining
Data Mining
Jaziel Silva
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
Félix Winter Vier
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
Antonio Soto
 
Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
Universidad Autonoma de Chihuahua
 
Data Mining
Data MiningData Mining
Data Mining
brobelo
 
Modelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesModelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicaciones
Ángel M. Felicísimo
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
lalopg
 
Statistic for Business
Statistic for BusinessStatistic for Business
Statistic for Business
Advance Business Consulting
 
Microsoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de EjerciciosMicrosoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de Ejercicios
brobelo
 
Programa Fundamentos en Business Intelligence con MSSQL Server 2008R2 / 2012
Programa Fundamentos en Business Intelligence con MSSQL Server 2008R2 / 2012Programa Fundamentos en Business Intelligence con MSSQL Server 2008R2 / 2012
Programa Fundamentos en Business Intelligence con MSSQL Server 2008R2 / 2012
LPI ONG
 
linear regression and correlation analysis
linear regression and correlation analysislinear regression and correlation analysis
linear regression and correlation analysis
Edgar Mata
 
Almacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datosAlmacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datos
Fiorella Urbina Vera
 
Modelo De Sistema Viable Omeblog
Modelo De Sistema Viable OmeblogModelo De Sistema Viable Omeblog
Modelo De Sistema Viable Omeblog
Jesusita
 
Panel Presentation Template
Panel Presentation TemplatePanel Presentation Template
Panel Presentation Template
steve tice
 
Indice Proyecto de Inteligencia de Negocios
Indice Proyecto de Inteligencia de NegociosIndice Proyecto de Inteligencia de Negocios
Indice Proyecto de Inteligencia de Negocios
Pedro Chavez
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
Willie Manuel Caminero Mejía
 
Redes neuronales
Redes neuronalesRedes neuronales
Redes neuronales
Daniel Muccela
 
Ingenieria en sistemas computacionales en el mundo IPN
Ingenieria en sistemas computacionales en el mundo IPNIngenieria en sistemas computacionales en el mundo IPN
Ingenieria en sistemas computacionales en el mundo IPN
aleale17
 
ITT-235-L: Introducción a Sistemas Computacionales
ITT-235-L: Introducción a Sistemas ComputacionalesITT-235-L: Introducción a Sistemas Computacionales
ITT-235-L: Introducción a Sistemas Computacionales
rcad
 

Destacado (20)

Data Mining. Extracción de Conocimiento en Grandes Bases de Datos
Data Mining. Extracción de Conocimiento en Grandes Bases de DatosData Mining. Extracción de Conocimiento en Grandes Bases de Datos
Data Mining. Extracción de Conocimiento en Grandes Bases de Datos
 
Data Mining
Data Mining Data Mining
Data Mining
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
 
Data Mining
Data MiningData Mining
Data Mining
 
Modelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicacionesModelos predictivos: datos, métodos, problemas y aplicaciones
Modelos predictivos: datos, métodos, problemas y aplicaciones
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Statistic for Business
Statistic for BusinessStatistic for Business
Statistic for Business
 
Microsoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de EjerciciosMicrosoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de Ejercicios
 
Programa Fundamentos en Business Intelligence con MSSQL Server 2008R2 / 2012
Programa Fundamentos en Business Intelligence con MSSQL Server 2008R2 / 2012Programa Fundamentos en Business Intelligence con MSSQL Server 2008R2 / 2012
Programa Fundamentos en Business Intelligence con MSSQL Server 2008R2 / 2012
 
linear regression and correlation analysis
linear regression and correlation analysislinear regression and correlation analysis
linear regression and correlation analysis
 
Almacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datosAlmacenes de datos, olap y minería de datos
Almacenes de datos, olap y minería de datos
 
Modelo De Sistema Viable Omeblog
Modelo De Sistema Viable OmeblogModelo De Sistema Viable Omeblog
Modelo De Sistema Viable Omeblog
 
Panel Presentation Template
Panel Presentation TemplatePanel Presentation Template
Panel Presentation Template
 
Indice Proyecto de Inteligencia de Negocios
Indice Proyecto de Inteligencia de NegociosIndice Proyecto de Inteligencia de Negocios
Indice Proyecto de Inteligencia de Negocios
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Redes neuronales
Redes neuronalesRedes neuronales
Redes neuronales
 
Ingenieria en sistemas computacionales en el mundo IPN
Ingenieria en sistemas computacionales en el mundo IPNIngenieria en sistemas computacionales en el mundo IPN
Ingenieria en sistemas computacionales en el mundo IPN
 
ITT-235-L: Introducción a Sistemas Computacionales
ITT-235-L: Introducción a Sistemas ComputacionalesITT-235-L: Introducción a Sistemas Computacionales
ITT-235-L: Introducción a Sistemas Computacionales
 

Similar a Modelos De Data Mining

Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdfAprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Gerard Alba
 
Modelos de recomendación para e-commerce por Smartup.
Modelos de recomendación para e-commerce por Smartup.Modelos de recomendación para e-commerce por Smartup.
Modelos de recomendación para e-commerce por Smartup.
Javier Ramos Turrión
 
Herramientas del Blue Ocean Strategy
Herramientas del Blue Ocean StrategyHerramientas del Blue Ocean Strategy
Herramientas del Blue Ocean Strategy
INNOGYZER.com
 
Proyecto final
Proyecto finalProyecto final
Proyecto final
LuisAez13
 
Proyecto Mineria de Datos
Proyecto Mineria de DatosProyecto Mineria de Datos
Proyecto Mineria de Datos
XavierPaniagua
 
Proyecto Minería de Datos
Proyecto Minería de DatosProyecto Minería de Datos
Proyecto Minería de Datos
BerthyVargasVillarre
 
Proyecto de Minería de Datos
Proyecto de Minería de DatosProyecto de Minería de Datos
Proyecto de Minería de Datos
silviacarvajalmendez
 
Bi resumen
Bi resumenBi resumen
Bi resumen
Eddy Farro
 
Bi resumen
Bi resumenBi resumen
3A5 Trejo Alexandra -Tarea 2
3A5 Trejo Alexandra -Tarea 23A5 Trejo Alexandra -Tarea 2
3A5 Trejo Alexandra -Tarea 2
Elizabeth Trejo Quinto
 
Canvas
CanvasCanvas
Canvas
Ramon Arias
 
eStudio34 Presents Masterclass de Growth hacking para tu ecommerce por Ugo Smith
eStudio34 Presents Masterclass de Growth hacking para tu ecommerce por Ugo SmitheStudio34 Presents Masterclass de Growth hacking para tu ecommerce por Ugo Smith
eStudio34 Presents Masterclass de Growth hacking para tu ecommerce por Ugo Smith
William Renedo
 
524921~1
524921~1524921~1
524921~1
524921~1524921~1
Community manager
Community manager Community manager
Community manager
AXEL
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
Rafael Zamora
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
Snoop Consulting
 
Modelo de negocio canvas
Modelo de negocio canvasModelo de negocio canvas
Modelo de negocio canvas
Ing. Guillermo Raúl Reyes Mendo
 
Area investigación de mercados maestría
Area investigación de mercados maestríaArea investigación de mercados maestría
Area investigación de mercados maestría
Maestros Online
 
Area investigación de mercados maestría
Area investigación de mercados maestríaArea investigación de mercados maestría
Area investigación de mercados maestría
Educaciontodos
 

Similar a Modelos De Data Mining (20)

Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdfAprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
 
Modelos de recomendación para e-commerce por Smartup.
Modelos de recomendación para e-commerce por Smartup.Modelos de recomendación para e-commerce por Smartup.
Modelos de recomendación para e-commerce por Smartup.
 
Herramientas del Blue Ocean Strategy
Herramientas del Blue Ocean StrategyHerramientas del Blue Ocean Strategy
Herramientas del Blue Ocean Strategy
 
Proyecto final
Proyecto finalProyecto final
Proyecto final
 
Proyecto Mineria de Datos
Proyecto Mineria de DatosProyecto Mineria de Datos
Proyecto Mineria de Datos
 
Proyecto Minería de Datos
Proyecto Minería de DatosProyecto Minería de Datos
Proyecto Minería de Datos
 
Proyecto de Minería de Datos
Proyecto de Minería de DatosProyecto de Minería de Datos
Proyecto de Minería de Datos
 
Bi resumen
Bi resumenBi resumen
Bi resumen
 
Bi resumen
Bi resumenBi resumen
Bi resumen
 
3A5 Trejo Alexandra -Tarea 2
3A5 Trejo Alexandra -Tarea 23A5 Trejo Alexandra -Tarea 2
3A5 Trejo Alexandra -Tarea 2
 
Canvas
CanvasCanvas
Canvas
 
eStudio34 Presents Masterclass de Growth hacking para tu ecommerce por Ugo Smith
eStudio34 Presents Masterclass de Growth hacking para tu ecommerce por Ugo SmitheStudio34 Presents Masterclass de Growth hacking para tu ecommerce por Ugo Smith
eStudio34 Presents Masterclass de Growth hacking para tu ecommerce por Ugo Smith
 
524921~1
524921~1524921~1
524921~1
 
524921~1
524921~1524921~1
524921~1
 
Community manager
Community manager Community manager
Community manager
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
 
Modelo de negocio canvas
Modelo de negocio canvasModelo de negocio canvas
Modelo de negocio canvas
 
Area investigación de mercados maestría
Area investigación de mercados maestríaArea investigación de mercados maestría
Area investigación de mercados maestría
 
Area investigación de mercados maestría
Area investigación de mercados maestríaArea investigación de mercados maestría
Area investigación de mercados maestría
 

Más de brobelo

Excel 2007
Excel 2007Excel 2007
Excel 2007
brobelo
 
PostgreSQL
PostgreSQLPostgreSQL
PostgreSQL
brobelo
 
Microsoft office access 2007
Microsoft office access 2007Microsoft office access 2007
Microsoft office access 2007
brobelo
 
XML en .NET
XML en .NETXML en .NET
XML en .NET
brobelo
 
Sql server 2008
Sql server 2008Sql server 2008
Sql server 2008
brobelo
 
ADO.NET
ADO.NETADO.NET
ADO.NET
brobelo
 
Estructuras de Lenguaje .NET
Estructuras de Lenguaje .NETEstructuras de Lenguaje .NET
Estructuras de Lenguaje .NET
brobelo
 
Tecnologia Microsoft
Tecnologia  MicrosoftTecnologia  Microsoft
Tecnologia Microsoft
brobelo
 
Manual Analysis Services
Manual Analysis ServicesManual Analysis Services
Manual Analysis Services
brobelo
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis Services
brobelo
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligence
brobelo
 
Reporting Services
Reporting ServicesReporting Services
Reporting Services
brobelo
 
SQL SERVER Service Broker
SQL SERVER Service BrokerSQL SERVER Service Broker
SQL SERVER Service Broker
brobelo
 
Replicacion de Datos en SQL Server
Replicacion de Datos en SQL ServerReplicacion de Datos en SQL Server
Replicacion de Datos en SQL Server
brobelo
 
SQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los DatosSQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los Datos
brobelo
 
Programacion con SQL Server 2005
Programacion con SQL Server 2005Programacion con SQL Server 2005
Programacion con SQL Server 2005
brobelo
 
Variables en SSIS
Variables en SSISVariables en SSIS
Variables en SSIS
brobelo
 
SQL Server Integration Services
SQL Server Integration ServicesSQL Server Integration Services
SQL Server Integration Services
brobelo
 

Más de brobelo (18)

Excel 2007
Excel 2007Excel 2007
Excel 2007
 
PostgreSQL
PostgreSQLPostgreSQL
PostgreSQL
 
Microsoft office access 2007
Microsoft office access 2007Microsoft office access 2007
Microsoft office access 2007
 
XML en .NET
XML en .NETXML en .NET
XML en .NET
 
Sql server 2008
Sql server 2008Sql server 2008
Sql server 2008
 
ADO.NET
ADO.NETADO.NET
ADO.NET
 
Estructuras de Lenguaje .NET
Estructuras de Lenguaje .NETEstructuras de Lenguaje .NET
Estructuras de Lenguaje .NET
 
Tecnologia Microsoft
Tecnologia  MicrosoftTecnologia  Microsoft
Tecnologia Microsoft
 
Manual Analysis Services
Manual Analysis ServicesManual Analysis Services
Manual Analysis Services
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis Services
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligence
 
Reporting Services
Reporting ServicesReporting Services
Reporting Services
 
SQL SERVER Service Broker
SQL SERVER Service BrokerSQL SERVER Service Broker
SQL SERVER Service Broker
 
Replicacion de Datos en SQL Server
Replicacion de Datos en SQL ServerReplicacion de Datos en SQL Server
Replicacion de Datos en SQL Server
 
SQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los DatosSQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los Datos
 
Programacion con SQL Server 2005
Programacion con SQL Server 2005Programacion con SQL Server 2005
Programacion con SQL Server 2005
 
Variables en SSIS
Variables en SSISVariables en SSIS
Variables en SSIS
 
SQL Server Integration Services
SQL Server Integration ServicesSQL Server Integration Services
SQL Server Integration Services
 

Último

_Manejo de Riesgos en el Laboratorio.pdf
_Manejo de Riesgos en el Laboratorio.pdf_Manejo de Riesgos en el Laboratorio.pdf
_Manejo de Riesgos en el Laboratorio.pdf
correodetareas
 
2 FIBRA OPTICA COMO MEDIO DE RED DE ACCESO.pptx
2 FIBRA OPTICA COMO MEDIO DE RED DE ACCESO.pptx2 FIBRA OPTICA COMO MEDIO DE RED DE ACCESO.pptx
2 FIBRA OPTICA COMO MEDIO DE RED DE ACCESO.pptx
bellomiguelangel68
 
Solución de vulnerabilidades en dispositivos de Area Local
Solución de vulnerabilidades en dispositivos de Area LocalSolución de vulnerabilidades en dispositivos de Area Local
Solución de vulnerabilidades en dispositivos de Area Local
investigacionproec
 
Informe de electroforesis del ADN MEDIANTE EL MinION Mk1C.pdf
Informe de electroforesis del ADN MEDIANTE EL MinION Mk1C.pdfInforme de electroforesis del ADN MEDIANTE EL MinION Mk1C.pdf
Informe de electroforesis del ADN MEDIANTE EL MinION Mk1C.pdf
KEVINYOICIAQUINOSORI
 
TESisssssssss de yhnnjuuhjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj...
TESisssssssss de yhnnjuuhjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj...TESisssssssss de yhnnjuuhjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj...
TESisssssssss de yhnnjuuhjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj...
MenaOlortinYherlyEli
 
El uso de las TIC en la vida cotidiana.pptx
El uso de las TIC en la vida cotidiana.pptxEl uso de las TIC en la vida cotidiana.pptx
El uso de las TIC en la vida cotidiana.pptx
Katia Reyes
 
aplicaciones de sistema de informacion geografico
aplicaciones de sistema de informacion geograficoaplicaciones de sistema de informacion geografico
aplicaciones de sistema de informacion geografico
cyberquiximies
 
DN Consultores | Una mirada al mercado de fibra en Perú
DN Consultores | Una mirada al mercado de fibra en PerúDN Consultores | Una mirada al mercado de fibra en Perú
DN Consultores | Una mirada al mercado de fibra en Perú
estudios22
 
Reconocimiento del Secuenciador de nanoporos (Nanopore sequencing) MinIon Mk1...
Reconocimiento del Secuenciador de nanoporos (Nanopore sequencing) MinIon Mk1...Reconocimiento del Secuenciador de nanoporos (Nanopore sequencing) MinIon Mk1...
Reconocimiento del Secuenciador de nanoporos (Nanopore sequencing) MinIon Mk1...
sunwndniel
 
Pedagogía : Gamificación en la educación
Pedagogía : Gamificación en la educaciónPedagogía : Gamificación en la educación
Pedagogía : Gamificación en la educación
César Luis Camba Martínez
 
Presentación Redes Sociales Moderno Morado.pdf
Presentación Redes Sociales Moderno Morado.pdfPresentación Redes Sociales Moderno Morado.pdf
Presentación Redes Sociales Moderno Morado.pdf
anniehuanhuayo80
 
DESARROLLO_DE_APLICACIONES_MULTIMEDIA.pptx
DESARROLLO_DE_APLICACIONES_MULTIMEDIA.pptxDESARROLLO_DE_APLICACIONES_MULTIMEDIA.pptx
DESARROLLO_DE_APLICACIONES_MULTIMEDIA.pptx
fortinodominguez78
 
CAPCUT PASO A PASO - herramientas tecnológicas de edición de videos
CAPCUT PASO A PASO - herramientas tecnológicas de edición de videosCAPCUT PASO A PASO - herramientas tecnológicas de edición de videos
CAPCUT PASO A PASO - herramientas tecnológicas de edición de videos
Iris505525
 
Evolución, características, aplicación, ventajas y desventajas de las TIC
Evolución, características, aplicación, ventajas y desventajas de las TICEvolución, características, aplicación, ventajas y desventajas de las TIC
Evolución, características, aplicación, ventajas y desventajas de las TIC
Henry W. Zavala
 
Conceptos basicas de programacion (1) (1).docx
Conceptos basicas de programacion (1) (1).docxConceptos basicas de programacion (1) (1).docx
Conceptos basicas de programacion (1) (1).docx
JuanVelandia33
 
Generaciones de Computadoras .
Generaciones de Computadoras                 .Generaciones de Computadoras                 .
Generaciones de Computadoras .
gregory760891
 
MATERIAL BASE D A T O S .docx
MATERIAL BASE    D A T O S              .docxMATERIAL BASE    D A T O S              .docx
MATERIAL BASE D A T O S .docx
CarlosAndresLoaizaRe
 
BIOSENSORES BASADOS EN NANOTECNOLOGÍA.pdf
BIOSENSORES BASADOS EN NANOTECNOLOGÍA.pdfBIOSENSORES BASADOS EN NANOTECNOLOGÍA.pdf
BIOSENSORES BASADOS EN NANOTECNOLOGÍA.pdf
sunwndniel
 
Catalogo-Voxtech- accesorios radios RF.pdf
Catalogo-Voxtech- accesorios radios RF.pdfCatalogo-Voxtech- accesorios radios RF.pdf
Catalogo-Voxtech- accesorios radios RF.pdf
walter729637
 

Último (19)

_Manejo de Riesgos en el Laboratorio.pdf
_Manejo de Riesgos en el Laboratorio.pdf_Manejo de Riesgos en el Laboratorio.pdf
_Manejo de Riesgos en el Laboratorio.pdf
 
2 FIBRA OPTICA COMO MEDIO DE RED DE ACCESO.pptx
2 FIBRA OPTICA COMO MEDIO DE RED DE ACCESO.pptx2 FIBRA OPTICA COMO MEDIO DE RED DE ACCESO.pptx
2 FIBRA OPTICA COMO MEDIO DE RED DE ACCESO.pptx
 
Solución de vulnerabilidades en dispositivos de Area Local
Solución de vulnerabilidades en dispositivos de Area LocalSolución de vulnerabilidades en dispositivos de Area Local
Solución de vulnerabilidades en dispositivos de Area Local
 
Informe de electroforesis del ADN MEDIANTE EL MinION Mk1C.pdf
Informe de electroforesis del ADN MEDIANTE EL MinION Mk1C.pdfInforme de electroforesis del ADN MEDIANTE EL MinION Mk1C.pdf
Informe de electroforesis del ADN MEDIANTE EL MinION Mk1C.pdf
 
TESisssssssss de yhnnjuuhjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj...
TESisssssssss de yhnnjuuhjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj...TESisssssssss de yhnnjuuhjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj...
TESisssssssss de yhnnjuuhjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj...
 
El uso de las TIC en la vida cotidiana.pptx
El uso de las TIC en la vida cotidiana.pptxEl uso de las TIC en la vida cotidiana.pptx
El uso de las TIC en la vida cotidiana.pptx
 
aplicaciones de sistema de informacion geografico
aplicaciones de sistema de informacion geograficoaplicaciones de sistema de informacion geografico
aplicaciones de sistema de informacion geografico
 
DN Consultores | Una mirada al mercado de fibra en Perú
DN Consultores | Una mirada al mercado de fibra en PerúDN Consultores | Una mirada al mercado de fibra en Perú
DN Consultores | Una mirada al mercado de fibra en Perú
 
Reconocimiento del Secuenciador de nanoporos (Nanopore sequencing) MinIon Mk1...
Reconocimiento del Secuenciador de nanoporos (Nanopore sequencing) MinIon Mk1...Reconocimiento del Secuenciador de nanoporos (Nanopore sequencing) MinIon Mk1...
Reconocimiento del Secuenciador de nanoporos (Nanopore sequencing) MinIon Mk1...
 
Pedagogía : Gamificación en la educación
Pedagogía : Gamificación en la educaciónPedagogía : Gamificación en la educación
Pedagogía : Gamificación en la educación
 
Presentación Redes Sociales Moderno Morado.pdf
Presentación Redes Sociales Moderno Morado.pdfPresentación Redes Sociales Moderno Morado.pdf
Presentación Redes Sociales Moderno Morado.pdf
 
DESARROLLO_DE_APLICACIONES_MULTIMEDIA.pptx
DESARROLLO_DE_APLICACIONES_MULTIMEDIA.pptxDESARROLLO_DE_APLICACIONES_MULTIMEDIA.pptx
DESARROLLO_DE_APLICACIONES_MULTIMEDIA.pptx
 
CAPCUT PASO A PASO - herramientas tecnológicas de edición de videos
CAPCUT PASO A PASO - herramientas tecnológicas de edición de videosCAPCUT PASO A PASO - herramientas tecnológicas de edición de videos
CAPCUT PASO A PASO - herramientas tecnológicas de edición de videos
 
Evolución, características, aplicación, ventajas y desventajas de las TIC
Evolución, características, aplicación, ventajas y desventajas de las TICEvolución, características, aplicación, ventajas y desventajas de las TIC
Evolución, características, aplicación, ventajas y desventajas de las TIC
 
Conceptos basicas de programacion (1) (1).docx
Conceptos basicas de programacion (1) (1).docxConceptos basicas de programacion (1) (1).docx
Conceptos basicas de programacion (1) (1).docx
 
Generaciones de Computadoras .
Generaciones de Computadoras                 .Generaciones de Computadoras                 .
Generaciones de Computadoras .
 
MATERIAL BASE D A T O S .docx
MATERIAL BASE    D A T O S              .docxMATERIAL BASE    D A T O S              .docx
MATERIAL BASE D A T O S .docx
 
BIOSENSORES BASADOS EN NANOTECNOLOGÍA.pdf
BIOSENSORES BASADOS EN NANOTECNOLOGÍA.pdfBIOSENSORES BASADOS EN NANOTECNOLOGÍA.pdf
BIOSENSORES BASADOS EN NANOTECNOLOGÍA.pdf
 
Catalogo-Voxtech- accesorios radios RF.pdf
Catalogo-Voxtech- accesorios radios RF.pdfCatalogo-Voxtech- accesorios radios RF.pdf
Catalogo-Voxtech- accesorios radios RF.pdf
 

Modelos De Data Mining

  • 1. Modelos de DataMiningBernardo A. Robelo Jirónbernardorobelo.blogspot.com
  • 2. AgendaAlgoritmosAplicacionesPracticas de los AlgoritmosGuia de Ejercicios
  • 3. Algoritmos1. Association Rules2. Clustering3. Sequence Clustering4. Decision Trees5. Linear Regression6. Time Series7. Naive Bayes8. Neural Network9. Logistic Regression
  • 4. Association rules (Reglas de asociación)Este se suele usar casi exclusivamente para análisis de carro de compra. Detecta asociaciones comunes entre elementos (por ejemplo, quien compra cerveza suele comprar también maní salado).Usos típicos:Análisis de carro de compraOfrecer recomendaciones al comprador: ¿has comprado cerveza, seguro que no quieres maní salado?
  • 5. ClusteringSirve sobre todo para buscar elementos afines dentro de un conjunto. Por ejemplo, podemos usarlo para saber que en una población hay hombres y mujeres jóvenes solteros,  hombres mayores solteros, hombres y mujeres mayores casados... pero no mujeres mayores solteras.Usos Típicos:Segmentar un mercado.Validaciones (las entradas que no pertenecen a un cluster, pueden ser elementos anómalos).
  • 6. Sequence clusteringEs bastante específico para detectar secuencias típicas dentro de un conjunto de eventos. Por ejemplo... saber en qué orden hace click la gente en las noticias de una web, puede ayudarnos a ordenar los titulares de arriba a abajo y de derecha a izquierda.Usos típicos:Estudio de secuencias de eventosDetección de algunas anomalías de comportamiento (eventos que llegan fuera de secuencia)
  • 7. DecisionTrees(Árboles de decisión)Los árboles de decisión son clarísimamente una herramienta potentísima de clasificación... de hecho, son probablemente el mejor algoritmo que podemos utilizar para clasificar. Básicamente, construyen un árbol del que se pueden extraer reglas, del estilo: "Si eres hombre, tienes unos ingresos superiores a 'X', y eres comprador de revistas de carros... la probabilidad de que tengas carro es del 90%".Usos Típicos Clasificación en generalValidaciones. Podemos detectar elementos anómalos en función de si encajan o no con las reglas surgidas del árbol Por ejemplo, "si tienes carro y casa, menos de 20 años probablemente mientas…"Predecir el valor de un atributo con precisión
  • 8. Time Series (Series temporales)Este algoritmo es específico para predecir el valor de una magnitud en función del tiempo.Por ejemplo:Análisis bursátiles... ¿subirá o bajará el petróleo mañana?Predicción de una magnitud analógica, en general.
  • 9. Algoritmo Naive BayesEste algoritmo es el primero se suele utilizar para explorar datos. Básicamente, este algoritmo busca correlaciones entre atributos.Cuando no tenemos muy claro qué atributo se puede predecir en función de otros, una técnica muy habitual es tratar de utilizar el algoritmo de NaiveBayes tratando de predecir el valor de todos los atributos en función de todos los atributos (un "todos contra todos").Otra ventaja de este algoritmo es fácil de implementar... pero su desventaja es que no es muy preciso. Usos Típicos:Exploración inicial de los datosTareas de clasificación, en las que el rendimiento sea crítico.
  • 10. Neural Network (Redesneuronales)Al igual que los árboles de decisión, este algoritmo también resuelve problemas de clasificación y regresión. Puede ser adecuado para detectar patrones no lineales, difícilmente descriptibles por medio de reglas. Se usa como alternativa al algoritmo de arboles de decisión: lo mejor es probar ambos sobre un mismo problema y utilizar el que mayor acierto nos de en sus predicciones.Usos Típicos: Las mismas tareas que los árboles de decisión, cuando los grupos en los que se divide la población no son lineales. Regresiones (es similar a la clasificación, pero cuando se trata de predecir una magnitud continúa).
  • 12. EnfocandosuFuerza de VentasEl departamento de marketing de Adventure Works desea aumentar las ventas dirigiendo una campaña de correo directo a clientes específicos. Mediante el análisis de los atributos de clientes conocidos, la empresa espera determinar los patrones que posteriormente se aplicarán a clientes potenciales. La empresa pretende utilizar los patrones hallados para predecir qué clientes potenciales tienen más probabilidades de comprar un producto.Además, el departamento de marketing desea encontrar las posibles agrupaciones lógicas de clientes que se encuentran en la base de datos, como, por ejemplo, aquellos que siguen pautas demográficas y de compra similares.La base de datos de la empresa, Adventure Works DW, contiene una lista de clientes antiguos y una lista de clientes nuevos potenciales.Necesitamos - Un conjunto de modelos de minería de datos que sugerirá los clientes que tienen una mayor probabilidad de serlo entre una lista de clientes potenciales. - Una agrupación de clientes actuales. bernardorobelo.blogspot.comVer Video de Solución en:
  • 13. Prevision de VentasComo analista de ventas de Adventure Works, se le ha solicitado una previsión de las ventas de modelos individuales de bicicletas para el próximo año. En concreto, debe obtener los picos en las ventas de bicicletas y determinar qué regiones lideran las ventas y cuáles van por detrás. Además, debe determinar si las ventas de diferentes modelos varían en función de la época del año.Para hallar la información solicitada, en esta lección examinará los datos mensuales de la empresa y dividirá las ventas en tres regiones: Europa, Norteamérica y el Pacífico.- ¿En qué época del año se produce un pico en las ventas?- ¿Cómo interactúan las ventas de los diferentes modelos de bicicleta a lo largo del año?- ¿Existe un patrón de ventas para las tres regiones?bernardorobelo.blogspot.comVer Video de Solución en:
  • 14. PromoviendoVentasCruzadasEl departamento de marketing de Adventure Works desea mejorar el sitio Web de la empresa para promover las ventas cruzadas.Antes de actualizar el sitio, necesitan crear un modelo de minería de datos que pueda predecir los productos cuya adquisición podría interesar a los clientes, basándose en otros productos que ya se encuentran en los carros de compra en línea de los clientes. Estas predicciones también ayudarán al departamento de marketing a agrupar en el sitio Web aquellos artículos que los clientes suelen comprar juntos. Se Solicita :Obtener un modelo de minería de datos con el que podrá predecir artículos adicionales que pueden aparecer en una cesta de la compra o que un cliente podría querer agregar a la cesta de la compra. Contar con un completo modelo de minería de datos que muestra grupos de artículos de transacciones históricas del cliente.bernardorobelo.blogspot.comVer Video de Solución en:
  • 15. MejorandoSitio WebEl departamento de marketing de Adventure Works desea saber cómo se mueven los clientes por el sitio Web de Adventure Works. La empresa cree que existe un patrón según el cual los clientes incluyen productos en las cestas de la compra. El algoritmo de clústeres de secuencia de Microsoft permite determinar las secuencias que los clientes siguen para agregar artículos a las cestas. Posteriormente, esta información se puede utilizar para mejorar el flujo del sitio Web y propiciar que los clientes adquieran productos adicionales.Se Solicita: Obtener un modelo de minería de datos que le permitirá predecir cuál será el siguiente artículo que los clientes incluirán en sus cestas de la compra.bernardorobelo.blogspot.comVer Video de Solución en:
  • 16. Modelos de DataMiningBernardo A. Robelo Jirónbernardorobelo.blogspot.com