SlideShare una empresa de Scribd logo
DataMining Bernardo A. Robelo Jirón bernardorobelo.blogspot.com
Quées el Data Mining TEORÍAGrandesempresastienenvaliosainformaciónoculta y almacenada en sus bases de datosproveniente de la acumulación de info a lo largo de suhistoria. CERTEZAS Esosdatos no pueden ser extraídospormétodosinformáticosconvencionalesniportécnicasestadísticastradicionales.   Se requiere de algoritmos y técnicasmáscomplejasprovenientes del área de la Inteligencia Artificial y la MatemáticaCompleja, como ser RedesNeuronales, Árboles de Decisión, RegresiónLogística, AlgoritmosGenéticos y Análisis Fractal. VALOR	 Su valor radica, en que el descubrimiento de dichospatronespuedeconvertirse en el activomásimportanteparaunaempresa a la hora de toma de decisiones en susnegocios. Conociendo de estamanera con másdetalle a susclientes, la dinámica de susproductos en el mercado, realizandomodeloseficientes de predicción y determinando la influencia de las variables involucradas.  SEGÚN EL MITPara el Massachusetts Institute Technology, el Data Mining es una de las diez tecnologías emergentes que cambiará al Mundo.
Quées el Data Mining  DEFINICIÓN La Minería de Datos, es un conjunto de técnicasprovenientes de la Inteligencia Artificial y la MatemáticaCompleja,cuyafinalidad, en el ambienteempresarial,es la de encontrar en grandes bases de datospatronesocultos, no triviales e imposibles de detectarmedianteotrosmecanismosestadísticos; paraluegoextraerdichainformación, la cualpuedeconvertirse en el activomásimportante de unaempresa a la hora de toma de decisiones y encararfuturasestrategias de negocios.
Tecnicas A. RedesNeuronales Características: - Sistema Artificial queemula el funcionamiento del cerebrohumano.- Son capaces de aprendermediantediferentesalgoritmos de entrenamiento. - Existendiferentestipos de RedesNeuronalesArtificiales. Su utilización y entrenamientodepende del problemaqueesténencomendadas a resolver. - Son flexibles y resistentes a errores. - Puedenprocesarse en tiempo real.- Susprincipalesusos se dan en el reconocimiento de patrones y en los modelos de predicción.- Son aplicablesporejemplo en el Mercado Bursátil, en los sistemas OCR, en la Segmentación de Clientes, en predicciones de Demanda y especialmente en Detección de Fraudes y Riesgos. Neurona Humana Neurona Artificial Red Neuronal Artificial
Tecnicas B. Árboles de Decisión Características: ,[object Object],EJEMPLO: Unaempresalíder en electrodomésticos decide hacerunacampañaparaofrecer un nuevoproducto, un reproductor de músicaportátil de grancapacidad y con un precioaccesible. Dichaempresaposeeunagran base de datos con todaslasventasrealizadas a lo largo de 15 años de historia.  Se deseaexploraresta base paraencontrarpatrones y asísegmentar a susclientes y realizarunacampaña de marketing dirigida. A continuación la solución al problema
Tecnicas B. Árboles de Decisión Notas:El árbol puede ramificarse mucho más aún y poseer un mayor número de variables.En este caso, el responsable de la campaña de Marketing, tiene buenas herramientas para optar por dirigir su campaña a personas entre 18 y 27 años de clase media, y a empleados de entre 28 y 38 años. Solución al problema anterior:Se plantea un árbol de decisión, el cual determina de manera inteligente (es parte del algoritmo) que la variable fundamental a considerar es la edad. A partir de allí se comienza a ramificar el árbol. La edad se divide en tres rangos. La segunda variable de mayor peso es el Nivel Socio Económico de la persona y su profesión. El árbol, mostrará en cada una de sus ramas un número entre 0 y 1 que indica la probabilidad de que una persona en dicho segmento compre el producto que se está ofreciendo. De esta manera, se convierte en una herramienta fundamental en la toma de decisiones para encarar una campaña de marketing eficiente. La potencia de un algoritmo de AD radica en su capacidad de ordenar y segmentar las variables de mayor a menor. Aquí los resultados en este análisis.  EDAD > 38 28-38 18-27 P=0,65 P=0,61 NSE ALTO NSE MED NSE BAJO Profesional Tecnico/Analista NSE ALTO NSE MED NSE BAJO Emplado Estudiante P=0,81 P=0,51 P=0,42 P=0,29 P=0,37 P=0,12 P=0,76 P=0,67
Tecnicas C. RegresiónLogística Características: ,[object Object],En estas dos industrias, el análisis de Data Mining para los modelos de puntaje o scoring, se ha convertido en una herramienta de uso crítico.
Tecnicas D. Análisis Fractal Características: ,[object Object],[object Object]
Data Mining comoInteligencia de Negocios La Inteligencia de Negocios, disciplinamásconocidaporsunombre en ingléscomo Business Intelligence, tienelassiguientescaracterísticasfundamentales:Acceso a la InformaciónObtenerReportes de calidadApoyo en la toma de decisionesLas herramientasmásdestacadasparaconseguirdichospuntos son:Data Mining y Data WarehouseSistemas de Predicción y Modelado (Análisis Fractal es un ejemplo de ello)Cubos OLAP El proceso de Data Mining, consta de variospasos, los mismosabarcan:Etapa de consultoría: Comprender el problema y determinar de lastécnicas a aplicar.Limpieza de las Bases de Datos.Correr los análisisdeterminados en la primeraetapa (redesneuronales, árboles de decisión, etc.)Comprensión de los resultados.Validación de los mismos.Portodo lo expresado en el presentedocumento, Data Mining es la herramientamáspotentequeacompaña a los responsables de unaempresa o cualquiertipo de proyecto, en el momento de la toma de decisiones de negocios y en el análisis de resultadospresentes, pasados y aúnfuturos.
DataMining SQL Server Analysis Services DataMining
Como trabaja? Tipos de Algoritmos ProblemasNegocios Clustering =  grouping  Asociacion de segmentos y atributos. Ej: E-Commerce WebSite Clustering Algorithm Classification =  predecir un valor especifico Gran volumen de datos,  Hight-Quality Historical Data Decision Trees Naïve Bayes Neural Network Association = correlacion Ej: Vendedores de detalles ( Cervezas y Panales) Association Algorithm Regression =  Prevision a un numero continuo Time Series Logistic Regression Sequences = Proceso y Rutas ( websites)  Sequence Clustering Deviation =  ValoresExtremos (fraudes, credit card) Decision Tree Clustering
Como trabaja? Case Tables   FuenteDatos Lista de Valoresqueutilizara el algoritmo Nested Tables Informacionadicional Ejemplo: Customer Table 9 Algoritmos Mining Structures contienen Mining Models
Algoritmos 1. Association Rules 2. Clustering 3. Sequence Clustering 4. Decision Trees 5. Linear Regression 6. Time Series 7. Naive Bayes 8. Neural Network 9. Logistic Regression
Association Rules Algoritmo genera reglasindicandocomo los items debenaparecerjuntos. Ejemplo: Permitepredecircuando un clienteseleccionara un item,  el clienteseleccionaratambienotrotipo de item.
Clustering El algoritmocorremuchasiteracionesbuscandogrupos de items quetenganpropiedadessimilares.   Ejemplo:	 BuscarClientes con un ciertonivel de educacionquetenganingresossimilares.  Estonosdefinira un Cluster.
Sequence Clustering El algoritmocombinaanalisis de secuencias con cluster paraanalizar la transicion o cambios entre estados. Ejemplo: La prediccion del cluster indicaracualtransiciones la queocurrira en base a patronespasados
Decision Trees Organiza los datos en un Arbol de Red en el cualcadanodorepresentauna decision acerca de unacaracteristica de la informacion. El algoritmosoporta la prediccion de los atributos o caracteristicas.
Linear Regression Es unaaplicacion particular del Decision Tree paracrear un arbol de decisiones con unaraizsencilla.
Time Series Analiza el tiemporelacionado con datosusandounaregresion lineal.  Ejemplo: Predecirlasventasfuturas en base a lasventas en el pasado.
Naive Bayes Examina un atributo en el tiempoparaanalizarcomo el atributo se relaciona a otroatributopara ser predecido. Para ejecutarloesmuyfacilperoignora la influencia de la combinaciones de otrosatributos.
Neural Network Similar al sistemanerviosotrabajandoparaanalizarlasentradas(input) al sistema, cadanodo en la red tiene un peso paradeterminarlassalidas (output) del sistema de cadanodo
Logistic Regression Es unaaplicacion del algoritmo Neural Network, soporta la prediccion de atributos de manera discrete y continous
Data Mining

Más contenido relacionado

La actualidad más candente

Text mining
Text miningText mining
Text mining
Malik Imran
 
Data preprocessing in Data Mining
Data preprocessing  in Data MiningData preprocessing  in Data Mining
Data preprocessing in Data Mining
Samad Baseer Khan
 
Data mining
Data mining Data mining
Data mining
AthiraR23
 
2.3 servicios de datos de una sola fuente.docx
2.3 servicios de datos de una sola fuente.docx2.3 servicios de datos de una sola fuente.docx
2.3 servicios de datos de una sola fuente.docx
AlanJesus19
 
Introducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big DataIntroducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big Data
David Hurtado
 
Introduction to Data Mining
Introduction to Data MiningIntroduction to Data Mining
Introduction to Data Mining
DataminingTools Inc
 
Lecture2 big data life cycle
Lecture2 big data life cycleLecture2 big data life cycle
Lecture2 big data life cycle
hktripathy
 
Manual Simulación con Arena.
Manual Simulación con Arena.Manual Simulación con Arena.
Manual Simulación con Arena.
Roberto Dominguez
 
Plan de gestion de configuración de software
Plan de gestion de configuración de softwarePlan de gestion de configuración de software
Plan de gestion de configuración de software
ilianacon
 
Introduction To Data Mining
Introduction To Data Mining   Introduction To Data Mining
Introduction To Data Mining
Phi Jack
 
aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
Leopoldo Gonzalez Rosas
 
Data preprocessing
Data preprocessingData preprocessing
Data preprocessing
ksamyMCA
 
Data preprocessing
Data preprocessingData preprocessing
Data preprocessing
kayathri02
 
Introduction to DMN
Introduction to DMNIntroduction to DMN
Introduction to DMN
Max Tay
 
data warehousing
data warehousingdata warehousing
data warehousing
Jagnesh Chawla
 
8 d's para la solución de problemas
8 d's para la solución de problemas8 d's para la solución de problemas
8 d's para la solución de problemas
Jesus Sanchez
 
Métricas de procesos y proyectos
Métricas de procesos y proyectosMétricas de procesos y proyectos
Métricas de procesos y proyectos
jose_macias
 
Data Mining : Concepts and Techniques
Data Mining : Concepts and TechniquesData Mining : Concepts and Techniques
Data Mining : Concepts and Techniques
DeepaR42
 
Data PreProcessing
Data PreProcessingData PreProcessing
Data PreProcessing
tdharmaputhiran
 
Erp
ErpErp

La actualidad más candente (20)

Text mining
Text miningText mining
Text mining
 
Data preprocessing in Data Mining
Data preprocessing  in Data MiningData preprocessing  in Data Mining
Data preprocessing in Data Mining
 
Data mining
Data mining Data mining
Data mining
 
2.3 servicios de datos de una sola fuente.docx
2.3 servicios de datos de una sola fuente.docx2.3 servicios de datos de una sola fuente.docx
2.3 servicios de datos de una sola fuente.docx
 
Introducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big DataIntroducción al Business Intelligence y al Big Data
Introducción al Business Intelligence y al Big Data
 
Introduction to Data Mining
Introduction to Data MiningIntroduction to Data Mining
Introduction to Data Mining
 
Lecture2 big data life cycle
Lecture2 big data life cycleLecture2 big data life cycle
Lecture2 big data life cycle
 
Manual Simulación con Arena.
Manual Simulación con Arena.Manual Simulación con Arena.
Manual Simulación con Arena.
 
Plan de gestion de configuración de software
Plan de gestion de configuración de softwarePlan de gestion de configuración de software
Plan de gestion de configuración de software
 
Introduction To Data Mining
Introduction To Data Mining   Introduction To Data Mining
Introduction To Data Mining
 
aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
 
Data preprocessing
Data preprocessingData preprocessing
Data preprocessing
 
Data preprocessing
Data preprocessingData preprocessing
Data preprocessing
 
Introduction to DMN
Introduction to DMNIntroduction to DMN
Introduction to DMN
 
data warehousing
data warehousingdata warehousing
data warehousing
 
8 d's para la solución de problemas
8 d's para la solución de problemas8 d's para la solución de problemas
8 d's para la solución de problemas
 
Métricas de procesos y proyectos
Métricas de procesos y proyectosMétricas de procesos y proyectos
Métricas de procesos y proyectos
 
Data Mining : Concepts and Techniques
Data Mining : Concepts and TechniquesData Mining : Concepts and Techniques
Data Mining : Concepts and Techniques
 
Data PreProcessing
Data PreProcessingData PreProcessing
Data PreProcessing
 
Erp
ErpErp
Erp
 

Destacado

Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
Janett Julca Flores
 
Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
Universidad Autonoma de Chihuahua
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
María Inés Cahuana Lázaro
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
Antonio Soto
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
edmaga
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
04071977
 
Técnicas e Instrumentos de Recolección de Datos
Técnicas e Instrumentos de Recolección de DatosTécnicas e Instrumentos de Recolección de Datos
Técnicas e Instrumentos de Recolección de Datos
Universidad Pedagógica Experimental Libertador
 

Destacado (7)

Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Aplicaciones de la mineria de datos
Aplicaciones de la mineria de datosAplicaciones de la mineria de datos
Aplicaciones de la mineria de datos
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Técnicas e Instrumentos de Recolección de Datos
Técnicas e Instrumentos de Recolección de DatosTécnicas e Instrumentos de Recolección de Datos
Técnicas e Instrumentos de Recolección de Datos
 

Similar a Data Mining

Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
Ana Delgado
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datos
dataminingperu
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datos
dataminingperu
 
Curso de Minería de Datos
Curso de Minería de Datos Curso de Minería de Datos
Curso de Minería de Datos
dataminingperu
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
Eduardo Castro
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
Eduardo Castro
 
Administración de sistemas de información estrategicos 2
Administración de sistemas de información estrategicos 2Administración de sistemas de información estrategicos 2
Administración de sistemas de información estrategicos 2
jarmendipg
 
Businnes intelligence
Businnes intelligenceBusinnes intelligence
Businnes intelligence
Sebastiana Velazquez Alejandro
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
Victor Jaime Polo Romero
 
4.data mining
4.data mining4.data mining
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
amdia
 
Toma de decisiones en la gestión comercial
Toma de decisiones en la gestión comercialToma de decisiones en la gestión comercial
Toma de decisiones en la gestión comercial
MsC. Alec Vinent
 
Derly Diapositivas[1]
Derly Diapositivas[1]Derly Diapositivas[1]
Derly Diapositivas[1]
Derly ♥
 
Business intelligence diapositivas
Business intelligence diapositivasBusiness intelligence diapositivas
Business intelligence diapositivas
Hector Gabriel Gonzalez Silva
 
Inteligencia de negocios 1
Inteligencia de negocios 1Inteligencia de negocios 1
Inteligencia de negocios 1
reyna mac mas
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Anyeni Garay
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
ICEMD
 
Entregable4 carmenmillansanchez
Entregable4 carmenmillansanchezEntregable4 carmenmillansanchez
Entregable4 carmenmillansanchez
CarMillanS
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
kminxp
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
VictoriaEspinoza31
 

Similar a Data Mining (20)

Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datos
 
Segundo Curso de Minería de Datos
Segundo Curso de Minería de DatosSegundo Curso de Minería de Datos
Segundo Curso de Minería de Datos
 
Curso de Minería de Datos
Curso de Minería de Datos Curso de Minería de Datos
Curso de Minería de Datos
 
Analisis predictivo con microsoft azure
Analisis predictivo con microsoft azureAnalisis predictivo con microsoft azure
Analisis predictivo con microsoft azure
 
Introduccion datawarehouse
Introduccion datawarehouseIntroduccion datawarehouse
Introduccion datawarehouse
 
Administración de sistemas de información estrategicos 2
Administración de sistemas de información estrategicos 2Administración de sistemas de información estrategicos 2
Administración de sistemas de información estrategicos 2
 
Businnes intelligence
Businnes intelligenceBusinnes intelligence
Businnes intelligence
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
 
4.data mining
4.data mining4.data mining
4.data mining
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Toma de decisiones en la gestión comercial
Toma de decisiones en la gestión comercialToma de decisiones en la gestión comercial
Toma de decisiones en la gestión comercial
 
Derly Diapositivas[1]
Derly Diapositivas[1]Derly Diapositivas[1]
Derly Diapositivas[1]
 
Business intelligence diapositivas
Business intelligence diapositivasBusiness intelligence diapositivas
Business intelligence diapositivas
 
Inteligencia de negocios 1
Inteligencia de negocios 1Inteligencia de negocios 1
Inteligencia de negocios 1
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Programa Superior en Big Data
Programa Superior en Big DataPrograma Superior en Big Data
Programa Superior en Big Data
 
Entregable4 carmenmillansanchez
Entregable4 carmenmillansanchezEntregable4 carmenmillansanchez
Entregable4 carmenmillansanchez
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Ciencia de datos
Ciencia de datosCiencia de datos
Ciencia de datos
 

Más de brobelo

Microsoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de EjerciciosMicrosoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de Ejercicios
brobelo
 
Excel 2007
Excel 2007Excel 2007
Excel 2007
brobelo
 
PostgreSQL
PostgreSQLPostgreSQL
PostgreSQL
brobelo
 
Microsoft office access 2007
Microsoft office access 2007Microsoft office access 2007
Microsoft office access 2007
brobelo
 
XML en .NET
XML en .NETXML en .NET
XML en .NET
brobelo
 
Sql server 2008
Sql server 2008Sql server 2008
Sql server 2008
brobelo
 
ADO.NET
ADO.NETADO.NET
ADO.NET
brobelo
 
Estructuras de Lenguaje .NET
Estructuras de Lenguaje .NETEstructuras de Lenguaje .NET
Estructuras de Lenguaje .NET
brobelo
 
Tecnologia Microsoft
Tecnologia  MicrosoftTecnologia  Microsoft
Tecnologia Microsoft
brobelo
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Mining
brobelo
 
Manual Analysis Services
Manual Analysis ServicesManual Analysis Services
Manual Analysis Services
brobelo
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis Services
brobelo
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligence
brobelo
 
Reporting Services
Reporting ServicesReporting Services
Reporting Services
brobelo
 
SQL SERVER Service Broker
SQL SERVER Service BrokerSQL SERVER Service Broker
SQL SERVER Service Broker
brobelo
 
Replicacion de Datos en SQL Server
Replicacion de Datos en SQL ServerReplicacion de Datos en SQL Server
Replicacion de Datos en SQL Server
brobelo
 
SQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los DatosSQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los Datos
brobelo
 
Programacion con SQL Server 2005
Programacion con SQL Server 2005Programacion con SQL Server 2005
Programacion con SQL Server 2005
brobelo
 
Variables en SSIS
Variables en SSISVariables en SSIS
Variables en SSIS
brobelo
 
SQL Server Integration Services
SQL Server Integration ServicesSQL Server Integration Services
SQL Server Integration Services
brobelo
 

Más de brobelo (20)

Microsoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de EjerciciosMicrosoft Excel 2007 - Guia de Ejercicios
Microsoft Excel 2007 - Guia de Ejercicios
 
Excel 2007
Excel 2007Excel 2007
Excel 2007
 
PostgreSQL
PostgreSQLPostgreSQL
PostgreSQL
 
Microsoft office access 2007
Microsoft office access 2007Microsoft office access 2007
Microsoft office access 2007
 
XML en .NET
XML en .NETXML en .NET
XML en .NET
 
Sql server 2008
Sql server 2008Sql server 2008
Sql server 2008
 
ADO.NET
ADO.NETADO.NET
ADO.NET
 
Estructuras de Lenguaje .NET
Estructuras de Lenguaje .NETEstructuras de Lenguaje .NET
Estructuras de Lenguaje .NET
 
Tecnologia Microsoft
Tecnologia  MicrosoftTecnologia  Microsoft
Tecnologia Microsoft
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Mining
 
Manual Analysis Services
Manual Analysis ServicesManual Analysis Services
Manual Analysis Services
 
Analysis Services
Analysis ServicesAnalysis Services
Analysis Services
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligence
 
Reporting Services
Reporting ServicesReporting Services
Reporting Services
 
SQL SERVER Service Broker
SQL SERVER Service BrokerSQL SERVER Service Broker
SQL SERVER Service Broker
 
Replicacion de Datos en SQL Server
Replicacion de Datos en SQL ServerReplicacion de Datos en SQL Server
Replicacion de Datos en SQL Server
 
SQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los DatosSQL Server - Como se Almacenan los Datos
SQL Server - Como se Almacenan los Datos
 
Programacion con SQL Server 2005
Programacion con SQL Server 2005Programacion con SQL Server 2005
Programacion con SQL Server 2005
 
Variables en SSIS
Variables en SSISVariables en SSIS
Variables en SSIS
 
SQL Server Integration Services
SQL Server Integration ServicesSQL Server Integration Services
SQL Server Integration Services
 

Data Mining

  • 1. DataMining Bernardo A. Robelo Jirón bernardorobelo.blogspot.com
  • 2. Quées el Data Mining TEORÍAGrandesempresastienenvaliosainformaciónoculta y almacenada en sus bases de datosproveniente de la acumulación de info a lo largo de suhistoria. CERTEZAS Esosdatos no pueden ser extraídospormétodosinformáticosconvencionalesniportécnicasestadísticastradicionales. Se requiere de algoritmos y técnicasmáscomplejasprovenientes del área de la Inteligencia Artificial y la MatemáticaCompleja, como ser RedesNeuronales, Árboles de Decisión, RegresiónLogística, AlgoritmosGenéticos y Análisis Fractal. VALOR Su valor radica, en que el descubrimiento de dichospatronespuedeconvertirse en el activomásimportanteparaunaempresa a la hora de toma de decisiones en susnegocios. Conociendo de estamanera con másdetalle a susclientes, la dinámica de susproductos en el mercado, realizandomodeloseficientes de predicción y determinando la influencia de las variables involucradas. SEGÚN EL MITPara el Massachusetts Institute Technology, el Data Mining es una de las diez tecnologías emergentes que cambiará al Mundo.
  • 3. Quées el Data Mining DEFINICIÓN La Minería de Datos, es un conjunto de técnicasprovenientes de la Inteligencia Artificial y la MatemáticaCompleja,cuyafinalidad, en el ambienteempresarial,es la de encontrar en grandes bases de datospatronesocultos, no triviales e imposibles de detectarmedianteotrosmecanismosestadísticos; paraluegoextraerdichainformación, la cualpuedeconvertirse en el activomásimportante de unaempresa a la hora de toma de decisiones y encararfuturasestrategias de negocios.
  • 4. Tecnicas A. RedesNeuronales Características: - Sistema Artificial queemula el funcionamiento del cerebrohumano.- Son capaces de aprendermediantediferentesalgoritmos de entrenamiento. - Existendiferentestipos de RedesNeuronalesArtificiales. Su utilización y entrenamientodepende del problemaqueesténencomendadas a resolver. - Son flexibles y resistentes a errores. - Puedenprocesarse en tiempo real.- Susprincipalesusos se dan en el reconocimiento de patrones y en los modelos de predicción.- Son aplicablesporejemplo en el Mercado Bursátil, en los sistemas OCR, en la Segmentación de Clientes, en predicciones de Demanda y especialmente en Detección de Fraudes y Riesgos. Neurona Humana Neurona Artificial Red Neuronal Artificial
  • 5.
  • 6. Tecnicas B. Árboles de Decisión Notas:El árbol puede ramificarse mucho más aún y poseer un mayor número de variables.En este caso, el responsable de la campaña de Marketing, tiene buenas herramientas para optar por dirigir su campaña a personas entre 18 y 27 años de clase media, y a empleados de entre 28 y 38 años. Solución al problema anterior:Se plantea un árbol de decisión, el cual determina de manera inteligente (es parte del algoritmo) que la variable fundamental a considerar es la edad. A partir de allí se comienza a ramificar el árbol. La edad se divide en tres rangos. La segunda variable de mayor peso es el Nivel Socio Económico de la persona y su profesión. El árbol, mostrará en cada una de sus ramas un número entre 0 y 1 que indica la probabilidad de que una persona en dicho segmento compre el producto que se está ofreciendo. De esta manera, se convierte en una herramienta fundamental en la toma de decisiones para encarar una campaña de marketing eficiente. La potencia de un algoritmo de AD radica en su capacidad de ordenar y segmentar las variables de mayor a menor. Aquí los resultados en este análisis. EDAD > 38 28-38 18-27 P=0,65 P=0,61 NSE ALTO NSE MED NSE BAJO Profesional Tecnico/Analista NSE ALTO NSE MED NSE BAJO Emplado Estudiante P=0,81 P=0,51 P=0,42 P=0,29 P=0,37 P=0,12 P=0,76 P=0,67
  • 7.
  • 8.
  • 9. Data Mining comoInteligencia de Negocios La Inteligencia de Negocios, disciplinamásconocidaporsunombre en ingléscomo Business Intelligence, tienelassiguientescaracterísticasfundamentales:Acceso a la InformaciónObtenerReportes de calidadApoyo en la toma de decisionesLas herramientasmásdestacadasparaconseguirdichospuntos son:Data Mining y Data WarehouseSistemas de Predicción y Modelado (Análisis Fractal es un ejemplo de ello)Cubos OLAP El proceso de Data Mining, consta de variospasos, los mismosabarcan:Etapa de consultoría: Comprender el problema y determinar de lastécnicas a aplicar.Limpieza de las Bases de Datos.Correr los análisisdeterminados en la primeraetapa (redesneuronales, árboles de decisión, etc.)Comprensión de los resultados.Validación de los mismos.Portodo lo expresado en el presentedocumento, Data Mining es la herramientamáspotentequeacompaña a los responsables de unaempresa o cualquiertipo de proyecto, en el momento de la toma de decisiones de negocios y en el análisis de resultadospresentes, pasados y aúnfuturos.
  • 10. DataMining SQL Server Analysis Services DataMining
  • 11. Como trabaja? Tipos de Algoritmos ProblemasNegocios Clustering = grouping Asociacion de segmentos y atributos. Ej: E-Commerce WebSite Clustering Algorithm Classification = predecir un valor especifico Gran volumen de datos, Hight-Quality Historical Data Decision Trees Naïve Bayes Neural Network Association = correlacion Ej: Vendedores de detalles ( Cervezas y Panales) Association Algorithm Regression = Prevision a un numero continuo Time Series Logistic Regression Sequences = Proceso y Rutas ( websites) Sequence Clustering Deviation = ValoresExtremos (fraudes, credit card) Decision Tree Clustering
  • 12. Como trabaja? Case Tables  FuenteDatos Lista de Valoresqueutilizara el algoritmo Nested Tables Informacionadicional Ejemplo: Customer Table 9 Algoritmos Mining Structures contienen Mining Models
  • 13. Algoritmos 1. Association Rules 2. Clustering 3. Sequence Clustering 4. Decision Trees 5. Linear Regression 6. Time Series 7. Naive Bayes 8. Neural Network 9. Logistic Regression
  • 14. Association Rules Algoritmo genera reglasindicandocomo los items debenaparecerjuntos. Ejemplo: Permitepredecircuando un clienteseleccionara un item, el clienteseleccionaratambienotrotipo de item.
  • 15. Clustering El algoritmocorremuchasiteracionesbuscandogrupos de items quetenganpropiedadessimilares. Ejemplo: BuscarClientes con un ciertonivel de educacionquetenganingresossimilares. Estonosdefinira un Cluster.
  • 16. Sequence Clustering El algoritmocombinaanalisis de secuencias con cluster paraanalizar la transicion o cambios entre estados. Ejemplo: La prediccion del cluster indicaracualtransiciones la queocurrira en base a patronespasados
  • 17. Decision Trees Organiza los datos en un Arbol de Red en el cualcadanodorepresentauna decision acerca de unacaracteristica de la informacion. El algoritmosoporta la prediccion de los atributos o caracteristicas.
  • 18. Linear Regression Es unaaplicacion particular del Decision Tree paracrear un arbol de decisiones con unaraizsencilla.
  • 19. Time Series Analiza el tiemporelacionado con datosusandounaregresion lineal. Ejemplo: Predecirlasventasfuturas en base a lasventas en el pasado.
  • 20. Naive Bayes Examina un atributo en el tiempoparaanalizarcomo el atributo se relaciona a otroatributopara ser predecido. Para ejecutarloesmuyfacilperoignora la influencia de la combinaciones de otrosatributos.
  • 21. Neural Network Similar al sistemanerviosotrabajandoparaanalizarlasentradas(input) al sistema, cadanodo en la red tiene un peso paradeterminarlassalidas (output) del sistema de cadanodo
  • 22. Logistic Regression Es unaaplicacion del algoritmo Neural Network, soporta la prediccion de atributos de manera discrete y continous