SlideShare una empresa de Scribd logo
Minería de Datos Rafael  Zamora  Garrido Julio  2009
2 Ejemplos de objetivos de Minería de Datos
3 ¿Qué es Data Mining?
4 ¿Qué es Data Mining? La minería de datos utiliza diversas técnicaspara analizar y procesar los datos:
5 Técnicas de Minería de Datos El objetivo del clusteringes definir grupos (o clusters) dentro de los cuales los casos (o los clientes) sean lo más parecidos posible. Por otra parte, los diferentes clusters deben ser, entre sí, lo más distintos posible. Ejemplo: Podemos definir dos clusters: los clientes más rentables y los clientes menos rentables. Dentro del cluster de los clientes más rentables, todos los clientes deben tener una rentabilidad por encima de un determinado umbral. La segmentación es la división (o partición) de la totalidad de los datos en segmentos, según determinados criterios. Ejemplo: Clientes de banca Como ejemplo de segmentación, podemos considerar una base de datos de clientes de banca. Una segmentación útil sería en términos de rentabilidad: podríamos identificar tres grupos, los más rentables, los de rentabilidad media y los menos rentables. Para cada grupo podríamos identificar una serie de características. Por ejemplo, en el grupo de los clientes más rentables, la media de edad del cliente es de 49 años, mientras que en el grupo de los clientes menos rentables, la media de edad es de 27 años.. Nota: No hay que confundir clusteringcon segmentación. La segmentación se usa para identificar grupos que tienen características comunes.
6 Técnicas de Minería de Datos Consiste en examinar las características de una entidad nueva y asignarle una clase predefinida. Por ejemplo: Clasificar a un nuevo cliente según su riesgo de crédito (alto, medio, bajo). Ejemplo: Un ejemplo de una técnica de clasificación es la inducción de reglas; otro ejemplo es la red neuronal. La inducción de reglas La inducción de reglas crea un modelo construido a partir de reglas tipo if-then-else (si-entonces-si no). En general funciona tanto para valores numéricos como para valores categóricos. Los modelos tienen una serie de variables de entrada y una o más variables de salida, pero en contraste con las redes neuronales, se puede ver cómo llegan al resultado o salida.  Por ejemplo, un modelo muy sencillo tendría tres variables de entrada, edad, estado civil, cuenta de ahorro, y una de salida, contrata hipoteca.  Las dos reglas de proceso (el modelo de datos) podrían ser: "Si edad es entre 18 y 40 años y estado civil es casado y cuenta de ahorro = si entonces contrata hipoteca ⇒ si (18450,78%)" o "Si edad es mayor de 40 años y estado civil es casado y tiene cuenta de ahorro = no entonces contrata hipoteca ⇒ no (17490,66%)".
7 Técnicas de Minería de Datos ,[object Object]
 Se pueden identificar manualmente, pero hay herramientas que pueden hacerlo de forma automática.
 Es una técnica particularmente útil en el análisis tipo "cesta de la compra" de ventas en supermercados y tiendas en general, y permite identificar productos que se suelen comprar juntos.A partir de un conjunto de datos históricos con resultado conocido, se pretende modelizar estos datos para conocer resultados futuros. Variables de Entrada Un modelo predictivo tiene unas variables de entrada, tiene una o más variables de salida, y tiene un proceso intermedio que actúa sobre las entradas para producir la salida.  Variables de Salida Proceso Ejemplo: ,[object Object]
 el pronóstico de un paciente,
 las agrupaciones de clientes más rentables, etc. ,[object Object]

Más contenido relacionado

La actualidad más candente

MIneria de datos
MIneria de datosMIneria de datos
MIneria de datos
Juan Flores
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Zeus Ruiz Montilla
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Departamento de Redes UNL
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
Ana Delgado
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
adryalvarezv92
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
Antonio Soto
 
Minería de Datos Covid19 en Latinoamérica
Minería de Datos Covid19 en LatinoaméricaMinería de Datos Covid19 en Latinoamérica
Minería de Datos Covid19 en Latinoamérica
Alejandra Gonzales
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
PabloMolina111
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
MONICA MONTOYA CORDERO
 
Aplicando mineria de datos - Latinoamerica
Aplicando mineria de datos - LatinoamericaAplicando mineria de datos - Latinoamerica
Aplicando mineria de datos - Latinoamerica
FranzCarlosSuarezGat
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
edmaga
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
ufrj
 
Mineria de datos en sql server 2012
Mineria de datos en sql server 2012Mineria de datos en sql server 2012
Mineria de datos en sql server 2012
Ris Fernandez
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
Janett Julca Flores
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
Keopx
 
Data Mining
Data MiningData Mining
Data Mining
brobelo
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
Mundo Contact
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
Willie Manuel Caminero Mejía
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
Andres Eyherabide
 

La actualidad más candente (19)

MIneria de datos
MIneria de datosMIneria de datos
MIneria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de Datos Covid19 en Latinoamérica
Minería de Datos Covid19 en LatinoaméricaMinería de Datos Covid19 en Latinoamérica
Minería de Datos Covid19 en Latinoamérica
 
Monografia Data Mining
Monografia Data Mining   Monografia Data Mining
Monografia Data Mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Aplicando mineria de datos - Latinoamerica
Aplicando mineria de datos - LatinoamericaAplicando mineria de datos - Latinoamerica
Aplicando mineria de datos - Latinoamerica
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Mineria de datos en sql server 2012
Mineria de datos en sql server 2012Mineria de datos en sql server 2012
Mineria de datos en sql server 2012
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Data Mining
Data MiningData Mining
Data Mining
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 

Destacado

Unidad 7
Unidad 7Unidad 7
Unidad 7
Rafael Carlos
 
Repaso modalidades textuales
Repaso modalidades textualesRepaso modalidades textuales
Repaso modalidades textuales
eelenius
 
Proyec1
Proyec1Proyec1
Pmw300 k1
Pmw300 k1Pmw300 k1
Pmw300 k1
AV ProfShop
 
Valencia
ValenciaValencia
Practica nº24 de flash
Practica nº24 de flashPractica nº24 de flash
Practica nº24 de flash
Rafael Carlos
 
Platos%26 copas+ +ed70
Platos%26 copas+ +ed70Platos%26 copas+ +ed70
Platos%26 copas+ +ed70
Leonardo Vera López
 
Por qué las instituciones importan
Por qué las instituciones importanPor qué las instituciones importan
Por qué las instituciones importan
Iñaki Beristain Etxabe
 
Guia gastronomica por el huevo luis cepeda
Guia gastronomica por el huevo luis cepedaGuia gastronomica por el huevo luis cepeda
Guia gastronomica por el huevo luis cepeda
Leonardo Vera López
 
Lchf para-principiantes1
Lchf para-principiantes1Lchf para-principiantes1
Lchf para-principiantes1
Leonardo Vera López
 
Resumenes seminario huevo
Resumenes seminario huevoResumenes seminario huevo
Resumenes seminario huevo
Leonardo Vera López
 

Destacado (12)

Unidad 7
Unidad 7Unidad 7
Unidad 7
 
Repaso modalidades textuales
Repaso modalidades textualesRepaso modalidades textuales
Repaso modalidades textuales
 
Proyec1
Proyec1Proyec1
Proyec1
 
Pmw300 k1
Pmw300 k1Pmw300 k1
Pmw300 k1
 
Valencia
ValenciaValencia
Valencia
 
Greenfields
GreenfieldsGreenfields
Greenfields
 
Practica nº24 de flash
Practica nº24 de flashPractica nº24 de flash
Practica nº24 de flash
 
Platos%26 copas+ +ed70
Platos%26 copas+ +ed70Platos%26 copas+ +ed70
Platos%26 copas+ +ed70
 
Por qué las instituciones importan
Por qué las instituciones importanPor qué las instituciones importan
Por qué las instituciones importan
 
Guia gastronomica por el huevo luis cepeda
Guia gastronomica por el huevo luis cepedaGuia gastronomica por el huevo luis cepeda
Guia gastronomica por el huevo luis cepeda
 
Lchf para-principiantes1
Lchf para-principiantes1Lchf para-principiantes1
Lchf para-principiantes1
 
Resumenes seminario huevo
Resumenes seminario huevoResumenes seminario huevo
Resumenes seminario huevo
 

Similar a Mineria de Datos

Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
Snoop Consulting
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Magaly Portocarrero Labajos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
karin juneth soto horna
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
Victor Jaime Polo Romero
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
Gerard Alba
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
Software Guru
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Mining
brobelo
 
4.data mining
4.data mining4.data mining
02 extraccion de conocimiento
02 extraccion de conocimiento02 extraccion de conocimiento
02 extraccion de conocimiento
Coordinador Formosa
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Qué es el análisis predictivo
Qué es el análisis predictivoQué es el análisis predictivo
Qué es el análisis predictivo
EvaluandoSoftware
 
Big Data Clienting - 2 casos prácticos clientes tiendas
Big Data Clienting - 2 casos prácticos clientes tiendasBig Data Clienting - 2 casos prácticos clientes tiendas
Big Data Clienting - 2 casos prácticos clientes tiendas
Omar Arce Torreblanca
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
saibelr
 
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdfAprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Gerard Alba
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Jhon Danny Castro Condor
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Fiorella Aguilar Isuiza
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2
CarlosTenelema1
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Anyeni Garay
 
Modelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaModelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica Predictiva
LPI ONG
 
Machine learning for business
Machine learning for businessMachine learning for business
Machine learning for business
Fran Castillo
 

Similar a Mineria de Datos (20)

Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Fundamentos Minería Datos
Fundamentos Minería DatosFundamentos Minería Datos
Fundamentos Minería Datos
 
Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018Machine Learning in Investment Management March 2018
Machine Learning in Investment Management March 2018
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Mining
 
4.data mining
4.data mining4.data mining
4.data mining
 
02 extraccion de conocimiento
02 extraccion de conocimiento02 extraccion de conocimiento
02 extraccion de conocimiento
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Qué es el análisis predictivo
Qué es el análisis predictivoQué es el análisis predictivo
Qué es el análisis predictivo
 
Big Data Clienting - 2 casos prácticos clientes tiendas
Big Data Clienting - 2 casos prácticos clientes tiendasBig Data Clienting - 2 casos prácticos clientes tiendas
Big Data Clienting - 2 casos prácticos clientes tiendas
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdfAprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
Aprendizaje automático I - Tema 5 Aprendizaje Automático No-Supervisado.pdf
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Arquitectura de datos empresariales actividad 2
Arquitectura de datos empresariales   actividad 2Arquitectura de datos empresariales   actividad 2
Arquitectura de datos empresariales actividad 2
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Modelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica PredictivaModelamiento predictivo en Analítica Predictiva
Modelamiento predictivo en Analítica Predictiva
 
Machine learning for business
Machine learning for businessMachine learning for business
Machine learning for business
 

Último

Refrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y ForzadoRefrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y Forzado
NicandroMartinez2
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Festibity
 
El uso de las TIC por Cecilia Pozos S..pptx
El uso de las TIC  por Cecilia Pozos S..pptxEl uso de las TIC  por Cecilia Pozos S..pptx
El uso de las TIC por Cecilia Pozos S..pptx
cecypozos703
 
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdfInformació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Festibity
 
mantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptxmantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptx
MiguelAtencio10
 
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
AMADO SALVADOR
 
Manual de soporte y mantenimiento de equipo de cómputo
Manual de soporte y mantenimiento de equipo de cómputoManual de soporte y mantenimiento de equipo de cómputo
Manual de soporte y mantenimiento de equipo de cómputo
doctorsoluciones34
 
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdfProjecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Festibity
 
Manual Web soporte y mantenimiento de equipo de computo
Manual Web soporte y mantenimiento de equipo de computoManual Web soporte y mantenimiento de equipo de computo
Manual Web soporte y mantenimiento de equipo de computo
mantenimientocarbra6
 
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
AbrahamCastillo42
 
MONOGRAFIA memoria RAM.docx trabajo DE TECNOLOGIA
MONOGRAFIA memoria RAM.docx trabajo DE TECNOLOGIAMONOGRAFIA memoria RAM.docx trabajo DE TECNOLOGIA
MONOGRAFIA memoria RAM.docx trabajo DE TECNOLOGIA
leia ereni
 
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
codesiret
 
Programming & Artificial Intelligence ebook.pdf
Programming & Artificial Intelligence ebook.pdfProgramming & Artificial Intelligence ebook.pdf
Programming & Artificial Intelligence ebook.pdf
Manuel Diaz
 
Flows: Mejores Prácticas y Nuevos Features
Flows: Mejores Prácticas y Nuevos FeaturesFlows: Mejores Prácticas y Nuevos Features
Flows: Mejores Prácticas y Nuevos Features
Paola De la Torre
 
edublogs info.docx asdasfasfsawqrdqwfqwfqwfq
edublogs info.docx asdasfasfsawqrdqwfqwfqwfqedublogs info.docx asdasfasfsawqrdqwfqwfqwfq
edublogs info.docx asdasfasfsawqrdqwfqwfqwfq
larapalaciosmonzon28
 
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdfPLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
70244530
 
Second Life, informe de actividad del maestro Tapia
Second Life, informe de actividad del maestro TapiaSecond Life, informe de actividad del maestro Tapia
Second Life, informe de actividad del maestro Tapia
al050121024
 
625204013-64-Camino-a-----La-Lectura.pdf
625204013-64-Camino-a-----La-Lectura.pdf625204013-64-Camino-a-----La-Lectura.pdf
625204013-64-Camino-a-----La-Lectura.pdf
yuberpalma
 
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANOREVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
gisellearanguren1
 
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdfProjecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
Festibity
 

Último (20)

Refrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y ForzadoRefrigeradores Samsung Modo Test y Forzado
Refrigeradores Samsung Modo Test y Forzado
 
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdfProjecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
Projecte Iniciativa TIC 2024 KAWARU CONSULTING. inCV.pdf
 
El uso de las TIC por Cecilia Pozos S..pptx
El uso de las TIC  por Cecilia Pozos S..pptxEl uso de las TIC  por Cecilia Pozos S..pptx
El uso de las TIC por Cecilia Pozos S..pptx
 
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdfInformació Projecte Iniciativa TIC SOPRA STERIA.pdf
Informació Projecte Iniciativa TIC SOPRA STERIA.pdf
 
mantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptxmantenimiento de chasis y carroceria1.pptx
mantenimiento de chasis y carroceria1.pptx
 
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
Catalogo general tarifas 2024 Vaillant. Amado Salvador Distribuidor Oficial e...
 
Manual de soporte y mantenimiento de equipo de cómputo
Manual de soporte y mantenimiento de equipo de cómputoManual de soporte y mantenimiento de equipo de cómputo
Manual de soporte y mantenimiento de equipo de cómputo
 
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdfProjecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
Projecte Iniciativa TIC 2024 SOPRA STERIA. inCV.pdf
 
Manual Web soporte y mantenimiento de equipo de computo
Manual Web soporte y mantenimiento de equipo de computoManual Web soporte y mantenimiento de equipo de computo
Manual Web soporte y mantenimiento de equipo de computo
 
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
Todo sobre la tarjeta de video (Bienvenidos a mi blog personal)
 
MONOGRAFIA memoria RAM.docx trabajo DE TECNOLOGIA
MONOGRAFIA memoria RAM.docx trabajo DE TECNOLOGIAMONOGRAFIA memoria RAM.docx trabajo DE TECNOLOGIA
MONOGRAFIA memoria RAM.docx trabajo DE TECNOLOGIA
 
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
Infografia TCP/IP (Transmission Control Protocol/Internet Protocol)
 
Programming & Artificial Intelligence ebook.pdf
Programming & Artificial Intelligence ebook.pdfProgramming & Artificial Intelligence ebook.pdf
Programming & Artificial Intelligence ebook.pdf
 
Flows: Mejores Prácticas y Nuevos Features
Flows: Mejores Prácticas y Nuevos FeaturesFlows: Mejores Prácticas y Nuevos Features
Flows: Mejores Prácticas y Nuevos Features
 
edublogs info.docx asdasfasfsawqrdqwfqwfqwfq
edublogs info.docx asdasfasfsawqrdqwfqwfqwfqedublogs info.docx asdasfasfsawqrdqwfqwfqwfq
edublogs info.docx asdasfasfsawqrdqwfqwfqwfq
 
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdfPLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
PLAN DE MANTENMIENTO preventivo de un equipo de computo.pdf
 
Second Life, informe de actividad del maestro Tapia
Second Life, informe de actividad del maestro TapiaSecond Life, informe de actividad del maestro Tapia
Second Life, informe de actividad del maestro Tapia
 
625204013-64-Camino-a-----La-Lectura.pdf
625204013-64-Camino-a-----La-Lectura.pdf625204013-64-Camino-a-----La-Lectura.pdf
625204013-64-Camino-a-----La-Lectura.pdf
 
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANOREVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
REVISTA TECNOLOGICA PARA EL DESARROLLO HUMANO
 
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdfProjecte Iniciativa TIC 2024 HPE. inCV.pdf
Projecte Iniciativa TIC 2024 HPE. inCV.pdf
 

Mineria de Datos

  • 1. Minería de Datos Rafael Zamora Garrido Julio 2009
  • 2. 2 Ejemplos de objetivos de Minería de Datos
  • 3. 3 ¿Qué es Data Mining?
  • 4. 4 ¿Qué es Data Mining? La minería de datos utiliza diversas técnicaspara analizar y procesar los datos:
  • 5. 5 Técnicas de Minería de Datos El objetivo del clusteringes definir grupos (o clusters) dentro de los cuales los casos (o los clientes) sean lo más parecidos posible. Por otra parte, los diferentes clusters deben ser, entre sí, lo más distintos posible. Ejemplo: Podemos definir dos clusters: los clientes más rentables y los clientes menos rentables. Dentro del cluster de los clientes más rentables, todos los clientes deben tener una rentabilidad por encima de un determinado umbral. La segmentación es la división (o partición) de la totalidad de los datos en segmentos, según determinados criterios. Ejemplo: Clientes de banca Como ejemplo de segmentación, podemos considerar una base de datos de clientes de banca. Una segmentación útil sería en términos de rentabilidad: podríamos identificar tres grupos, los más rentables, los de rentabilidad media y los menos rentables. Para cada grupo podríamos identificar una serie de características. Por ejemplo, en el grupo de los clientes más rentables, la media de edad del cliente es de 49 años, mientras que en el grupo de los clientes menos rentables, la media de edad es de 27 años.. Nota: No hay que confundir clusteringcon segmentación. La segmentación se usa para identificar grupos que tienen características comunes.
  • 6. 6 Técnicas de Minería de Datos Consiste en examinar las características de una entidad nueva y asignarle una clase predefinida. Por ejemplo: Clasificar a un nuevo cliente según su riesgo de crédito (alto, medio, bajo). Ejemplo: Un ejemplo de una técnica de clasificación es la inducción de reglas; otro ejemplo es la red neuronal. La inducción de reglas La inducción de reglas crea un modelo construido a partir de reglas tipo if-then-else (si-entonces-si no). En general funciona tanto para valores numéricos como para valores categóricos. Los modelos tienen una serie de variables de entrada y una o más variables de salida, pero en contraste con las redes neuronales, se puede ver cómo llegan al resultado o salida. Por ejemplo, un modelo muy sencillo tendría tres variables de entrada, edad, estado civil, cuenta de ahorro, y una de salida, contrata hipoteca. Las dos reglas de proceso (el modelo de datos) podrían ser: "Si edad es entre 18 y 40 años y estado civil es casado y cuenta de ahorro = si entonces contrata hipoteca ⇒ si (18450,78%)" o "Si edad es mayor de 40 años y estado civil es casado y tiene cuenta de ahorro = no entonces contrata hipoteca ⇒ no (17490,66%)".
  • 7.
  • 8. Se pueden identificar manualmente, pero hay herramientas que pueden hacerlo de forma automática.
  • 9.
  • 10. el pronóstico de un paciente,
  • 11.
  • 12. 9 Creación de Modelos de Datos Pasos para la creación de modelos de datos: Ahora deberíamos disponer de un conjunto de datos con las variables seleccionadas, que podríamos dar como entradas a las técnicas de modelización
  • 13. 10 Ejemplo creación de Modelos de Datos Ejemplo (Proceso de inducción de C4.5) Suponemos que disponemos de un fichero de datos de clientes con una serie de variables descriptivas sobre ellos: edad; estado civilcon posibles valores casado, soltero, divorciado, viudo y sin especificar; vivienda propiacon posibles valores sí y no. Para cada cliente, también disponemos de una variable de salidaque indica eltipo de cocheque ha comprado con posibles valores coche deportivo, monovolumen, etc. La idea es entrenar un modelo predictivo con estos datos para que sea capaz de predecir con una alta precisión el tipo de coche que una persona comprará, únicamente a partir de los datos de entrada. La inducción de reglas crea un modelo construido a partir de reglas tipo "if-then-else" (si-entonces-si no). En general funciona tanto con valores numéricos como para valores categóricos. Los modelos otra vez tienen una serie de variables de entrada y una o más variables de salida, pero se diferencian de las redes neuronales en que se puede ver cómo llegan al resultado o salida. Suponemos que hemos dado los datos de entrada a la técnica C4.5, y ha producido un modelo de datos predictivo a partir de ellos. Por ejemplo, un modelo muy sencillo tendría las tres variables de entrada, edad, estado civil, vivienda propia, y una de salida, compra coche tipo.... Las dos reglas de proceso (el modelo de datos) podrían ser: "Si edad es joven y estado civil es soltero y tiene vivienda propia = no entonces compra coche deportivo ⇒ si (1500,65%)" o "Si edad es mediana y estado civil es casado y tiene vivienda propia = si entonces compra coche monovolumen ⇒ si (2800,72%)"