SlideShare una empresa de Scribd logo
1 de 42
Minería de Datos Integrantes del Equipo: Cerón Reyes María de los Ángeles Gómez Díaz Haydeé Bases de Datos Junio 2010
Introducción Día a día generamos información y esto nos lleva a tener una gran cantidad de esta, lo cual implica que el  generar información, nos puede ayudar a controlar, optimizar, administrar, examinar, investigar, planificar, predecir, someter, negociar o tomar decisiones de cualquier ámbito según el dominio en que nos desarrollemos.
¿Qué es Minería de Datos? ,[object Object],[object Object]
Proceso de Minería de Datos Los pasos a seguir para la realización de un proyecto de minería de datos son: 1. La Determinación de los Objetivos. Trata sobre la delimitación de los objetivos que el cliente desea  2. Pre procesamiento de los Datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y transformación de las bases de datos.
[object Object],[object Object],Proceso de Minería de Datos
Principales Características de MD ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Aplicaciones de Minería de Datos
¿Qué es el proceso de KDD? ,[object Object],[object Object],[object Object]
Fases del KDD
Fases del KDD ,[object Object],[object Object],[object Object],[object Object],[object Object]
Fases del KDD ,[object Object],[object Object]
TÉCNICAS DE DATA MINING IMPLANTAR MODELO DE DATA MINING DATOS PROBLEMAS Estadística  o Inteligencia Artificial ALGORITMOS No estático
Con el modelado se construye un modelo en una situación donde se conoce la respuesta y luego se aplica en otra situación de la cual se desconoce la respuesta.
CLASIFICACION DE ALGORITMOS DE MINERIA DE DATOS
Descripción Normalmente esta técnica es usada para análisis preliminar de los datos (resumen, características de los datos,  etc.).  Describir un comportamiento en una base de datos compleja para aumentar el conocimiento y entendimiento sobre gente, productos, procesos etc.  (–Visualización – Diferenciación) ,[object Object],[object Object],[object Object],[object Object]
Ejemplo ‏ Gestión de personal de una empresa: ¿Qué clases de empleados hay contratados? Datos: Modelo generado: Minería de datos Grupo 1 : Sin niños y en una casa alquilada. Bajo número de uniones. Muchos días enfermos Grupo 2 : Sin niños y con coche. Alto número de uniones. Pocos días enfermos. Más mujeres y en una casa alquilada Grupo 3 : Con niños, casados y con coche. Más hombres y normalmente propietarios de casa. Bajo número de uniones
Predicción ALGORITMOS DE MINERIA DE DATOS
Árboles de decisión SE SELECCIONA EL NODO RAIZ Y ESTE SE DIVIDE DE ACUERDO A LOS VALORES DEL ATRIBUTO RAIZ
> $5000   <=$5000 M  F   >35  <= 35 0  Casado  Soltera  F  M  >=4  >4 0  1  0  1  0  1 If (Ingreso=>5000  AND Genero=F AND Estado = Soltera  Then  P(Coche)=1  ,[object Object],[object Object],[object Object],[object Object],[object Object],Modelo predictivo generado Árboles de decisión Ingreso Ingreso Genero Edad Genero Antigüedad
Árboles de decisión
Árboles de decisión Agente comercial: ¿Debo conceder una hipoteca a un cliente? Datos: Modelo generado: Minería de datos If  Defaulter-accounts > 0  then  Returns-credit = no If  Defaulter-accounts = 0  and  [(Salary > 2500)  or  (Credit-p > 10)]  then  Returns-credit = yes
Ejemplo ‏ Tienda de TV: ¿Cuántas televisiones planas se venderán el próximo mes? Datos:  Modelo generado: Minería de datos Modelo lineal : número de televisiones para el próximo mes V(month) flatTV  = 0.62 V(Month-1) flat-TV  + 0.33 V(Month-2) flat-TV  + 0.12 V(Month-1) DVD-Recorder  – 0.05
Exploración ALGORITMOS DE MINERIA DE DATOS
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],ALGORITMOS DE MINERIA DE DATOS
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],ALGORITMOS DE MINERIA DE DATOS
Análisis de Canasta  (Market Basket Analysis) Reglas de Asociación
Análisis de Canasta  Ejemplo  Un ejemplo tradicional de minería de datos es el relacionado con una búsqueda en una bodega de datos, de un negocio de cadena, de hechos comunes y relevantes: Luego del proceso se dio como resultado la siguiente: Si edad < 35;  y sexo = masculino;  y dia = jueves  entonces compras incluyen  pañales;  y cerveza  Esto sirvió para que empresa tomara medidas relacionada con la ubicación de ciertos productos en sitios comunes.
Análisis de Canasta (Market Basket Analysis) Los hábitos de compra de los clientes pueden ser representados a través de asociaciones o correlaciones entre los diferentes productos que compran en sus “canastas”. Cliente 1: Arroz, puré, bebida Cliente 2: Arroz, helado, pan Cliente 1: Arroz, bebida, cerveza
Análisis de Canasta: Indicadores
Análisis de Canasta: Indicadores Confiabilidad (confidence ) :  Indica el porcentaje de transacciones que llevan el antecedente y el consecuente juntos, con respecto al total de transacciones que llevan el antecedente. Ejemplo:  {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Confianza (cerveza   puré)= 1/2=50% Esta relación señala el vínculo entre ambos productos (probabilidad condicional). Pero, qué pasa en el siguiente caso: Confianza(helado   arroz)=1/1= 100% ¿Quiere decir que hay una fuerte relación entre estos productos?
Análisis de Canasta: Indicadores Ganancia (gain or Improvement ) :  puntaje que representa el aumento en la probabilidad de selección del consecuente, al ser comprado en conjunto con el antecedente. Ganancia (A  B)=Confianza(A  B)/Importancia Relativa(B) Ejemplo:  {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Ganancia(helado   arroz)=1/1= 1 Ganancia(bebida   puré)=0,5/0,3= 1,5 Con estos indicadores podemos entender las relaciones entre clientes
Ejemplo Supermercado: ¿Cuándo los clientes compran huevos, también compran aceite? Datos: Modelo generado: Minería de datos Eggs -> Oil: Confianza = 75%, Soporte = 37%
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Beneficios para el Supermercado :
Herramientas de software Existen muchas herramientas de software para el desarrollo de modelos de minería de datos tanto libres como comerciales como, por ejemplo: ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Herramienta Weka La Weka ( Gallirallus australis) es un ave originaria de Nueva Zelanda. Esta Gallinácea en peligro  de extinción es famosa por su curiosidad y agresividad. De aspecto pardo y tamaño similar a una gallina, las wekas se alimentan fundamentalmente de insectos y frutos. Weka es un software programado en Java que est á  orientado a la extracci ó n de conocimientos desde bases de datos con grandes cantidades de informaci ó n.
Herramienta Weka ,[object Object],[object Object],[object Object],[object Object],[object Object]
Herramienta Weka
Herramienta Weka
Referencias ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Preguntas
Gracias!!!!

Más contenido relacionado

La actualidad más candente

Una base de datos relacional
Una base de datos relacionalUna base de datos relacional
Una base de datos relacionalAlex Javier
 
Ppt de ingenieria de requerimiento
Ppt de ingenieria de requerimientoPpt de ingenieria de requerimiento
Ppt de ingenieria de requerimientomely1930
 
Preguntas de introducción al desarrollo del software
Preguntas de introducción al desarrollo del softwarePreguntas de introducción al desarrollo del software
Preguntas de introducción al desarrollo del softwareAndrezMendozaMelendr
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big DataDavid Alayón
 
Análisis y diseño estructurado
Análisis y diseño estructuradoAnálisis y diseño estructurado
Análisis y diseño estructuradoIsbel Alfonzo
 
Minería de datos
Minería de datosMinería de datos
Minería de datosKeopx
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSEnestor
 
Técnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosTécnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosValeria Gavilanes
 
Metodología de desarrollo de software (45 Preguntas)
Metodología de desarrollo de software (45 Preguntas)Metodología de desarrollo de software (45 Preguntas)
Metodología de desarrollo de software (45 Preguntas)LeonardoAguantaRodrg
 
Analisis y diseño de sistemas preguntas de repaso
Analisis y diseño de sistemas preguntas de repasoAnalisis y diseño de sistemas preguntas de repaso
Analisis y diseño de sistemas preguntas de repasoAlejandro Rivera Santander
 
Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosCelestino Güemes Seoane
 
CUADRO COMPARATIVO DE CONCEPTOS DE MINING DATA, BIG DATA Y CLOUD COMPUTING.
CUADRO COMPARATIVO DE CONCEPTOS DE   MINING DATA, BIG DATA Y CLOUD COMPUTING.CUADRO COMPARATIVO DE CONCEPTOS DE   MINING DATA, BIG DATA Y CLOUD COMPUTING.
CUADRO COMPARATIVO DE CONCEPTOS DE MINING DATA, BIG DATA Y CLOUD COMPUTING.Luiseduardo123
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Ana Delgado
 
Sistema De Gestión De Base De Datos
Sistema De Gestión De Base De DatosSistema De Gestión De Base De Datos
Sistema De Gestión De Base De DatosGuillermo Chirinos
 

La actualidad más candente (20)

Aprendizaje no supervisado
Aprendizaje no supervisadoAprendizaje no supervisado
Aprendizaje no supervisado
 
Una base de datos relacional
Una base de datos relacionalUna base de datos relacional
Una base de datos relacional
 
Metodologia Estructurada
Metodologia Estructurada Metodologia Estructurada
Metodologia Estructurada
 
Ppt de ingenieria de requerimiento
Ppt de ingenieria de requerimientoPpt de ingenieria de requerimiento
Ppt de ingenieria de requerimiento
 
Preguntas de introducción al desarrollo del software
Preguntas de introducción al desarrollo del softwarePreguntas de introducción al desarrollo del software
Preguntas de introducción al desarrollo del software
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
Análisis y diseño estructurado
Análisis y diseño estructuradoAnálisis y diseño estructurado
Análisis y diseño estructurado
 
Big data
Big dataBig data
Big data
 
Big data presentación
Big data presentaciónBig data presentación
Big data presentación
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Introduccion al análisis de sistemas de información
Introduccion al análisis de sistemas de informaciónIntroduccion al análisis de sistemas de información
Introduccion al análisis de sistemas de información
 
DATAWAREHOUSE
DATAWAREHOUSEDATAWAREHOUSE
DATAWAREHOUSE
 
Técnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datosTécnicas más usadas en la mineria de datos
Técnicas más usadas en la mineria de datos
 
Metodología de desarrollo de software (45 Preguntas)
Metodología de desarrollo de software (45 Preguntas)Metodología de desarrollo de software (45 Preguntas)
Metodología de desarrollo de software (45 Preguntas)
 
Analisis y diseño de sistemas preguntas de repaso
Analisis y diseño de sistemas preguntas de repasoAnalisis y diseño de sistemas preguntas de repaso
Analisis y diseño de sistemas preguntas de repaso
 
Big Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negociosBig Data: conceptos generales e impacto en los negocios
Big Data: conceptos generales e impacto en los negocios
 
CUADRO COMPARATIVO DE CONCEPTOS DE MINING DATA, BIG DATA Y CLOUD COMPUTING.
CUADRO COMPARATIVO DE CONCEPTOS DE   MINING DATA, BIG DATA Y CLOUD COMPUTING.CUADRO COMPARATIVO DE CONCEPTOS DE   MINING DATA, BIG DATA Y CLOUD COMPUTING.
CUADRO COMPARATIVO DE CONCEPTOS DE MINING DATA, BIG DATA Y CLOUD COMPUTING.
 
Oracle
Oracle Oracle
Oracle
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Sistema De Gestión De Base De Datos
Sistema De Gestión De Base De DatosSistema De Gestión De Base De Datos
Sistema De Gestión De Base De Datos
 

Similar a Minería de Datos-Introducción

Similar a Minería de Datos-Introducción (20)

Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Data Mining Parte 1.pptx
Data Mining Parte 1.pptxData Mining Parte 1.pptx
Data Mining Parte 1.pptx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
MD: Clase9
MD: Clase9MD: Clase9
MD: Clase9
 
SEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdfSEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdf
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
 
La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD La minería de datos en el proceso de KDD
La minería de datos en el proceso de KDD
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
INTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.pptINTELIGENCIA DE NEGOCIOS_ internacionales.ppt
INTELIGENCIA DE NEGOCIOS_ internacionales.ppt
 
Data
DataData
Data
 

Último

Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxRogerPrieto3
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 

Último (15)

Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Herramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptxHerramientas de corte de alta velocidad.pptx
Herramientas de corte de alta velocidad.pptx
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 

Minería de Datos-Introducción

  • 1. Minería de Datos Integrantes del Equipo: Cerón Reyes María de los Ángeles Gómez Díaz Haydeé Bases de Datos Junio 2010
  • 2. Introducción Día a día generamos información y esto nos lleva a tener una gran cantidad de esta, lo cual implica que el generar información, nos puede ayudar a controlar, optimizar, administrar, examinar, investigar, planificar, predecir, someter, negociar o tomar decisiones de cualquier ámbito según el dominio en que nos desarrollemos.
  • 3.
  • 4. Proceso de Minería de Datos Los pasos a seguir para la realización de un proyecto de minería de datos son: 1. La Determinación de los Objetivos. Trata sobre la delimitación de los objetivos que el cliente desea 2. Pre procesamiento de los Datos. Se refiere a la selección, la limpieza, el enriquecimiento, la reducción y transformación de las bases de datos.
  • 5.
  • 6.
  • 8.
  • 10.
  • 11.
  • 12. TÉCNICAS DE DATA MINING IMPLANTAR MODELO DE DATA MINING DATOS PROBLEMAS Estadística o Inteligencia Artificial ALGORITMOS No estático
  • 13. Con el modelado se construye un modelo en una situación donde se conoce la respuesta y luego se aplica en otra situación de la cual se desconoce la respuesta.
  • 14. CLASIFICACION DE ALGORITMOS DE MINERIA DE DATOS
  • 15.
  • 16. Ejemplo ‏ Gestión de personal de una empresa: ¿Qué clases de empleados hay contratados? Datos: Modelo generado: Minería de datos Grupo 1 : Sin niños y en una casa alquilada. Bajo número de uniones. Muchos días enfermos Grupo 2 : Sin niños y con coche. Alto número de uniones. Pocos días enfermos. Más mujeres y en una casa alquilada Grupo 3 : Con niños, casados y con coche. Más hombres y normalmente propietarios de casa. Bajo número de uniones
  • 17. Predicción ALGORITMOS DE MINERIA DE DATOS
  • 18. Árboles de decisión SE SELECCIONA EL NODO RAIZ Y ESTE SE DIVIDE DE ACUERDO A LOS VALORES DEL ATRIBUTO RAIZ
  • 19.
  • 21. Árboles de decisión Agente comercial: ¿Debo conceder una hipoteca a un cliente? Datos: Modelo generado: Minería de datos If Defaulter-accounts > 0 then Returns-credit = no If Defaulter-accounts = 0 and [(Salary > 2500) or (Credit-p > 10)] then Returns-credit = yes
  • 22. Ejemplo ‏ Tienda de TV: ¿Cuántas televisiones planas se venderán el próximo mes? Datos: Modelo generado: Minería de datos Modelo lineal : número de televisiones para el próximo mes V(month) flatTV = 0.62 V(Month-1) flat-TV + 0.33 V(Month-2) flat-TV + 0.12 V(Month-1) DVD-Recorder – 0.05
  • 23. Exploración ALGORITMOS DE MINERIA DE DATOS
  • 24.
  • 25.
  • 26.
  • 27. Análisis de Canasta (Market Basket Analysis) Reglas de Asociación
  • 28. Análisis de Canasta Ejemplo Un ejemplo tradicional de minería de datos es el relacionado con una búsqueda en una bodega de datos, de un negocio de cadena, de hechos comunes y relevantes: Luego del proceso se dio como resultado la siguiente: Si edad < 35; y sexo = masculino; y dia = jueves entonces compras incluyen pañales; y cerveza Esto sirvió para que empresa tomara medidas relacionada con la ubicación de ciertos productos en sitios comunes.
  • 29. Análisis de Canasta (Market Basket Analysis) Los hábitos de compra de los clientes pueden ser representados a través de asociaciones o correlaciones entre los diferentes productos que compran en sus “canastas”. Cliente 1: Arroz, puré, bebida Cliente 2: Arroz, helado, pan Cliente 1: Arroz, bebida, cerveza
  • 30. Análisis de Canasta: Indicadores
  • 31. Análisis de Canasta: Indicadores Confiabilidad (confidence ) : Indica el porcentaje de transacciones que llevan el antecedente y el consecuente juntos, con respecto al total de transacciones que llevan el antecedente. Ejemplo: {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Confianza (cerveza  puré)= 1/2=50% Esta relación señala el vínculo entre ambos productos (probabilidad condicional). Pero, qué pasa en el siguiente caso: Confianza(helado  arroz)=1/1= 100% ¿Quiere decir que hay una fuerte relación entre estos productos?
  • 32. Análisis de Canasta: Indicadores Ganancia (gain or Improvement ) : puntaje que representa el aumento en la probabilidad de selección del consecuente, al ser comprado en conjunto con el antecedente. Ganancia (A  B)=Confianza(A  B)/Importancia Relativa(B) Ejemplo: {arroz, puré, cerveza}, {arroz, helado, pan}, {arroz, bebida, cerveza} Ganancia(helado  arroz)=1/1= 1 Ganancia(bebida  puré)=0,5/0,3= 1,5 Con estos indicadores podemos entender las relaciones entre clientes
  • 33. Ejemplo Supermercado: ¿Cuándo los clientes compran huevos, también compran aceite? Datos: Modelo generado: Minería de datos Eggs -> Oil: Confianza = 75%, Soporte = 37%
  • 34.
  • 35.
  • 36. Herramienta Weka La Weka ( Gallirallus australis) es un ave originaria de Nueva Zelanda. Esta Gallinácea en peligro de extinción es famosa por su curiosidad y agresividad. De aspecto pardo y tamaño similar a una gallina, las wekas se alimentan fundamentalmente de insectos y frutos. Weka es un software programado en Java que est á orientado a la extracci ó n de conocimientos desde bases de datos con grandes cantidades de informaci ó n.
  • 37.
  • 40.