SlideShare una empresa de Scribd logo
1 de 13
Introducción a la Minería de Datos con
KNIME
Diego García Saiz
Grupo de Lenguajes y Sistemas Informáticos
Universidad de Cantabria
Introducción al contexto
• Gran cantidad de datos almacenados.
– Por parte de empresas: marketing, hipermercados, servicios, banca,
etc.
– Redes Sociales: Facebook, Twitter, Tuenti, LinkedIn y otras muchas.
– Y en muchos otros ámbitos: educativo (cursos online), institucional
(gobierno), médico, etc.
• ¿Qué hacer con todos esos datos?.
– Podríamos utilizarlos para extraer información relevante con el objeto
de ayudar a la toma de decisiones en el negocio, el gobierno, la
sanidad, la educación, las ventas, etc.
– Para esto tenemos la Minería de Datos.
¿Minería de datos?. Definición formal
• El datamining (minería de datos), es el conjunto de
técnicas y tecnologías que permiten explotar grandes
cantidades de datos, de forma automática o
semiautomática, con el objetivo de encontrar patrones
repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado
contexto.
Más simple: La minería de datos es un
proceso consistente en entender y
extraer información relevante para el
desarrollo del negocio, que no podría
extraerse de otra forma.
No sólo de extraer patrones viven los
“datamineros”: CRIPS-DM
Tres grandes grupos de
algoritmos
• Agrupamiento (clustering).
• Reglas de asociación.
• Predicción: clasificación.
• Conjunto de técnicas de Minería de Datos que determinan y
asignan a los individuos o elementos a grupos de similares
características.
Consiste en diferenciar subconjuntos de datos que comparten
características similares.
Ejemplos:
Identificar rasgo comunes en un conjunto de la población.
Conocer los perfiles de usuario de una red social según su actividad.
Agrupar los datos de una campaña de marketing según sus
resultados.
Agrupamiento (clustering)
Agrupamiento (clustering)
• Ejemplo: Perfil de los alumnos en un curso online según la
actividad que desarrollan.
• Como datos, tenemos su actividad en el curso medida
en, tiempo dedicado, número de sesiones, mensajes
leídos y escritos en el foro, etc.
Resultado de aplicar el algoritmo Kmeans:
Agrupamiento (clustering)
Cluster 1 Cluster 2 Cluster 3
Tiempo Dedicado 103 minutos 1394 minutos 2917 minutos
Sesiones
dedicadas
10 sesiones 90 sesiones 180 sesiones
Mensajes escritos
en el foro
5 mensajes 21 mensajes 89 mensajes
Predicción: Clasificación
• Consiste en la clasificación de individuos en una determinada clase
según sus características, para poder inferir predicciones en un
futuro.
• Ejemplos: conocer si…
• … un cliente realizará una hipoteca con el banco.
• … las acciones de una empresa subirán o bajarán en un
momento determinado.
• … un alumno aprobará o suspenderá una asignatura.
• … un paciente tiene una enfermedad concreta según sus
síntomas y datos personales.
• … una campaña de marketing tendrá éxito.
Clasificación: Ejemplo
• Campaña de marketing telefónico de un banco portugués para
atraer clientes de depósitos
• Conjunto de datos: contiene información personal de los
clientes, incluida información bancaria.
• Estado civil (soltero, casado, viudo)
• Sexo
• Edad
• Mes de la llamada
• Hipotecas del cliente en el banco
• Créditos del cliente en el banco
• Y muchos otros…
• Resultados (algoritmo C4.5)
Duration
Age
Married
Credit
<= 211
> 211 and <=645
Clasificación: Ejemplo
> 645
> 60
yes
yesno
no
…
…
…
NO
YES
NO
Open Analytics - Minería de Datos con Knime

Más contenido relacionado

La actualidad más candente

Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datosiloylan
 
Minería de datos
Minería de datosMinería de datos
Minería de datosKeopx
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datoselsemieni
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos SecuencialesMarilyn Jaramillo
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?Scoremind
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datosArnoldo Gil
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSlalopg
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosmajitol
 
Minería de datos
Minería de datosMinería de datos
Minería de datosanag catal
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kddYaz_Cuapio
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datossaibelr
 

La actualidad más candente (20)

Técnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de DatosTécnicas y Modelos de Mineria de Datos
Técnicas y Modelos de Mineria de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
 
¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?¿Qué es un modelo predictivo y para qué vale?
¿Qué es un modelo predictivo y para qué vale?
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOSMétodos predictivos y Descriptivos - MINERÍA DE DATOS
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
 
Aplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datosAplicación de aprendizaje automático en minería de datos
Aplicación de aprendizaje automático en minería de datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 

Similar a Open Analytics - Minería de Datos con Knime

Curación de contenidos y su importancia.
Curación de contenidos y su importancia.Curación de contenidos y su importancia.
Curación de contenidos y su importancia.Sebas Sandoval
 
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data MiningGerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data MiningSunnely Sequera
 
sistema de investigación de mercado sim
sistema de investigación de mercado simsistema de investigación de mercado sim
sistema de investigación de mercado simJhonatanEspinoza12
 
Sistema de informacion de mercadotecnia
Sistema de informacion de mercadotecnia Sistema de informacion de mercadotecnia
Sistema de informacion de mercadotecnia DieterRivera
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analyticsamdia
 
Gerencia Del Conocimiento Ss
Gerencia Del Conocimiento SsGerencia Del Conocimiento Ss
Gerencia Del Conocimiento SsIndiana19
 
Big data y Marketing digital
Big data y Marketing digitalBig data y Marketing digital
Big data y Marketing digitalDMC Perú
 
Que es social media analytics & listening y como funcionan
Que es social media analytics & listening y como funcionanQue es social media analytics & listening y como funcionan
Que es social media analytics & listening y como funcionanOscar Gonzalez Rezex
 
Big data y marketing digital
Big data y marketing digitalBig data y marketing digital
Big data y marketing digitalNeo Consulting
 
Tendencias emergentes de e-learning: MOOCs, gamificación y datos masivos
Tendencias emergentes de  e-learning: MOOCs, gamificación y datos masivosTendencias emergentes de  e-learning: MOOCs, gamificación y datos masivos
Tendencias emergentes de e-learning: MOOCs, gamificación y datos masivosFernando Santamaría
 

Similar a Open Analytics - Minería de Datos con Knime (20)

Curación de contenidos y su importancia.
Curación de contenidos y su importancia.Curación de contenidos y su importancia.
Curación de contenidos y su importancia.
 
Data mining
Data miningData mining
Data mining
 
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data MiningGerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
Gerencia del Conocimiento Aplicado al Mercadeo / CRM y Data Mining
 
sistema de investigación de mercado sim
sistema de investigación de mercado simsistema de investigación de mercado sim
sistema de investigación de mercado sim
 
Mijarex lopez aor
Mijarex lopez  aorMijarex lopez  aor
Mijarex lopez aor
 
Cm mpv
Cm mpvCm mpv
Cm mpv
 
Sistema de informacion de mercadotecnia
Sistema de informacion de mercadotecnia Sistema de informacion de mercadotecnia
Sistema de informacion de mercadotecnia
 
Semana 1_Marketing Digital.pdf
Semana 1_Marketing Digital.pdfSemana 1_Marketing Digital.pdf
Semana 1_Marketing Digital.pdf
 
Tarea 1
Tarea 1Tarea 1
Tarea 1
 
Tarea 1
Tarea 1Tarea 1
Tarea 1
 
Tarea 1
Tarea 1Tarea 1
Tarea 1
 
Tarea 1
Tarea 1Tarea 1
Tarea 1
 
Desayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & AnalyticsDesayuno Data science - Aplicaciones en métricas & Analytics
Desayuno Data science - Aplicaciones en métricas & Analytics
 
Gerencia Del Conocimiento Ss
Gerencia Del Conocimiento SsGerencia Del Conocimiento Ss
Gerencia Del Conocimiento Ss
 
Big data y Marketing digital
Big data y Marketing digitalBig data y Marketing digital
Big data y Marketing digital
 
Mercado 3 p.11
Mercado 3 p.11Mercado 3 p.11
Mercado 3 p.11
 
Que es social media analytics & listening y como funcionan
Que es social media analytics & listening y como funcionanQue es social media analytics & listening y como funcionan
Que es social media analytics & listening y como funcionan
 
Big data y marketing digital
Big data y marketing digitalBig data y marketing digital
Big data y marketing digital
 
Tendencias emergentes de e-learning: MOOCs, gamificación y datos masivos
Tendencias emergentes de  e-learning: MOOCs, gamificación y datos masivosTendencias emergentes de  e-learning: MOOCs, gamificación y datos masivos
Tendencias emergentes de e-learning: MOOCs, gamificación y datos masivos
 
Araba comunikacion digital - 1
Araba comunikacion digital - 1Araba comunikacion digital - 1
Araba comunikacion digital - 1
 

Más de OpenAnalytics Spain

OpenAnalytics 04/2015 - Watson vs R
OpenAnalytics 04/2015 - Watson vs ROpenAnalytics 04/2015 - Watson vs R
OpenAnalytics 04/2015 - Watson vs ROpenAnalytics Spain
 
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics Spain
 
OpenAnalytics 04/2015 - CustomeR Life Value - CLV
OpenAnalytics 04/2015 - CustomeR Life Value - CLVOpenAnalytics 04/2015 - CustomeR Life Value - CLV
OpenAnalytics 04/2015 - CustomeR Life Value - CLVOpenAnalytics Spain
 
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATA
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATAOpen Analytics 2014 - Ángel Sánchez - UX & BIG DATA
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATAOpenAnalytics Spain
 
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...OpenAnalytics Spain
 
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...OpenAnalytics Spain
 
Open Analytics 2014 - Pedro Alves - Innovation though Open Source
Open Analytics 2014 - Pedro Alves - Innovation though Open SourceOpen Analytics 2014 - Pedro Alves - Innovation though Open Source
Open Analytics 2014 - Pedro Alves - Innovation though Open SourceOpenAnalytics Spain
 
Open Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
Open Analytics 2014 - Emilio Arias - Intro evento + Business AnalyticsOpen Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
Open Analytics 2014 - Emilio Arias - Intro evento + Business AnalyticsOpenAnalytics Spain
 
OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014 OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014 OpenAnalytics Spain
 
OpenAnalytics - Smartcities y Software libre por Ignacio Bustillo
OpenAnalytics - Smartcities y Software libre por Ignacio BustilloOpenAnalytics - Smartcities y Software libre por Ignacio Bustillo
OpenAnalytics - Smartcities y Software libre por Ignacio BustilloOpenAnalytics Spain
 
OpenAnalytics - Periodismo de datos por Hugo Garrido
OpenAnalytics - Periodismo de datos por Hugo GarridoOpenAnalytics - Periodismo de datos por Hugo Garrido
OpenAnalytics - Periodismo de datos por Hugo GarridoOpenAnalytics Spain
 
OpenAnalytics - OpenData orientado al mundo empresarial por Alberto Abella
OpenAnalytics - OpenData orientado al mundo empresarial por Alberto AbellaOpenAnalytics - OpenData orientado al mundo empresarial por Alberto Abella
OpenAnalytics - OpenData orientado al mundo empresarial por Alberto AbellaOpenAnalytics Spain
 
OpenAnalytics - BigData por Ivan del Prado (Datasalt)
OpenAnalytics - BigData por Ivan del Prado (Datasalt)OpenAnalytics - BigData por Ivan del Prado (Datasalt)
OpenAnalytics - BigData por Ivan del Prado (Datasalt)OpenAnalytics Spain
 
Open Analytics - Data Quality por Diego Martínez de Equifax
Open Analytics - Data Quality por Diego Martínez de EquifaxOpen Analytics - Data Quality por Diego Martínez de Equifax
Open Analytics - Data Quality por Diego Martínez de EquifaxOpenAnalytics Spain
 
OpenAnalytics - Business Intelligence por Emilio Arias
OpenAnalytics - Business Intelligence por Emilio AriasOpenAnalytics - Business Intelligence por Emilio Arias
OpenAnalytics - Business Intelligence por Emilio AriasOpenAnalytics Spain
 

Más de OpenAnalytics Spain (15)

OpenAnalytics 04/2015 - Watson vs R
OpenAnalytics 04/2015 - Watson vs ROpenAnalytics 04/2015 - Watson vs R
OpenAnalytics 04/2015 - Watson vs R
 
OpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con HadoopOpenAnalytics 04/2015 - Data Analytics con Hadoop
OpenAnalytics 04/2015 - Data Analytics con Hadoop
 
OpenAnalytics 04/2015 - CustomeR Life Value - CLV
OpenAnalytics 04/2015 - CustomeR Life Value - CLVOpenAnalytics 04/2015 - CustomeR Life Value - CLV
OpenAnalytics 04/2015 - CustomeR Life Value - CLV
 
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATA
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATAOpen Analytics 2014 - Ángel Sánchez - UX & BIG DATA
Open Analytics 2014 - Ángel Sánchez - UX & BIG DATA
 
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
Open Analytics 2014 - Daniele grasso - Herramientas Open Source en periodismo...
 
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
Open Analytics 2014 - Ángel Rey - Procesamiento y análisis de mensajes geopos...
 
Open Analytics 2014 - Pedro Alves - Innovation though Open Source
Open Analytics 2014 - Pedro Alves - Innovation though Open SourceOpen Analytics 2014 - Pedro Alves - Innovation though Open Source
Open Analytics 2014 - Pedro Alves - Innovation though Open Source
 
Open Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
Open Analytics 2014 - Emilio Arias - Intro evento + Business AnalyticsOpen Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
Open Analytics 2014 - Emilio Arias - Intro evento + Business Analytics
 
OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014 OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014
 
OpenAnalytics - Smartcities y Software libre por Ignacio Bustillo
OpenAnalytics - Smartcities y Software libre por Ignacio BustilloOpenAnalytics - Smartcities y Software libre por Ignacio Bustillo
OpenAnalytics - Smartcities y Software libre por Ignacio Bustillo
 
OpenAnalytics - Periodismo de datos por Hugo Garrido
OpenAnalytics - Periodismo de datos por Hugo GarridoOpenAnalytics - Periodismo de datos por Hugo Garrido
OpenAnalytics - Periodismo de datos por Hugo Garrido
 
OpenAnalytics - OpenData orientado al mundo empresarial por Alberto Abella
OpenAnalytics - OpenData orientado al mundo empresarial por Alberto AbellaOpenAnalytics - OpenData orientado al mundo empresarial por Alberto Abella
OpenAnalytics - OpenData orientado al mundo empresarial por Alberto Abella
 
OpenAnalytics - BigData por Ivan del Prado (Datasalt)
OpenAnalytics - BigData por Ivan del Prado (Datasalt)OpenAnalytics - BigData por Ivan del Prado (Datasalt)
OpenAnalytics - BigData por Ivan del Prado (Datasalt)
 
Open Analytics - Data Quality por Diego Martínez de Equifax
Open Analytics - Data Quality por Diego Martínez de EquifaxOpen Analytics - Data Quality por Diego Martínez de Equifax
Open Analytics - Data Quality por Diego Martínez de Equifax
 
OpenAnalytics - Business Intelligence por Emilio Arias
OpenAnalytics - Business Intelligence por Emilio AriasOpenAnalytics - Business Intelligence por Emilio Arias
OpenAnalytics - Business Intelligence por Emilio Arias
 

Último

CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 

Último (19)

CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 

Open Analytics - Minería de Datos con Knime

  • 1. Introducción a la Minería de Datos con KNIME Diego García Saiz Grupo de Lenguajes y Sistemas Informáticos Universidad de Cantabria
  • 2. Introducción al contexto • Gran cantidad de datos almacenados. – Por parte de empresas: marketing, hipermercados, servicios, banca, etc. – Redes Sociales: Facebook, Twitter, Tuenti, LinkedIn y otras muchas. – Y en muchos otros ámbitos: educativo (cursos online), institucional (gobierno), médico, etc. • ¿Qué hacer con todos esos datos?. – Podríamos utilizarlos para extraer información relevante con el objeto de ayudar a la toma de decisiones en el negocio, el gobierno, la sanidad, la educación, las ventas, etc. – Para esto tenemos la Minería de Datos.
  • 3. ¿Minería de datos?. Definición formal • El datamining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explotar grandes cantidades de datos, de forma automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Más simple: La minería de datos es un proceso consistente en entender y extraer información relevante para el desarrollo del negocio, que no podría extraerse de otra forma.
  • 4. No sólo de extraer patrones viven los “datamineros”: CRIPS-DM
  • 5. Tres grandes grupos de algoritmos • Agrupamiento (clustering). • Reglas de asociación. • Predicción: clasificación.
  • 6.
  • 7. • Conjunto de técnicas de Minería de Datos que determinan y asignan a los individuos o elementos a grupos de similares características. Consiste en diferenciar subconjuntos de datos que comparten características similares. Ejemplos: Identificar rasgo comunes en un conjunto de la población. Conocer los perfiles de usuario de una red social según su actividad. Agrupar los datos de una campaña de marketing según sus resultados. Agrupamiento (clustering)
  • 9. • Ejemplo: Perfil de los alumnos en un curso online según la actividad que desarrollan. • Como datos, tenemos su actividad en el curso medida en, tiempo dedicado, número de sesiones, mensajes leídos y escritos en el foro, etc. Resultado de aplicar el algoritmo Kmeans: Agrupamiento (clustering) Cluster 1 Cluster 2 Cluster 3 Tiempo Dedicado 103 minutos 1394 minutos 2917 minutos Sesiones dedicadas 10 sesiones 90 sesiones 180 sesiones Mensajes escritos en el foro 5 mensajes 21 mensajes 89 mensajes
  • 10. Predicción: Clasificación • Consiste en la clasificación de individuos en una determinada clase según sus características, para poder inferir predicciones en un futuro. • Ejemplos: conocer si… • … un cliente realizará una hipoteca con el banco. • … las acciones de una empresa subirán o bajarán en un momento determinado. • … un alumno aprobará o suspenderá una asignatura. • … un paciente tiene una enfermedad concreta según sus síntomas y datos personales. • … una campaña de marketing tendrá éxito.
  • 11. Clasificación: Ejemplo • Campaña de marketing telefónico de un banco portugués para atraer clientes de depósitos • Conjunto de datos: contiene información personal de los clientes, incluida información bancaria. • Estado civil (soltero, casado, viudo) • Sexo • Edad • Mes de la llamada • Hipotecas del cliente en el banco • Créditos del cliente en el banco • Y muchos otros…
  • 12. • Resultados (algoritmo C4.5) Duration Age Married Credit <= 211 > 211 and <=645 Clasificación: Ejemplo > 645 > 60 yes yesno no … … … NO YES NO