SlideShare una empresa de Scribd logo
1 de 29
Descargar para leer sin conexión
INTRODUCCIÓN A LA
MINERÍA DE DATOS
German Ricardo Bermúdez Navarro
2023/08/09
DEFINICIÓN
La minería de datos (o data mining) es el proceso de analizar grandes cantidades
de datos para encontrar tendencias y patrones. Permite convertir datos sin
procesar y estructurarlos en información comprensible sobre diversas áreas de
negocios y del mercado.
DEFINICIÓN
Este análisis brinda información importante que ayudara a las empresas a
resolver problemas (e identificarlos antes de que vuelvan a ocurrir).
También sirve para reducir riesgos y costes, detectar oportunidades de mercado,
mejorar la experiencia del cliente y predecir sus comportamientos y preferencias.
BIG DATA Y MINERÍA DE DATOS
La minería de datos mantiene una relación íntima con el big data. Cada minuto
de cada día se generan más de 5,7 millones de búsquedas en Google, 6
millones de personas realizan compras en línea y se publican 575.000 tweets.
Estos inmensos volúmenes de información digital son los que conocemos como
big data: datos en bruto recopilados por medio de las tecnologías
computacionales.
BIG DATA Y MINERÍA DE DATOS
Para gestionar tanta información es necesario establecer objetivos específicos y
contar con herramientas diseñadas para encontrar los datos útiles.
Por ejemplo, tu objetivo podría ser realizar un estudio estadístico de las
poblaciones que consumen un producto y generar un perfil de cliente basado
en las cookies e historial de navegación. La minería de datos puede hacerlo
posible.
BIG DATA Y MINERÍA DE DATOS
Al aplicar algoritmos para analizar la información podemos aprovechar
realmente los macrodatos del big data. Estos algoritmos complejos suelen
procesar más información en menos tiempo.
En resumen, el big data ofrece la materia prima para el análisis de información;
mientras que la minería de datos es la herramienta para rastrear, ubicar, extraer
y visualizar la información que nos interesa; y con ello diseñar las estrategias
comerciales pertinentes.
BENEFICIOS
La minería de datos aporta una ventaja significativa al proporcionar inteligencia e
información más relevante y oportuna (a la cual la empresa no tendría acceso de
otra manera). Algunos beneficios de la minería de datos incluyen:
BENEFICIOS
Encontrar fácilmente los datos esenciales. El big data contiene información
realmente útil, pero también hay muchos datos que no necesitas. La minería de
datos permite diferenciar automáticamente la información valiosa e interpretarla
en informes procesables.
BENEFICIOS
Comprender mejor a los clientes y su recorrido. Con la minería de datos
puedes recopilar datos de clientes de múltiples fuentes para formar perfiles
informativos muy completos. Esto te brinda un conocimiento valioso sobre las
tendencias, preferencias, comportamientos, similitudes y diferencias de los
consumidores.
BENEFICIOS
Tomar decisiones más rápidas y automatizadas. En lugar de que una persona
revise todos los datos y elija las acciones a emprender, puedes automatizar
ciertas decisiones. Por ejemplo, los bancos pueden usar software para identificar
tendencias que revelan comportamientos fraudulentos y bloquear
automáticamente cuentas en segundos, notificar a una persona responsable o
solicitar verificación adicional de los usuarios.
BENEFICIOS
Desarrollar campañas de marketing más
efectivas y personalizadas. Con el
conocimiento que obtienes de la minería
de datos, los equipos de marketing pueden
crear campañas mucho más
personalizadas, adaptar el contenido y las
recomendaciones de productos en función
de preferencias y comportamientos
conocidos, predecir tendencias de cómo
los consumidores compran o navegan en tu
sitio web, descubrir qué les impide
comprar o qué los lleva a abandonar su
carrito, crear segmentos de marketing
precisos y ofrecer promociones
personalizadas, entre otras cosas.
TÉCNICAS DE LA MINERÍA DE DATOS
Las técnicas de minería de datos dependerán en su mayoría de las necesidades
de cada empresa. Sin embargo, podemos categorizarlas en tres grandes grupos:
• Descriptivas
• Predictivas
• Prescriptivas.
TÉCNICAS DESCRIPTIVAS DE MINERÍA DE DATOS
Técnicas de asociación
Como ya lo explicamos, la minería de datos detecta patrones a través del
reconocimiento de conjuntos de datos en intervalos regulares. Con estas
funciones podrías saber cuáles son los productos o servicios que más se
compran en determinada época del año, por ejemplo en Navidad.
Esta tarea tiene por objeto buscar nuevos eventos o atributos relevantes
comparados con los ya existentes dentro de tu negocio. Por ejemplo, cuando un
cliente adquiere un artículo específico, es común notar que los usuarios tienden
a comprar otros productos o servicios relacionados con su primera compra.
TÉCNICAS DESCRIPTIVAS DE MINERÍA DE DATOS
Técnicas de agrupamiento
Una vez que los algoritmos detectan una regularidad en los datos y pueden
asociarlos es más sencillo llevar a cabo un proceso de agrupamiento que
englobe todos los resultados con el mismo comportamiento, valor o relevancia.
Cuando una técnica de agrupamiento es aplicada en los datos, estos se
mantendrán en grupos con similitudes particulares entre ellos, de forma que
sean fáciles de comprender.
TÉCNICAS PREDICTIVAS DE MINERÍA DE DATOS
Técnicas de clasificación
La minería de datos cuenta con una técnica (realmente valiosa para las
empresas) que permite proyectar cómo puede verse en el futuro cierta
información y hacer predicciones comerciales o estratégicas con base en ello.
Esta función recopila diversos atributos en categorías relevantes para tu
empresa. Por ejemplo, te ayuda a categorizar a tus clientes más leales (los que
pueden aumentar su fidelidad y preferencia) y a aquellos que apenas están
conociendo tus productos o servicios.
TÉCNICAS PREDICTIVAS DE MINERÍA DE DATOS
Técnicas de regresión
La regresión sirve para ubicar relaciones y calcular probabilidades con base en
datos.
Esto significa que puede utilizarse para predecir valores numéricos; por ejemplo,
el flujo de clientes potenciales en una plataforma. En un caso así es posible filtrar
de forma eficiente si un internauta es un prospecto comercial (1) o no (0).
Este tipo de técnicas categorizan los valores de acuerdo con variables numéricas
y, por tanto, toman decisiones basadas en códigos binarios.
TÉCNICAS PREDICTIVAS DE MINERÍA DE DATOS
Técnicas de detección de anomalías
La minería de datos también es capaz de detectar valores atípicos a través del
rastreo o clasificación de datos. En algunos casos, los algoritmos pueden
detectar irregularidades y predecir su resultado o las consecuencias, gracias al
aprendizaje obtenido de otros casos similares.
Estas técnicas son probabilísticas y requieren de la interpretación humana para
tomar la decisión final.
TÉCNICAS PRESCRIPTIVAS DE MINERÍA DE DATOS
Técnicas de automatización
Dentro de la minería de datos también existen algoritmos para la toma de
decisión que funcionan de forma prescriptiva. Esto es, que establecen reglas o
comandos dependiendo de los resultados del análisis de la información.
Tal es el caso de los árboles de decisión, que son modelos predictivos y de
aprendizaje automático que generan respuestas a ciertos problemas, cediendo
responsabilidades a las tecnologías.
TÉCNICAS PRESCRIPTIVAS DE MINERÍA DE DATOS
Técnicas de optimización
Las técnicas de optimización generan simulaciones para la toma de decisión
frente al resultado de una analítica de los datos, por lo tanto, obtienen una mejor
respuesta basada en casos anteriores. Sin embargo, la optimización solo se da
como una propuesta de plan de acción.
A través de estas técnicas se puede establecer una mejor alternativa de ventas,
marketing o atención para evitar situaciones similares en el futuro.
DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA
RECOLECCIÓN DE DATOS
La minería de datos y la recolección pueden ser procesos complementarios, si se
realizan correctamente. La minería se dedica al análisis de grandes conjuntos de
datos para derivar tendencias, mientras que la recolección consiste en extraer
datos de diversas fuentes para luego construir el análisis.
DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA
RECOLECCIÓN DE DATOS
La recolección implica rastrear un sitio web para extraer sus datos, que luego se
organizan en información inteligible. Y aunque es posible hacerlo de manera
segura y ética, hay actores malintencionados que utilizan métodos de
recolección para obtener direcciones de correo electrónico, listas de contactos,
fotos, videos, texto o código, sin el consentimiento del usuario.
DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA
RECOLECCIÓN DE DATOS
Un ejemplo conocido de recolección de datos del que quizás hayas escuchado
fue el escándalo de Cambridge Analytica y Facebook. Como informó The New
York Times, la consultora política británica comenzó a recolectar datos de
millones de usuarios de esta red social en 2014 para construir perfiles
psicológicos de votantes e intentar venderlos a campañas políticas.
DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA
RECOLECCIÓN DE DATOS
Aunque este escándalo fue a gran escala y tuvo enormes repercusiones,
cualquier tipo de empresa puede realizar prácticas de recolección de datos poco
éticas, sin importar su tamaño.
Por ejemplo, una pequeña empresa de medios espera crear recomendaciones
de contenido más personalizadas para su audiencia, compuesta principalmente
por mujeres de entre 18 y 24 años; para obtener más datos para construir estas
campañas, esta empresa decide rastrear sitios web similares que a menudo son
visitados por su público objetivo y averiguar qué tipo de contenido consumen
más allí. Sin embargo, estos datos fueron adquiridos sin el conocimiento de los
usuarios, lo que ya constituye una mala práctica.
DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA
RECOLECCIÓN DE DATOS
Otro ejemplo es cuando una empresa busca ampliar el alcance de sus boletines
informativos por correo electrónico, pero aún no tiene una gran cantidad de
suscriptores.
Por lo tanto, decide comprar una lista de contactos de un proveedor externo
para llegar a más personas (la compra y venta de listas de contactos puede estar
prohibida por varias leyes de protección de datos, así como el envío de correos
electrónicos no solicitados especialmente si los usuarios no proporcionaron sus
datos o no dieron su consentimiento).
¿CÓMO EVITAR PROBLEMAS CON LA MINERÍA DE
DATOS?
Los escenarios descritos anteriormente son ejemplos perfectos de lo que no
debes hacer al implementar minería y recolección de datos. Por ejemplo, en el
caso de Facebook-Cambridge Analytica, los datos se extrajeron sin el
consentimiento o conocimiento de los usuarios; Facebook no protegió los datos
de los usuarios frente a actores externos y los datos se utilizaron para fines con
los que ellos no estaban de acuerdo conscientemente.
GARANTIZAR LA PROTECCIÓN DE DATOS Y LA
PRIVACIDAD ES LA CLAVE
Al igual que cualquier proceso que involucra datos confidenciales, tu principal
preocupación debe ser corroborar que todos los datos que estás recopilando y
utilizando se hayan proporcionado con el consentimiento explícito y en pleno
cumplimiento de las leyes de privacidad aplicables. Esto incluye proteger los
datos en todas las etapas del proceso (recopilación, almacenamiento, análisis y
eliminación).
GARANTIZAR LA PROTECCIÓN DE DATOS Y LA
PRIVACIDAD ES LA CLAVE
Las organizaciones deben establecer reglas internas para especificar para qué
se pueden usar los datos y cómo deben analizarse e implementarse, además de
garantizar que la información obtenida de la minería de datos no infrinja las
políticas de privacidad. Como regla general, ser transparente, honesto y ético
con los datos debe ser tu máxima prioridad.
GARANTIZAR LA PROTECCIÓN DE DATOS Y LA
PRIVACIDAD ES LA CLAVE
Algunas empresas pueden contratar personal especializado en ciencia de datos
y seguridad para supervisar todos los procedimientos de análisis y gestión de
datos. Esto puede ser de gran ayuda para garantizar la protección y la privacidad
del usuario durante todo el proceso. También pueden poner en funcionamiento
herramientas especializadas para lograr mejores resultados.
ACTIVIDAD

Más contenido relacionado

Similar a Introducción a la Minería de Datos (1).pdf

Big data,inteligencia artificial, analisis predictivo
Big data,inteligencia artificial, analisis predictivoBig data,inteligencia artificial, analisis predictivo
Big data,inteligencia artificial, analisis predictivoRicardoOrozco44
 
Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Daniela Bedascarrasbure
 
Data set module 2 - spanish
Data set   module 2 - spanishData set   module 2 - spanish
Data set module 2 - spanishData-Set
 
Afc module 2 translated
Afc module 2 translatedAfc module 2 translated
Afc module 2 translatedSoniaNaiba
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negociosjeffersonjsk
 
Entregable final analitica de datos ivonne dorantes apodaca
Entregable final analitica de datos ivonne dorantes apodacaEntregable final analitica de datos ivonne dorantes apodaca
Entregable final analitica de datos ivonne dorantes apodacaivonnedorantesapodac
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocioselsebir
 
Decisiones de negocio en materia de analítica de datos
Decisiones de negocio en materia de analítica de datosDecisiones de negocio en materia de analítica de datos
Decisiones de negocio en materia de analítica de datosheymitzi
 

Similar a Introducción a la Minería de Datos (1).pdf (20)

Big data,inteligencia artificial, analisis predictivo
Big data,inteligencia artificial, analisis predictivoBig data,inteligencia artificial, analisis predictivo
Big data,inteligencia artificial, analisis predictivo
 
Univesidad Latinoamericana De Q.Ppt Merk
Univesidad Latinoamericana De Q.Ppt MerkUnivesidad Latinoamericana De Q.Ppt Merk
Univesidad Latinoamericana De Q.Ppt Merk
 
BETA OBRA CIVIL Y ELECTRICA
BETA OBRA CIVIL Y ELECTRICABETA OBRA CIVIL Y ELECTRICA
BETA OBRA CIVIL Y ELECTRICA
 
Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21Data minning final tp internet inf 13 miercoles de 18 a 21
Data minning final tp internet inf 13 miercoles de 18 a 21
 
Bi resumen
Bi resumenBi resumen
Bi resumen
 
Bi resumen
Bi resumenBi resumen
Bi resumen
 
Data set module 2 - spanish
Data set   module 2 - spanishData set   module 2 - spanish
Data set module 2 - spanish
 
Afc module 2 translated
Afc module 2 translatedAfc module 2 translated
Afc module 2 translated
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de Datos
Minería de DatosMinería de Datos
Minería de Datos
 
Mineria de datos - UAGRM
Mineria de datos - UAGRMMineria de datos - UAGRM
Mineria de datos - UAGRM
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Entregable final analitica de datos ivonne dorantes apodaca
Entregable final analitica de datos ivonne dorantes apodacaEntregable final analitica de datos ivonne dorantes apodaca
Entregable final analitica de datos ivonne dorantes apodaca
 
Digital Intelligence
Digital IntelligenceDigital Intelligence
Digital Intelligence
 
M11 digitalintelligence 2019
M11 digitalintelligence 2019M11 digitalintelligence 2019
M11 digitalintelligence 2019
 
Inv merc s15
Inv merc s15Inv merc s15
Inv merc s15
 
Inteligencia de Negocios
Inteligencia de NegociosInteligencia de Negocios
Inteligencia de Negocios
 
Decisiones de negocio en materia de analítica de datos
Decisiones de negocio en materia de analítica de datosDecisiones de negocio en materia de analítica de datos
Decisiones de negocio en materia de analítica de datos
 
Bussiness intelligent
Bussiness intelligentBussiness intelligent
Bussiness intelligent
 

Más de kevin manuel ortiz galeano

Más de kevin manuel ortiz galeano (6)

SS y mision libro.pdf
SS y mision libro.pdfSS y mision libro.pdf
SS y mision libro.pdf
 
Ingeniería de Software un enfoque práctico.PDF
Ingeniería de Software un enfoque práctico.PDFIngeniería de Software un enfoque práctico.PDF
Ingeniería de Software un enfoque práctico.PDF
 
Exposición software.pptx
Exposición software.pptxExposición software.pptx
Exposición software.pptx
 
Ingeniería de Software un enfoque práctico.PDF
Ingeniería de Software un enfoque práctico.PDFIngeniería de Software un enfoque práctico.PDF
Ingeniería de Software un enfoque práctico.PDF
 
Exposición software.pptx
Exposición software.pptxExposición software.pptx
Exposición software.pptx
 
Metaverso
MetaversoMetaverso
Metaverso
 

Último

CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdfCAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdfReneBellido1
 
estadisticasII Metodo-de-la-gran-M.pdf
estadisticasII   Metodo-de-la-gran-M.pdfestadisticasII   Metodo-de-la-gran-M.pdf
estadisticasII Metodo-de-la-gran-M.pdfFlorenciopeaortiz
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Francisco Javier Mora Serrano
 
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfLEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfAdelaHerrera9
 
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptxGARCIARAMIREZCESAR
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAJAMESDIAZ55
 
Edificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCEdificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCANDECE
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxLuisvila35
 
Conservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de AlmeríaConservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de AlmeríaANDECE
 
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdfManual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdfSandXmovex
 
Proyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctricaProyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctricaXjoseantonio01jossed
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciazacariasd49
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdfAnthonyTiclia
 
Fijaciones de balcones prefabricados de hormigón - RECENSE
Fijaciones de balcones prefabricados de hormigón - RECENSEFijaciones de balcones prefabricados de hormigón - RECENSE
Fijaciones de balcones prefabricados de hormigón - RECENSEANDECE
 
produccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptxproduccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptxEtse9
 
Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para PlataformasSegundo Silva Maguiña
 
Electromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdfElectromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdfAnonymous0pBRsQXfnx
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdfEdwinAlexanderSnchez2
 
CLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilCLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilDissneredwinPaivahua
 
CLASE 2 MUROS CARAVISTA EN CONCRETO Y UNIDAD DE ALBAÑILERIA
CLASE 2 MUROS CARAVISTA EN CONCRETO  Y UNIDAD DE ALBAÑILERIACLASE 2 MUROS CARAVISTA EN CONCRETO  Y UNIDAD DE ALBAÑILERIA
CLASE 2 MUROS CARAVISTA EN CONCRETO Y UNIDAD DE ALBAÑILERIAMayraOchoa35
 

Último (20)

CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdfCAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
CAP4-TEORIA EVALUACION DE CAUDALES - HIDROGRAMAS.pdf
 
estadisticasII Metodo-de-la-gran-M.pdf
estadisticasII   Metodo-de-la-gran-M.pdfestadisticasII   Metodo-de-la-gran-M.pdf
estadisticasII Metodo-de-la-gran-M.pdf
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
 
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdfLEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
LEYES DE EXPONENTES SEMANA 1 CESAR VALLEJO.pdf
 
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
 
Edificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRCEdificio residencial Becrux en Madrid. Fachada de GRC
Edificio residencial Becrux en Madrid. Fachada de GRC
 
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptxAMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
AMBIENTES SEDIMENTARIOS GEOLOGIA TIPOS .pptx
 
Conservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de AlmeríaConservatorio de danza Kina Jiménez de Almería
Conservatorio de danza Kina Jiménez de Almería
 
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdfManual de Usuario Estacion total Sokkia SERIE SET10K.pdf
Manual de Usuario Estacion total Sokkia SERIE SET10K.pdf
 
Proyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctricaProyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctrica
 
PRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potenciaPRESENTACION DE CLASE. Factor de potencia
PRESENTACION DE CLASE. Factor de potencia
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
 
Fijaciones de balcones prefabricados de hormigón - RECENSE
Fijaciones de balcones prefabricados de hormigón - RECENSEFijaciones de balcones prefabricados de hormigón - RECENSE
Fijaciones de balcones prefabricados de hormigón - RECENSE
 
produccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptxproduccion de cerdos. 2024 abril 20..pptx
produccion de cerdos. 2024 abril 20..pptx
 
Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para Plataformas
 
Electromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdfElectromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdf
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf
 
CLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilCLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civil
 
CLASE 2 MUROS CARAVISTA EN CONCRETO Y UNIDAD DE ALBAÑILERIA
CLASE 2 MUROS CARAVISTA EN CONCRETO  Y UNIDAD DE ALBAÑILERIACLASE 2 MUROS CARAVISTA EN CONCRETO  Y UNIDAD DE ALBAÑILERIA
CLASE 2 MUROS CARAVISTA EN CONCRETO Y UNIDAD DE ALBAÑILERIA
 

Introducción a la Minería de Datos (1).pdf

  • 1. INTRODUCCIÓN A LA MINERÍA DE DATOS German Ricardo Bermúdez Navarro 2023/08/09
  • 2. DEFINICIÓN La minería de datos (o data mining) es el proceso de analizar grandes cantidades de datos para encontrar tendencias y patrones. Permite convertir datos sin procesar y estructurarlos en información comprensible sobre diversas áreas de negocios y del mercado.
  • 3. DEFINICIÓN Este análisis brinda información importante que ayudara a las empresas a resolver problemas (e identificarlos antes de que vuelvan a ocurrir). También sirve para reducir riesgos y costes, detectar oportunidades de mercado, mejorar la experiencia del cliente y predecir sus comportamientos y preferencias.
  • 4. BIG DATA Y MINERÍA DE DATOS La minería de datos mantiene una relación íntima con el big data. Cada minuto de cada día se generan más de 5,7 millones de búsquedas en Google, 6 millones de personas realizan compras en línea y se publican 575.000 tweets. Estos inmensos volúmenes de información digital son los que conocemos como big data: datos en bruto recopilados por medio de las tecnologías computacionales.
  • 5. BIG DATA Y MINERÍA DE DATOS Para gestionar tanta información es necesario establecer objetivos específicos y contar con herramientas diseñadas para encontrar los datos útiles. Por ejemplo, tu objetivo podría ser realizar un estudio estadístico de las poblaciones que consumen un producto y generar un perfil de cliente basado en las cookies e historial de navegación. La minería de datos puede hacerlo posible.
  • 6. BIG DATA Y MINERÍA DE DATOS Al aplicar algoritmos para analizar la información podemos aprovechar realmente los macrodatos del big data. Estos algoritmos complejos suelen procesar más información en menos tiempo. En resumen, el big data ofrece la materia prima para el análisis de información; mientras que la minería de datos es la herramienta para rastrear, ubicar, extraer y visualizar la información que nos interesa; y con ello diseñar las estrategias comerciales pertinentes.
  • 7. BENEFICIOS La minería de datos aporta una ventaja significativa al proporcionar inteligencia e información más relevante y oportuna (a la cual la empresa no tendría acceso de otra manera). Algunos beneficios de la minería de datos incluyen:
  • 8. BENEFICIOS Encontrar fácilmente los datos esenciales. El big data contiene información realmente útil, pero también hay muchos datos que no necesitas. La minería de datos permite diferenciar automáticamente la información valiosa e interpretarla en informes procesables.
  • 9. BENEFICIOS Comprender mejor a los clientes y su recorrido. Con la minería de datos puedes recopilar datos de clientes de múltiples fuentes para formar perfiles informativos muy completos. Esto te brinda un conocimiento valioso sobre las tendencias, preferencias, comportamientos, similitudes y diferencias de los consumidores.
  • 10. BENEFICIOS Tomar decisiones más rápidas y automatizadas. En lugar de que una persona revise todos los datos y elija las acciones a emprender, puedes automatizar ciertas decisiones. Por ejemplo, los bancos pueden usar software para identificar tendencias que revelan comportamientos fraudulentos y bloquear automáticamente cuentas en segundos, notificar a una persona responsable o solicitar verificación adicional de los usuarios.
  • 11. BENEFICIOS Desarrollar campañas de marketing más efectivas y personalizadas. Con el conocimiento que obtienes de la minería de datos, los equipos de marketing pueden crear campañas mucho más personalizadas, adaptar el contenido y las recomendaciones de productos en función de preferencias y comportamientos conocidos, predecir tendencias de cómo los consumidores compran o navegan en tu sitio web, descubrir qué les impide comprar o qué los lleva a abandonar su carrito, crear segmentos de marketing precisos y ofrecer promociones personalizadas, entre otras cosas.
  • 12. TÉCNICAS DE LA MINERÍA DE DATOS Las técnicas de minería de datos dependerán en su mayoría de las necesidades de cada empresa. Sin embargo, podemos categorizarlas en tres grandes grupos: • Descriptivas • Predictivas • Prescriptivas.
  • 13. TÉCNICAS DESCRIPTIVAS DE MINERÍA DE DATOS Técnicas de asociación Como ya lo explicamos, la minería de datos detecta patrones a través del reconocimiento de conjuntos de datos en intervalos regulares. Con estas funciones podrías saber cuáles son los productos o servicios que más se compran en determinada época del año, por ejemplo en Navidad. Esta tarea tiene por objeto buscar nuevos eventos o atributos relevantes comparados con los ya existentes dentro de tu negocio. Por ejemplo, cuando un cliente adquiere un artículo específico, es común notar que los usuarios tienden a comprar otros productos o servicios relacionados con su primera compra.
  • 14. TÉCNICAS DESCRIPTIVAS DE MINERÍA DE DATOS Técnicas de agrupamiento Una vez que los algoritmos detectan una regularidad en los datos y pueden asociarlos es más sencillo llevar a cabo un proceso de agrupamiento que englobe todos los resultados con el mismo comportamiento, valor o relevancia. Cuando una técnica de agrupamiento es aplicada en los datos, estos se mantendrán en grupos con similitudes particulares entre ellos, de forma que sean fáciles de comprender.
  • 15. TÉCNICAS PREDICTIVAS DE MINERÍA DE DATOS Técnicas de clasificación La minería de datos cuenta con una técnica (realmente valiosa para las empresas) que permite proyectar cómo puede verse en el futuro cierta información y hacer predicciones comerciales o estratégicas con base en ello. Esta función recopila diversos atributos en categorías relevantes para tu empresa. Por ejemplo, te ayuda a categorizar a tus clientes más leales (los que pueden aumentar su fidelidad y preferencia) y a aquellos que apenas están conociendo tus productos o servicios.
  • 16. TÉCNICAS PREDICTIVAS DE MINERÍA DE DATOS Técnicas de regresión La regresión sirve para ubicar relaciones y calcular probabilidades con base en datos. Esto significa que puede utilizarse para predecir valores numéricos; por ejemplo, el flujo de clientes potenciales en una plataforma. En un caso así es posible filtrar de forma eficiente si un internauta es un prospecto comercial (1) o no (0). Este tipo de técnicas categorizan los valores de acuerdo con variables numéricas y, por tanto, toman decisiones basadas en códigos binarios.
  • 17. TÉCNICAS PREDICTIVAS DE MINERÍA DE DATOS Técnicas de detección de anomalías La minería de datos también es capaz de detectar valores atípicos a través del rastreo o clasificación de datos. En algunos casos, los algoritmos pueden detectar irregularidades y predecir su resultado o las consecuencias, gracias al aprendizaje obtenido de otros casos similares. Estas técnicas son probabilísticas y requieren de la interpretación humana para tomar la decisión final.
  • 18. TÉCNICAS PRESCRIPTIVAS DE MINERÍA DE DATOS Técnicas de automatización Dentro de la minería de datos también existen algoritmos para la toma de decisión que funcionan de forma prescriptiva. Esto es, que establecen reglas o comandos dependiendo de los resultados del análisis de la información. Tal es el caso de los árboles de decisión, que son modelos predictivos y de aprendizaje automático que generan respuestas a ciertos problemas, cediendo responsabilidades a las tecnologías.
  • 19. TÉCNICAS PRESCRIPTIVAS DE MINERÍA DE DATOS Técnicas de optimización Las técnicas de optimización generan simulaciones para la toma de decisión frente al resultado de una analítica de los datos, por lo tanto, obtienen una mejor respuesta basada en casos anteriores. Sin embargo, la optimización solo se da como una propuesta de plan de acción. A través de estas técnicas se puede establecer una mejor alternativa de ventas, marketing o atención para evitar situaciones similares en el futuro.
  • 20. DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA RECOLECCIÓN DE DATOS La minería de datos y la recolección pueden ser procesos complementarios, si se realizan correctamente. La minería se dedica al análisis de grandes conjuntos de datos para derivar tendencias, mientras que la recolección consiste en extraer datos de diversas fuentes para luego construir el análisis.
  • 21. DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA RECOLECCIÓN DE DATOS La recolección implica rastrear un sitio web para extraer sus datos, que luego se organizan en información inteligible. Y aunque es posible hacerlo de manera segura y ética, hay actores malintencionados que utilizan métodos de recolección para obtener direcciones de correo electrónico, listas de contactos, fotos, videos, texto o código, sin el consentimiento del usuario.
  • 22. DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA RECOLECCIÓN DE DATOS Un ejemplo conocido de recolección de datos del que quizás hayas escuchado fue el escándalo de Cambridge Analytica y Facebook. Como informó The New York Times, la consultora política británica comenzó a recolectar datos de millones de usuarios de esta red social en 2014 para construir perfiles psicológicos de votantes e intentar venderlos a campañas políticas.
  • 23. DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA RECOLECCIÓN DE DATOS Aunque este escándalo fue a gran escala y tuvo enormes repercusiones, cualquier tipo de empresa puede realizar prácticas de recolección de datos poco éticas, sin importar su tamaño. Por ejemplo, una pequeña empresa de medios espera crear recomendaciones de contenido más personalizadas para su audiencia, compuesta principalmente por mujeres de entre 18 y 24 años; para obtener más datos para construir estas campañas, esta empresa decide rastrear sitios web similares que a menudo son visitados por su público objetivo y averiguar qué tipo de contenido consumen más allí. Sin embargo, estos datos fueron adquiridos sin el conocimiento de los usuarios, lo que ya constituye una mala práctica.
  • 24. DIFERENCIAS ENTRE LA MINERÍA DE DATOS Y LA RECOLECCIÓN DE DATOS Otro ejemplo es cuando una empresa busca ampliar el alcance de sus boletines informativos por correo electrónico, pero aún no tiene una gran cantidad de suscriptores. Por lo tanto, decide comprar una lista de contactos de un proveedor externo para llegar a más personas (la compra y venta de listas de contactos puede estar prohibida por varias leyes de protección de datos, así como el envío de correos electrónicos no solicitados especialmente si los usuarios no proporcionaron sus datos o no dieron su consentimiento).
  • 25. ¿CÓMO EVITAR PROBLEMAS CON LA MINERÍA DE DATOS? Los escenarios descritos anteriormente son ejemplos perfectos de lo que no debes hacer al implementar minería y recolección de datos. Por ejemplo, en el caso de Facebook-Cambridge Analytica, los datos se extrajeron sin el consentimiento o conocimiento de los usuarios; Facebook no protegió los datos de los usuarios frente a actores externos y los datos se utilizaron para fines con los que ellos no estaban de acuerdo conscientemente.
  • 26. GARANTIZAR LA PROTECCIÓN DE DATOS Y LA PRIVACIDAD ES LA CLAVE Al igual que cualquier proceso que involucra datos confidenciales, tu principal preocupación debe ser corroborar que todos los datos que estás recopilando y utilizando se hayan proporcionado con el consentimiento explícito y en pleno cumplimiento de las leyes de privacidad aplicables. Esto incluye proteger los datos en todas las etapas del proceso (recopilación, almacenamiento, análisis y eliminación).
  • 27. GARANTIZAR LA PROTECCIÓN DE DATOS Y LA PRIVACIDAD ES LA CLAVE Las organizaciones deben establecer reglas internas para especificar para qué se pueden usar los datos y cómo deben analizarse e implementarse, además de garantizar que la información obtenida de la minería de datos no infrinja las políticas de privacidad. Como regla general, ser transparente, honesto y ético con los datos debe ser tu máxima prioridad.
  • 28. GARANTIZAR LA PROTECCIÓN DE DATOS Y LA PRIVACIDAD ES LA CLAVE Algunas empresas pueden contratar personal especializado en ciencia de datos y seguridad para supervisar todos los procedimientos de análisis y gestión de datos. Esto puede ser de gran ayuda para garantizar la protección y la privacidad del usuario durante todo el proceso. También pueden poner en funcionamiento herramientas especializadas para lograr mejores resultados.