2. QUE ES?
• La minería de datos, o "data mining", es el proceso de descubrir patrones y
conocimiento en grandes volúmenes de datos usando técnicas de estadísticas,
inteligencia artificial y aprendizaje automático. Su objetivo es identificar tendencias,
patrones y relaciones en un conjunto de datos. Se aplica en áreas como marketing,
finanzas, medicina y venta al por menor, y puede ser utilizada para predecir
comportamientos, optimizar procesos y detectar fraudes, entre otros. Es esencial
preparar y limpiar los datos adecuadamente para obtener resultados confiables. La
minería de datos ofrece valiosa información cuando se combina con el conocimiento
experto del área en cuestión.
3. ORIGEN
• Origen:
• Estadísticas: La estadística, como campo disciplinario, ha existido durante siglos. Las
técnicas estadísticas tradicionales han sido la base para la identificación de tendencias
y patrones en conjuntos de datos.
• Inteligencia Artificial (IA): Durante la segunda mitad del siglo XX, el desarrollo y la
investigación en IA llevó a la creación de algoritmos y modelos capaces de aprender
de datos, dando lugar a lo que conocemos como aprendizaje automático.
• Gestión de Bases de Datos: Las bases de datos han sido esenciales para almacenar
grandes cantidades de información. Con el desarrollo de los sistemas de bases de
datos y el auge de la tecnología de la información, surgieron desafíos y oportunidades
relacionados con el análisis de grandes volúmenes de datos.
5. M O T I V A C I Ó N :
E X P L O S I Ó N D E D A T O S : C O N L A R E V O L U C I Ó N D I G I T A L Y E L A U G E D E L A
I N T E R N E T , L A C A N T I D A D D E D A T O S G E N E R A D O S Y A L M A C E N A D O S H A
C R E C I D O E X P O N E N C I A L M E N T E . L A S O R G A N I Z A C I O N E S S E D I E R O N C U E N T A
D E L P O T E N C I A L O C U L T O E N E S T O S D A T O S P A R A O B T E N E R V E N T A J A S
C O M P E T I T I V A S .
T O M A D E D E C I S I O N E S B A S A D A E N D A T O S : E N L U G A R D E D E P E N D E R
Ú N I C A M E N T E D E L A I N T U I C I Ó N O E L J U I C I O H U M A N O , L A S E M P R E S A S
C O M E N Z A R O N A R E C O N O C E R L A I M P O R T A N C I A D E T O M A R D E C I S I O N E S
B A S A D A S E N E L A N Á L I S I S D E D A T O S .
A V A N C E S T E C N O L Ó G I C O S : M E J O R A S E N L A C A P A C I D A D D E C O M P U T A C I Ó N Y
A L M A C E N A M I E N T O H A N P E R M I T I D O A L A S O R G A N I Z A C I O N E S P R O C E S A R Y
A N A L I Z A R G R A N D E S C O N J U N T O S D E D A T O S D E M A N E R A E F I C I E N T E .
C O M P E T E N C I A E N E L M E R C A D O : E N M E R C A D O S A L T A M E N T E C O M P E T I T I V O S ,
L A C A P A C I D A D D E P R E D E C I R T E N D E N C I A S , E N T E N D E R A L O S C L I E N T E S Y
O P T I M I Z A R O P E R A C I O N E S P U E D E S E R L A D I F E R E N C I A E N T R E E L É X I T O Y E L
F R A C A S O .
I D E N T I F I C A C I Ó N D E P A T R O N E S O C U L T O S : M Á S A L L Á D E L A S E S T A D Í S T I C A S
B Á S I C A S , E X I S T E U N A R I Q U E Z A D E P A T R O N E S Y R E L A C I O N E S E N L O S D A T O S
Q U E , S I S E D E S C U B R E N , P U E D E N O F R E C E R I N S I G H T S V A L I O S O S .
D E S A F Í O S E N D I V E R S O S C A M P O S : S E C T O R E S C O M O L A M E D I C I N A , L A
B I O T E C N O L O G Í A , L A S F I N A N Z A S Y E L M A R K E T I N G N E C E S I T A B A N
H E R R A M I E N T A S M Á S S O F I S T I C A D A S P A R A A N A L I Z A R D A T O S C O M P L E J O S Y
E X T R A E R C O N O C I M I E N T O D E E L L O S .
6. EL PROCESO DE DESCUBRIMIENTO DE
CONOCIMIENTO EN BASES DE DATOS
• El proceso de descubrimiento de conocimiento en bases de datos (KDD) es una secuencia de pasos
para extraer patrones útiles de grandes conjuntos de datos. Las etapas son:
• 1. **Selección de Datos**: Elegir el conjunto de datos adecuado para el análisis.
• 2. **Preprocesamiento**: Incluye limpieza, integración, transformación y reducción de datos.
• 3. **Minería de Datos**: Aplicación de algoritmos para descubrir patrones.
• 4. **Evaluación de Patrones**: Verificar la relevancia y utilidad de los patrones encontrados.
• 5. **Presentación**: Visualizar y comunicar los patrones descubiertos de manera comprensible.
• 6. **Implementación (opcional)**: Usar los patrones en sistemas operativos para decisiones o
automatizaciones.
• Este proceso es iterativo y combina tecnología, conocimiento del dominio y calidad de datos para
lograr resultados efectivos.
7. TIPOS DE DATOS:
• Los tipos de datos en la minería de datos se refieren a la naturaleza o estructura de los
datos a analizar. Los principales tipos son:
• 1. **Numéricos**: Datos cuantitativos, como edad o salario.
• 2. **Categóricos**: Etiquetas sin orden, como género o tipo de producto.
• 3. **Ordinales**: Categorías con orden, como calificaciones o niveles de satisfacción.
• 4. **Binarios**: Dos categorías, como sí/no o verdadero/falso.
• 5. **Texto**: Documentos, correos, publicaciones en redes.
• 6. **Temporales**: Datos con marca de tiempo, como series temporales.
• 7. **Espaciales**: Relacionados con ubicaciones, como coordenadas geográficas.
• 8. **De Secuencia**: Datos ordenados, como secuencias de ADN o historiales de
navegación.
• 9. **De Relación**: Enlaces entre entidades, comunes en redes sociales.
• 10. **De Transacción**: Interacciones específicas, como compras de productos.
• Una fuente de datos puede contener varios tipos y el manejo adecuado de estos es esencial
para un análisis efectivo en la minería de datos.
8. U T I L I D A D D E M I N E R I A M D E D A T O S
D E S C U B R I M I E N T O D E P A T R O N E S : P E R M I T E I D E N T I F I C A R
P A T R O N E S R E C U R R E N T E S O R E L A C I O N E S O C U L T A S E N U N
C O N J U N T O D E D A T O S .
C L A S I F I C A C I Ó N : D E S P U É S D E U N M O D E L O S E H A C O N S T R U I D O
C O N B A S E E N D A T O S P R E V I A M E N T E C L A S I F I C A D O S , S E P U E D E N
C L A S I F I C A R N U E V O S D A T O S .
S E G M E N T A C I Ó N : A Y U D A A S E G M E N T A R U N C O N J U N T O D E D A T O S
E N S U B C O N J U N T O S C O N C A R A C T E R Í S T I C A S S I M I L A R E S .
P R E D I C C I Ó N : U T I L I Z A P A T R O N E S E X I S T E N T E S P A R A P R E D E C I R
F U T U R O S V A L O R E S O T E N D E N C I A S .
A S O C I A C I Ó N : I D E N T I F I C A E L E M E N T O S Q U E S U E L E N A P A R E C E R
J U N T O S E N U N D E T E R M I N A D O C O N T E X T O , C O M O E N E L A N Á L I S I S
D E C E S T A S D E L A C O M P R A E N S U P E R M E R C A D O S .
D E T E C C I Ó N D E A N O M A L Í A S : I D E N T I F I C A D A T O S Q U E N O S E
A J U S T A N A U N P A T R Ó N E S P E R A D O , Ú T I L P A R A D E T E C T A R
F R A U D E S O A C T I V I D A D E S S O S P E C H O S A S .
9. RELACION CON OTRAS AREAS
• Relación con otras áreas:
1.Estadística: La minería de datos utiliza muchos métodos estadísticos en sus procesos,
desde regresiones hasta pruebas de hipótesis.
2.Inteligencia artificial (IA): Algoritmos de aprendizaje automático, una rama de la IA, son
esenciales para la minería de datos, especialmente en tareas como clasificación y
predicción.
3.Bases de datos: Dado que los datos son el recurso principal, el diseño y gestión de bases
de datos es crucial. Además, algunas técnicas, como las consultas SQL, son comunes en
ambos campos.
4.Sistemas de información geográfica: Para datos geolocalizados, es crucial la
combinación de minería de datos con herramientas de análisis espacial.
5.Visualización de datos: Después de procesar y analizar datos, es esencial poder
representar los resultados de manera gráfica para facilitar la interpretación.
6.Big data: Con el aumento de la cantidad de datos generados, la minería de datos se ha
convertido en una herramienta esencial para procesar y extraer valor de grandes
conjuntos de datos.
7.Bioinformática: La minería de datos se utiliza para analizar secuencias genéticas,
identificar genes, predecir enfermedades, entre otros.
8.Negocios (Business Intelligence): La minería de datos es una herramienta clave en el
11. • Tendencias en minería de datos:
• Aprendizaje profundo: Las redes
neuronales profundas están ganando
popularidad por su capacidad para
manejar datos complejos, especialmente
en imágenes y texto.
• Minería de datos en tiempo real: Con la
necesidad de respuestas instantáneas, la
minería en tiempo real está en aumento.
• Federated Learning: Permite entrenar
algoritmos de manera descentralizada,
protegiendo la privacidad del usuario.
• AutoML: Plataformas que automatizan el
proceso de seleccionar y entrenar el
mejor modelo para un conjunto de datos
específico.
• Ética y transparencia: Con un enfoque
creciente en la privacidad y el sesgo, se
está poniendo más énfasis en la creación
de modelos éticos y transparentes.
• Repercusión en la sociedad:
• Decisiones más informadas: Permite a las
empresas y gobiernos tomar decisiones
basadas en datos.
• Personalización: Las recomendaciones y
anuncios personalizados mejoran la
experiencia del usuario.
• Mejora en la atención médica: La
identificación temprana y tratamientos
personalizados pueden salvar vidas.
12. A P L I C A C I O N E S D E L A M I N E R Í A D E D AT O S :
1 . C O M E R C I O : PA R A A N Á L I S I S D E C E S TA S D E L A
C O M P R A , R E C O M E N D A C I Ó N D E P R O D U C T O S Y
S E G M E N TA C I Ó N D E C L I E N T E S .
2 . B A N C A Y F I N A N Z A S : PA R A D E T E C TA R F R A U D E S
E N TA R J E TA S D E C R É D I T O , E VA L U A R R I E S G O S
C R E D I T I C I O S Y O P T I M I Z A R I N V E R S I O N E S .
3 . S A L U D : E N E L D I A G N Ó S T I C O D E
E N F E R M E D A D E S , P R E D I C C I Ó N D E E P I D E M I A S Y
A N Á L I S I S D E E F E C T I V I D A D D E T R ATA M I E N T O S .
4 . T E L E C O M U N I C A C I O N E S : PA R A P R E V E R L A
R O TA C I Ó N D E C L I E N T E S , O P T I M I Z A R R E D E S Y
S E G M E N TA R U S U A R I O S .
5 . P R O D U C C I Ó N : E N E L C O N T R O L D E C A L I D A D ,
P L A N I F I C A C I Ó N D E I N V E N TA R I O Y O P T I M I Z A C I Ó N
D E L A C A D E N A D E S U M I N I S T R O .
6 . R E D E S S O C I A L E S : PA R A A N Á L I S I S D E
S E N T I M I E N T O S , R E C O M E N D A C I Ó N D E C O N T E N I D O S
Y D E T E C C I Ó N D E C O M U N I D A D E S .
7 . G O B I E R N O : E N L A D E T E C C I Ó N D E F R A U D E S
F I S C A L E S , P L A N I F I C A C I Ó N U R B A N A Y A N Á L I S I S D E
P O L Í T I C A S P Ú B L I C A S .