SlideShare una empresa de Scribd logo
1 de 12
MINERIA DE
DATOS
QUE ES?
• La minería de datos, o "data mining", es el proceso de descubrir patrones y
conocimiento en grandes volúmenes de datos usando técnicas de estadísticas,
inteligencia artificial y aprendizaje automático. Su objetivo es identificar tendencias,
patrones y relaciones en un conjunto de datos. Se aplica en áreas como marketing,
finanzas, medicina y venta al por menor, y puede ser utilizada para predecir
comportamientos, optimizar procesos y detectar fraudes, entre otros. Es esencial
preparar y limpiar los datos adecuadamente para obtener resultados confiables. La
minería de datos ofrece valiosa información cuando se combina con el conocimiento
experto del área en cuestión.
ORIGEN
• Origen:
• Estadísticas: La estadística, como campo disciplinario, ha existido durante siglos. Las
técnicas estadísticas tradicionales han sido la base para la identificación de tendencias
y patrones en conjuntos de datos.
• Inteligencia Artificial (IA): Durante la segunda mitad del siglo XX, el desarrollo y la
investigación en IA llevó a la creación de algoritmos y modelos capaces de aprender
de datos, dando lugar a lo que conocemos como aprendizaje automático.
• Gestión de Bases de Datos: Las bases de datos han sido esenciales para almacenar
grandes cantidades de información. Con el desarrollo de los sistemas de bases de
datos y el auge de la tecnología de la información, surgieron desafíos y oportunidades
relacionados con el análisis de grandes volúmenes de datos.
MOTIVACION
M O T I V A C I Ó N :
E X P L O S I Ó N D E D A T O S : C O N L A R E V O L U C I Ó N D I G I T A L Y E L A U G E D E L A
I N T E R N E T , L A C A N T I D A D D E D A T O S G E N E R A D O S Y A L M A C E N A D O S H A
C R E C I D O E X P O N E N C I A L M E N T E . L A S O R G A N I Z A C I O N E S S E D I E R O N C U E N T A
D E L P O T E N C I A L O C U L T O E N E S T O S D A T O S P A R A O B T E N E R V E N T A J A S
C O M P E T I T I V A S .
T O M A D E D E C I S I O N E S B A S A D A E N D A T O S : E N L U G A R D E D E P E N D E R
Ú N I C A M E N T E D E L A I N T U I C I Ó N O E L J U I C I O H U M A N O , L A S E M P R E S A S
C O M E N Z A R O N A R E C O N O C E R L A I M P O R T A N C I A D E T O M A R D E C I S I O N E S
B A S A D A S E N E L A N Á L I S I S D E D A T O S .
A V A N C E S T E C N O L Ó G I C O S : M E J O R A S E N L A C A P A C I D A D D E C O M P U T A C I Ó N Y
A L M A C E N A M I E N T O H A N P E R M I T I D O A L A S O R G A N I Z A C I O N E S P R O C E S A R Y
A N A L I Z A R G R A N D E S C O N J U N T O S D E D A T O S D E M A N E R A E F I C I E N T E .
C O M P E T E N C I A E N E L M E R C A D O : E N M E R C A D O S A L T A M E N T E C O M P E T I T I V O S ,
L A C A P A C I D A D D E P R E D E C I R T E N D E N C I A S , E N T E N D E R A L O S C L I E N T E S Y
O P T I M I Z A R O P E R A C I O N E S P U E D E S E R L A D I F E R E N C I A E N T R E E L É X I T O Y E L
F R A C A S O .
I D E N T I F I C A C I Ó N D E P A T R O N E S O C U L T O S : M Á S A L L Á D E L A S E S T A D Í S T I C A S
B Á S I C A S , E X I S T E U N A R I Q U E Z A D E P A T R O N E S Y R E L A C I O N E S E N L O S D A T O S
Q U E , S I S E D E S C U B R E N , P U E D E N O F R E C E R I N S I G H T S V A L I O S O S .
D E S A F Í O S E N D I V E R S O S C A M P O S : S E C T O R E S C O M O L A M E D I C I N A , L A
B I O T E C N O L O G Í A , L A S F I N A N Z A S Y E L M A R K E T I N G N E C E S I T A B A N
H E R R A M I E N T A S M Á S S O F I S T I C A D A S P A R A A N A L I Z A R D A T O S C O M P L E J O S Y
E X T R A E R C O N O C I M I E N T O D E E L L O S .
EL PROCESO DE DESCUBRIMIENTO DE
CONOCIMIENTO EN BASES DE DATOS
• El proceso de descubrimiento de conocimiento en bases de datos (KDD) es una secuencia de pasos
para extraer patrones útiles de grandes conjuntos de datos. Las etapas son:
• 1. **Selección de Datos**: Elegir el conjunto de datos adecuado para el análisis.
• 2. **Preprocesamiento**: Incluye limpieza, integración, transformación y reducción de datos.
• 3. **Minería de Datos**: Aplicación de algoritmos para descubrir patrones.
• 4. **Evaluación de Patrones**: Verificar la relevancia y utilidad de los patrones encontrados.
• 5. **Presentación**: Visualizar y comunicar los patrones descubiertos de manera comprensible.
• 6. **Implementación (opcional)**: Usar los patrones en sistemas operativos para decisiones o
automatizaciones.
• Este proceso es iterativo y combina tecnología, conocimiento del dominio y calidad de datos para
lograr resultados efectivos.
TIPOS DE DATOS:
• Los tipos de datos en la minería de datos se refieren a la naturaleza o estructura de los
datos a analizar. Los principales tipos son:
• 1. **Numéricos**: Datos cuantitativos, como edad o salario.
• 2. **Categóricos**: Etiquetas sin orden, como género o tipo de producto.
• 3. **Ordinales**: Categorías con orden, como calificaciones o niveles de satisfacción.
• 4. **Binarios**: Dos categorías, como sí/no o verdadero/falso.
• 5. **Texto**: Documentos, correos, publicaciones en redes.
• 6. **Temporales**: Datos con marca de tiempo, como series temporales.
• 7. **Espaciales**: Relacionados con ubicaciones, como coordenadas geográficas.
• 8. **De Secuencia**: Datos ordenados, como secuencias de ADN o historiales de
navegación.
• 9. **De Relación**: Enlaces entre entidades, comunes en redes sociales.
• 10. **De Transacción**: Interacciones específicas, como compras de productos.
• Una fuente de datos puede contener varios tipos y el manejo adecuado de estos es esencial
para un análisis efectivo en la minería de datos.
U T I L I D A D D E M I N E R I A M D E D A T O S
D E S C U B R I M I E N T O D E P A T R O N E S : P E R M I T E I D E N T I F I C A R
P A T R O N E S R E C U R R E N T E S O R E L A C I O N E S O C U L T A S E N U N
C O N J U N T O D E D A T O S .
C L A S I F I C A C I Ó N : D E S P U É S D E U N M O D E L O S E H A C O N S T R U I D O
C O N B A S E E N D A T O S P R E V I A M E N T E C L A S I F I C A D O S , S E P U E D E N
C L A S I F I C A R N U E V O S D A T O S .
S E G M E N T A C I Ó N : A Y U D A A S E G M E N T A R U N C O N J U N T O D E D A T O S
E N S U B C O N J U N T O S C O N C A R A C T E R Í S T I C A S S I M I L A R E S .
P R E D I C C I Ó N : U T I L I Z A P A T R O N E S E X I S T E N T E S P A R A P R E D E C I R
F U T U R O S V A L O R E S O T E N D E N C I A S .
A S O C I A C I Ó N : I D E N T I F I C A E L E M E N T O S Q U E S U E L E N A P A R E C E R
J U N T O S E N U N D E T E R M I N A D O C O N T E X T O , C O M O E N E L A N Á L I S I S
D E C E S T A S D E L A C O M P R A E N S U P E R M E R C A D O S .
D E T E C C I Ó N D E A N O M A L Í A S : I D E N T I F I C A D A T O S Q U E N O S E
A J U S T A N A U N P A T R Ó N E S P E R A D O , Ú T I L P A R A D E T E C T A R
F R A U D E S O A C T I V I D A D E S S O S P E C H O S A S .
RELACION CON OTRAS AREAS
• Relación con otras áreas:
1.Estadística: La minería de datos utiliza muchos métodos estadísticos en sus procesos,
desde regresiones hasta pruebas de hipótesis.
2.Inteligencia artificial (IA): Algoritmos de aprendizaje automático, una rama de la IA, son
esenciales para la minería de datos, especialmente en tareas como clasificación y
predicción.
3.Bases de datos: Dado que los datos son el recurso principal, el diseño y gestión de bases
de datos es crucial. Además, algunas técnicas, como las consultas SQL, son comunes en
ambos campos.
4.Sistemas de información geográfica: Para datos geolocalizados, es crucial la
combinación de minería de datos con herramientas de análisis espacial.
5.Visualización de datos: Después de procesar y analizar datos, es esencial poder
representar los resultados de manera gráfica para facilitar la interpretación.
6.Big data: Con el aumento de la cantidad de datos generados, la minería de datos se ha
convertido en una herramienta esencial para procesar y extraer valor de grandes
conjuntos de datos.
7.Bioinformática: La minería de datos se utiliza para analizar secuencias genéticas,
identificar genes, predecir enfermedades, entre otros.
8.Negocios (Business Intelligence): La minería de datos es una herramienta clave en el
APLICACIONES Y REPERCUSIÓN
DESAFÍOS Y TENDENCIAS EN
MINERÍA DE DATOS
• Tendencias en minería de datos:
• Aprendizaje profundo: Las redes
neuronales profundas están ganando
popularidad por su capacidad para
manejar datos complejos, especialmente
en imágenes y texto.
• Minería de datos en tiempo real: Con la
necesidad de respuestas instantáneas, la
minería en tiempo real está en aumento.
• Federated Learning: Permite entrenar
algoritmos de manera descentralizada,
protegiendo la privacidad del usuario.
• AutoML: Plataformas que automatizan el
proceso de seleccionar y entrenar el
mejor modelo para un conjunto de datos
específico.
• Ética y transparencia: Con un enfoque
creciente en la privacidad y el sesgo, se
está poniendo más énfasis en la creación
de modelos éticos y transparentes.
• Repercusión en la sociedad:
• Decisiones más informadas: Permite a las
empresas y gobiernos tomar decisiones
basadas en datos.
• Personalización: Las recomendaciones y
anuncios personalizados mejoran la
experiencia del usuario.
• Mejora en la atención médica: La
identificación temprana y tratamientos
personalizados pueden salvar vidas.
A P L I C A C I O N E S D E L A M I N E R Í A D E D AT O S :
1 . C O M E R C I O : PA R A A N Á L I S I S D E C E S TA S D E L A
C O M P R A , R E C O M E N D A C I Ó N D E P R O D U C T O S Y
S E G M E N TA C I Ó N D E C L I E N T E S .
2 . B A N C A Y F I N A N Z A S : PA R A D E T E C TA R F R A U D E S
E N TA R J E TA S D E C R É D I T O , E VA L U A R R I E S G O S
C R E D I T I C I O S Y O P T I M I Z A R I N V E R S I O N E S .
3 . S A L U D : E N E L D I A G N Ó S T I C O D E
E N F E R M E D A D E S , P R E D I C C I Ó N D E E P I D E M I A S Y
A N Á L I S I S D E E F E C T I V I D A D D E T R ATA M I E N T O S .
4 . T E L E C O M U N I C A C I O N E S : PA R A P R E V E R L A
R O TA C I Ó N D E C L I E N T E S , O P T I M I Z A R R E D E S Y
S E G M E N TA R U S U A R I O S .
5 . P R O D U C C I Ó N : E N E L C O N T R O L D E C A L I D A D ,
P L A N I F I C A C I Ó N D E I N V E N TA R I O Y O P T I M I Z A C I Ó N
D E L A C A D E N A D E S U M I N I S T R O .
6 . R E D E S S O C I A L E S : PA R A A N Á L I S I S D E
S E N T I M I E N T O S , R E C O M E N D A C I Ó N D E C O N T E N I D O S
Y D E T E C C I Ó N D E C O M U N I D A D E S .
7 . G O B I E R N O : E N L A D E T E C C I Ó N D E F R A U D E S
F I S C A L E S , P L A N I F I C A C I Ó N U R B A N A Y A N Á L I S I S D E
P O L Í T I C A S P Ú B L I C A S .

Más contenido relacionado

Similar a Mineria de datos investigazcion para proyecto pptx

Presentacion de informatica
Presentacion de informaticaPresentacion de informatica
Presentacion de informaticaAJMV1672
 
Las tic en_la_sociedad
Las tic en_la_sociedadLas tic en_la_sociedad
Las tic en_la_sociedadGarcia Pierre
 
Curso: Cómo dar a conocer tu empresa sin gastarte un dineral en #publicidad
Curso: Cómo dar a conocer tu empresa sin gastarte un dineral en #publicidadCurso: Cómo dar a conocer tu empresa sin gastarte un dineral en #publicidad
Curso: Cómo dar a conocer tu empresa sin gastarte un dineral en #publicidadIsabel Martin
 
Requisitos de implementacion esbelta
Requisitos de implementacion esbelta Requisitos de implementacion esbelta
Requisitos de implementacion esbelta RominaBurgos4
 
Joce (tic´s) 2
Joce (tic´s) 2Joce (tic´s) 2
Joce (tic´s) 2Jc1702n
 
planificacionestrategicamunicipal-1225399764310361-9.pptx
planificacionestrategicamunicipal-1225399764310361-9.pptxplanificacionestrategicamunicipal-1225399764310361-9.pptx
planificacionestrategicamunicipal-1225399764310361-9.pptxssuserf19681
 
¿Que es abp? por Por Jorge Ortiz
¿Que es abp? por Por Jorge Ortiz¿Que es abp? por Por Jorge Ortiz
¿Que es abp? por Por Jorge Ortizfilosofiatitan
 
Alpha-Answers (Evaluación de Unidad Curricular Gestión (Unefm))
Alpha-Answers (Evaluación de Unidad Curricular Gestión (Unefm))Alpha-Answers (Evaluación de Unidad Curricular Gestión (Unefm))
Alpha-Answers (Evaluación de Unidad Curricular Gestión (Unefm))Kat Bermúdez
 
Estacion2 descripcion sena
Estacion2 descripcion senaEstacion2 descripcion sena
Estacion2 descripcion senaArcesio Bonilla
 
Fundamentos de la administracion
Fundamentos de la administracionFundamentos de la administracion
Fundamentos de la administracionHeidyRamrez6
 
Trabajos de izaje con excavadora de alto riesgo.pptx
Trabajos de izaje con excavadora de alto riesgo.pptxTrabajos de izaje con excavadora de alto riesgo.pptx
Trabajos de izaje con excavadora de alto riesgo.pptxssuserc81274
 
Informatica y convergencia tecnologica en el diseño g rafico
Informatica y convergencia tecnologica en el diseño g raficoInformatica y convergencia tecnologica en el diseño g rafico
Informatica y convergencia tecnologica en el diseño g raficoSofia Leguizamo
 

Similar a Mineria de datos investigazcion para proyecto pptx (20)

Seguridad de la red
Seguridad de la redSeguridad de la red
Seguridad de la red
 
Seguridad de la red
Seguridad de la redSeguridad de la red
Seguridad de la red
 
Presentacion de informatica
Presentacion de informaticaPresentacion de informatica
Presentacion de informatica
 
Las tic en_la_sociedad
Las tic en_la_sociedadLas tic en_la_sociedad
Las tic en_la_sociedad
 
Curso: Cómo dar a conocer tu empresa sin gastarte un dineral en #publicidad
Curso: Cómo dar a conocer tu empresa sin gastarte un dineral en #publicidadCurso: Cómo dar a conocer tu empresa sin gastarte un dineral en #publicidad
Curso: Cómo dar a conocer tu empresa sin gastarte un dineral en #publicidad
 
Requisitos de implementacion esbelta
Requisitos de implementacion esbelta Requisitos de implementacion esbelta
Requisitos de implementacion esbelta
 
Joce (tic´s) 2
Joce (tic´s) 2Joce (tic´s) 2
Joce (tic´s) 2
 
planificacionestrategicamunicipal-1225399764310361-9.pptx
planificacionestrategicamunicipal-1225399764310361-9.pptxplanificacionestrategicamunicipal-1225399764310361-9.pptx
planificacionestrategicamunicipal-1225399764310361-9.pptx
 
Michelle cueva
Michelle cuevaMichelle cueva
Michelle cueva
 
La educación
La educaciónLa educación
La educación
 
¿Que es abp? por Por Jorge Ortiz
¿Que es abp? por Por Jorge Ortiz¿Que es abp? por Por Jorge Ortiz
¿Que es abp? por Por Jorge Ortiz
 
Las redes sociales
Las redes socialesLas redes sociales
Las redes sociales
 
Alpha-Answers (Evaluación de Unidad Curricular Gestión (Unefm))
Alpha-Answers (Evaluación de Unidad Curricular Gestión (Unefm))Alpha-Answers (Evaluación de Unidad Curricular Gestión (Unefm))
Alpha-Answers (Evaluación de Unidad Curricular Gestión (Unefm))
 
DIAPOSITIVAS DE PRAE.pptx
DIAPOSITIVAS DE PRAE.pptxDIAPOSITIVAS DE PRAE.pptx
DIAPOSITIVAS DE PRAE.pptx
 
Estacion2 descripcion sena
Estacion2 descripcion senaEstacion2 descripcion sena
Estacion2 descripcion sena
 
Distrito Municipal Capotillo
Distrito Municipal CapotilloDistrito Municipal Capotillo
Distrito Municipal Capotillo
 
Fundamentos de la administracion
Fundamentos de la administracionFundamentos de la administracion
Fundamentos de la administracion
 
Trabajos de izaje con excavadora de alto riesgo.pptx
Trabajos de izaje con excavadora de alto riesgo.pptxTrabajos de izaje con excavadora de alto riesgo.pptx
Trabajos de izaje con excavadora de alto riesgo.pptx
 
Aplicaciones Utiles
Aplicaciones Utiles Aplicaciones Utiles
Aplicaciones Utiles
 
Informatica y convergencia tecnologica en el diseño g rafico
Informatica y convergencia tecnologica en el diseño g raficoInformatica y convergencia tecnologica en el diseño g rafico
Informatica y convergencia tecnologica en el diseño g rafico
 

Último

Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdfAnaBelindaArmellonHi
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
obras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffobras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffJefersonBazalloCarri1
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 

Último (20)

Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
2 PROCESO ESTADISTICO PARA LA INVESTIGACION.pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
obras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffffobras-hidraulicas.docxfffffffffffffffffff
obras-hidraulicas.docxfffffffffffffffffff
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 

Mineria de datos investigazcion para proyecto pptx

  • 2. QUE ES? • La minería de datos, o "data mining", es el proceso de descubrir patrones y conocimiento en grandes volúmenes de datos usando técnicas de estadísticas, inteligencia artificial y aprendizaje automático. Su objetivo es identificar tendencias, patrones y relaciones en un conjunto de datos. Se aplica en áreas como marketing, finanzas, medicina y venta al por menor, y puede ser utilizada para predecir comportamientos, optimizar procesos y detectar fraudes, entre otros. Es esencial preparar y limpiar los datos adecuadamente para obtener resultados confiables. La minería de datos ofrece valiosa información cuando se combina con el conocimiento experto del área en cuestión.
  • 3. ORIGEN • Origen: • Estadísticas: La estadística, como campo disciplinario, ha existido durante siglos. Las técnicas estadísticas tradicionales han sido la base para la identificación de tendencias y patrones en conjuntos de datos. • Inteligencia Artificial (IA): Durante la segunda mitad del siglo XX, el desarrollo y la investigación en IA llevó a la creación de algoritmos y modelos capaces de aprender de datos, dando lugar a lo que conocemos como aprendizaje automático. • Gestión de Bases de Datos: Las bases de datos han sido esenciales para almacenar grandes cantidades de información. Con el desarrollo de los sistemas de bases de datos y el auge de la tecnología de la información, surgieron desafíos y oportunidades relacionados con el análisis de grandes volúmenes de datos.
  • 5. M O T I V A C I Ó N : E X P L O S I Ó N D E D A T O S : C O N L A R E V O L U C I Ó N D I G I T A L Y E L A U G E D E L A I N T E R N E T , L A C A N T I D A D D E D A T O S G E N E R A D O S Y A L M A C E N A D O S H A C R E C I D O E X P O N E N C I A L M E N T E . L A S O R G A N I Z A C I O N E S S E D I E R O N C U E N T A D E L P O T E N C I A L O C U L T O E N E S T O S D A T O S P A R A O B T E N E R V E N T A J A S C O M P E T I T I V A S . T O M A D E D E C I S I O N E S B A S A D A E N D A T O S : E N L U G A R D E D E P E N D E R Ú N I C A M E N T E D E L A I N T U I C I Ó N O E L J U I C I O H U M A N O , L A S E M P R E S A S C O M E N Z A R O N A R E C O N O C E R L A I M P O R T A N C I A D E T O M A R D E C I S I O N E S B A S A D A S E N E L A N Á L I S I S D E D A T O S . A V A N C E S T E C N O L Ó G I C O S : M E J O R A S E N L A C A P A C I D A D D E C O M P U T A C I Ó N Y A L M A C E N A M I E N T O H A N P E R M I T I D O A L A S O R G A N I Z A C I O N E S P R O C E S A R Y A N A L I Z A R G R A N D E S C O N J U N T O S D E D A T O S D E M A N E R A E F I C I E N T E . C O M P E T E N C I A E N E L M E R C A D O : E N M E R C A D O S A L T A M E N T E C O M P E T I T I V O S , L A C A P A C I D A D D E P R E D E C I R T E N D E N C I A S , E N T E N D E R A L O S C L I E N T E S Y O P T I M I Z A R O P E R A C I O N E S P U E D E S E R L A D I F E R E N C I A E N T R E E L É X I T O Y E L F R A C A S O . I D E N T I F I C A C I Ó N D E P A T R O N E S O C U L T O S : M Á S A L L Á D E L A S E S T A D Í S T I C A S B Á S I C A S , E X I S T E U N A R I Q U E Z A D E P A T R O N E S Y R E L A C I O N E S E N L O S D A T O S Q U E , S I S E D E S C U B R E N , P U E D E N O F R E C E R I N S I G H T S V A L I O S O S . D E S A F Í O S E N D I V E R S O S C A M P O S : S E C T O R E S C O M O L A M E D I C I N A , L A B I O T E C N O L O G Í A , L A S F I N A N Z A S Y E L M A R K E T I N G N E C E S I T A B A N H E R R A M I E N T A S M Á S S O F I S T I C A D A S P A R A A N A L I Z A R D A T O S C O M P L E J O S Y E X T R A E R C O N O C I M I E N T O D E E L L O S .
  • 6. EL PROCESO DE DESCUBRIMIENTO DE CONOCIMIENTO EN BASES DE DATOS • El proceso de descubrimiento de conocimiento en bases de datos (KDD) es una secuencia de pasos para extraer patrones útiles de grandes conjuntos de datos. Las etapas son: • 1. **Selección de Datos**: Elegir el conjunto de datos adecuado para el análisis. • 2. **Preprocesamiento**: Incluye limpieza, integración, transformación y reducción de datos. • 3. **Minería de Datos**: Aplicación de algoritmos para descubrir patrones. • 4. **Evaluación de Patrones**: Verificar la relevancia y utilidad de los patrones encontrados. • 5. **Presentación**: Visualizar y comunicar los patrones descubiertos de manera comprensible. • 6. **Implementación (opcional)**: Usar los patrones en sistemas operativos para decisiones o automatizaciones. • Este proceso es iterativo y combina tecnología, conocimiento del dominio y calidad de datos para lograr resultados efectivos.
  • 7. TIPOS DE DATOS: • Los tipos de datos en la minería de datos se refieren a la naturaleza o estructura de los datos a analizar. Los principales tipos son: • 1. **Numéricos**: Datos cuantitativos, como edad o salario. • 2. **Categóricos**: Etiquetas sin orden, como género o tipo de producto. • 3. **Ordinales**: Categorías con orden, como calificaciones o niveles de satisfacción. • 4. **Binarios**: Dos categorías, como sí/no o verdadero/falso. • 5. **Texto**: Documentos, correos, publicaciones en redes. • 6. **Temporales**: Datos con marca de tiempo, como series temporales. • 7. **Espaciales**: Relacionados con ubicaciones, como coordenadas geográficas. • 8. **De Secuencia**: Datos ordenados, como secuencias de ADN o historiales de navegación. • 9. **De Relación**: Enlaces entre entidades, comunes en redes sociales. • 10. **De Transacción**: Interacciones específicas, como compras de productos. • Una fuente de datos puede contener varios tipos y el manejo adecuado de estos es esencial para un análisis efectivo en la minería de datos.
  • 8. U T I L I D A D D E M I N E R I A M D E D A T O S D E S C U B R I M I E N T O D E P A T R O N E S : P E R M I T E I D E N T I F I C A R P A T R O N E S R E C U R R E N T E S O R E L A C I O N E S O C U L T A S E N U N C O N J U N T O D E D A T O S . C L A S I F I C A C I Ó N : D E S P U É S D E U N M O D E L O S E H A C O N S T R U I D O C O N B A S E E N D A T O S P R E V I A M E N T E C L A S I F I C A D O S , S E P U E D E N C L A S I F I C A R N U E V O S D A T O S . S E G M E N T A C I Ó N : A Y U D A A S E G M E N T A R U N C O N J U N T O D E D A T O S E N S U B C O N J U N T O S C O N C A R A C T E R Í S T I C A S S I M I L A R E S . P R E D I C C I Ó N : U T I L I Z A P A T R O N E S E X I S T E N T E S P A R A P R E D E C I R F U T U R O S V A L O R E S O T E N D E N C I A S . A S O C I A C I Ó N : I D E N T I F I C A E L E M E N T O S Q U E S U E L E N A P A R E C E R J U N T O S E N U N D E T E R M I N A D O C O N T E X T O , C O M O E N E L A N Á L I S I S D E C E S T A S D E L A C O M P R A E N S U P E R M E R C A D O S . D E T E C C I Ó N D E A N O M A L Í A S : I D E N T I F I C A D A T O S Q U E N O S E A J U S T A N A U N P A T R Ó N E S P E R A D O , Ú T I L P A R A D E T E C T A R F R A U D E S O A C T I V I D A D E S S O S P E C H O S A S .
  • 9. RELACION CON OTRAS AREAS • Relación con otras áreas: 1.Estadística: La minería de datos utiliza muchos métodos estadísticos en sus procesos, desde regresiones hasta pruebas de hipótesis. 2.Inteligencia artificial (IA): Algoritmos de aprendizaje automático, una rama de la IA, son esenciales para la minería de datos, especialmente en tareas como clasificación y predicción. 3.Bases de datos: Dado que los datos son el recurso principal, el diseño y gestión de bases de datos es crucial. Además, algunas técnicas, como las consultas SQL, son comunes en ambos campos. 4.Sistemas de información geográfica: Para datos geolocalizados, es crucial la combinación de minería de datos con herramientas de análisis espacial. 5.Visualización de datos: Después de procesar y analizar datos, es esencial poder representar los resultados de manera gráfica para facilitar la interpretación. 6.Big data: Con el aumento de la cantidad de datos generados, la minería de datos se ha convertido en una herramienta esencial para procesar y extraer valor de grandes conjuntos de datos. 7.Bioinformática: La minería de datos se utiliza para analizar secuencias genéticas, identificar genes, predecir enfermedades, entre otros. 8.Negocios (Business Intelligence): La minería de datos es una herramienta clave en el
  • 10. APLICACIONES Y REPERCUSIÓN DESAFÍOS Y TENDENCIAS EN MINERÍA DE DATOS
  • 11. • Tendencias en minería de datos: • Aprendizaje profundo: Las redes neuronales profundas están ganando popularidad por su capacidad para manejar datos complejos, especialmente en imágenes y texto. • Minería de datos en tiempo real: Con la necesidad de respuestas instantáneas, la minería en tiempo real está en aumento. • Federated Learning: Permite entrenar algoritmos de manera descentralizada, protegiendo la privacidad del usuario. • AutoML: Plataformas que automatizan el proceso de seleccionar y entrenar el mejor modelo para un conjunto de datos específico. • Ética y transparencia: Con un enfoque creciente en la privacidad y el sesgo, se está poniendo más énfasis en la creación de modelos éticos y transparentes. • Repercusión en la sociedad: • Decisiones más informadas: Permite a las empresas y gobiernos tomar decisiones basadas en datos. • Personalización: Las recomendaciones y anuncios personalizados mejoran la experiencia del usuario. • Mejora en la atención médica: La identificación temprana y tratamientos personalizados pueden salvar vidas.
  • 12. A P L I C A C I O N E S D E L A M I N E R Í A D E D AT O S : 1 . C O M E R C I O : PA R A A N Á L I S I S D E C E S TA S D E L A C O M P R A , R E C O M E N D A C I Ó N D E P R O D U C T O S Y S E G M E N TA C I Ó N D E C L I E N T E S . 2 . B A N C A Y F I N A N Z A S : PA R A D E T E C TA R F R A U D E S E N TA R J E TA S D E C R É D I T O , E VA L U A R R I E S G O S C R E D I T I C I O S Y O P T I M I Z A R I N V E R S I O N E S . 3 . S A L U D : E N E L D I A G N Ó S T I C O D E E N F E R M E D A D E S , P R E D I C C I Ó N D E E P I D E M I A S Y A N Á L I S I S D E E F E C T I V I D A D D E T R ATA M I E N T O S . 4 . T E L E C O M U N I C A C I O N E S : PA R A P R E V E R L A R O TA C I Ó N D E C L I E N T E S , O P T I M I Z A R R E D E S Y S E G M E N TA R U S U A R I O S . 5 . P R O D U C C I Ó N : E N E L C O N T R O L D E C A L I D A D , P L A N I F I C A C I Ó N D E I N V E N TA R I O Y O P T I M I Z A C I Ó N D E L A C A D E N A D E S U M I N I S T R O . 6 . R E D E S S O C I A L E S : PA R A A N Á L I S I S D E S E N T I M I E N T O S , R E C O M E N D A C I Ó N D E C O N T E N I D O S Y D E T E C C I Ó N D E C O M U N I D A D E S . 7 . G O B I E R N O : E N L A D E T E C C I Ó N D E F R A U D E S F I S C A L E S , P L A N I F I C A C I Ó N U R B A N A Y A N Á L I S I S D E P O L Í T I C A S P Ú B L I C A S .