El documento describe la minería de datos, incluyendo que extrae información útil de grandes volúmenes de datos, que involucra áreas como estadísticas e inteligencia artificial, y se aplica en comercio, medicina y detección de fraude. También explica que la minería de datos usa algoritmos como agrupamiento para agrupar datos similares y que difiere de aprendizaje automático en que requiere participación humana.
1. Mineria de
Datos
GRUPO 4
DOCENTE: ING. DAVID MENDOZA GUTIERREZ
YUCRA MIRANDA
YENNY YANETH
PEREZ FIERRO
DANIEL
SALAS QUISPE
FRANKLIN
GODOY CACERES
JORGE JHONNY
3. Introducción
La minería de datos se relaciona con las técnicas y las
herramientas utilizadas para extraer información útil de
grandes volúmenes de datos.
4. Minería de datos
● Conjuntos de área que tienen como propósito la identificación de
conocimiento obtenido a partir de las base de datos que aporten sesgo a la
toma de decisión
● ¿Qué áreas?
○ Estadísticas
○ Inteligencia artificial
○ RP(Reconocimiento de patrones)
○ Computación grafica
○ Base de datos
6. Que conforma el Minería de Datos
● Una gran base de datos
● Un especialista de dominio
○ Unos objetivos
● Un minero de datos
○ Un software
○ Un especialista
● Una metodología
● Herramientas de Minería de Datos
○ Técnica de Minería de Datos
○ Técnica de Validación
7. Técnica usadas en minería de datos
● Agrupación
○ Agrupación de objetos similares
● Clasificación y regresión
○ Agrupación de objetos similares considerando una estructuras de
las clases conocidas
● Modelos Predictivos
○ Identificar las variables mas predictivas
○ Anticiparse a los eventos
● Descubrimiento de secuencia
○ Agrupar un tipo especial de objetos : secuencias
● Asociación
○ Encuentra relaciones entre producto
9. ¿Que uso tiene la minería de datos?
Existen numerosas áreas donde la minería de datos se
puede aplicar, prácticamente en todas las actividades
humanas que generen datos:
● Comercio y banca
● Medicina y farmacia
● Seguridad y detección de fraude
● Recuperación de información no numérica
10. Diferencias entre minería de datos y máquinas de
aprendizaje
La diferencia principal entre el DM y el ML es que, sin la
participación humana en el Data Mining, no puede
funcionar, pero en el Machine Learning el esfuerzo
humano está involucrado sólo en el momento en que se
define el algoritmo
12. Los algoritmos de agrupación
agrupan una colección de puntos
de datos en “agrupaciones” según
una medida de distancia.
Los puntos de datos en el mismo
grupo deben tener una pequeña
distancia entre sí.
Los puntos de datos en diferentes
agrupaciones deben estar a una
gran distancia entre sí