Clasificación de Equipos e Instrumentos en Electricidad.docx
Mineria de datos
1.
2.
3. OBJETIVO DE
MINERÍA DE
DATOS
El objetivo general del proceso de minería de datos
consiste en extraer información de un conjunto de datos
y transformarla en una estructura comprensible para su
uso posterior. Además de la etapa de análisis en bruto,
supone aspectos de gestión de datos y de bases de
datos, de procesamiento de datos, del modelo y de las
consideraciones de inferencia, de métricas de
Intereses, de consideraciones de la Teoría de la
complejidad computacional, de post-procesamiento de
las estructuras descubiertas, de la visualización y de la
actualización en línea minería de datos es una forma
innovadora de obtener información comercial
4. La minería de datos es el proceso de detectar la
información procesable de los conjuntos grandes de
datos. Utiliza el análisis matemático para deducir los
patrones y tendencias que existen en los datos.
CONCEPTO DE
MINERÍA DE
DATOS
Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. Los
modelos de minería de datos se pueden aplicar en escenarios como los siguientes:
Escenarios para Modelos de Minería de Datos:
• Pronostico .
• Calculo de Riesgo y Probabilidad.
• Recomendaciones.
• Búsqueda de secuencias.
• Agrupación.
5.
6.
7. El primer paso del proceso de minería de
datos, tal como se resalta en el siguiente
diagrama, consiste en definir claramente el
problema y considerar formas de usar los
datos para proporcionar una respuesta
para el mismo.
DEFINIR EL PROBLEMA
8. El segundo paso del proceso de minería de
datos, como se indica en el siguiente
diagrama, consiste en consolidar y limpiar
los datos identificados en el paso: Definir el
problema .
PREPARAR LOS DATOS
9. Al explorar los datos para conocer el
problema empresarial, puede decidir si el
conjunto de datos contiene datos
defectuosos
EXPLORAR LOS DATOS
10. El cuarto paso del proceso de minería de
datos, como se resalta en el siguiente
diagrama, consiste en generar el modelo o
modelos de minería de datos. Usará los
conocimientos adquiridos en el paso:
Explorar los datos para definir y crear los
modelos.
GENERAR MODELOS
11. El quinto paso del proceso de minería de
datos, como se resalta en el siguiente
diagrama, consiste en explorar los modelos
de minería de datos que ha generado y
comprobar su eficacia.
EXPLORAR Y VALIDAR LOS
MODELOS
12. El último paso del proceso de minería de
datos, como se resalta en el siguiente
diagrama, consiste en implementar los
modelos que funcionan mejor en un
entorno de producción.
IMPLEMENTAR Y ACTUALIZAR LOS
MODELOS
13.
14.
15.
16. ESTRUCTURAS DE MINERÍA DE DATOS ANALYSIS
SERVICES - MINERÍA DE DATOS
Una misma estructura de minería de datos puede admitir varios modelos de minería de datos que
comparten el mismo dominio. En el diagrama siguiente, se muestra la relación de la estructura de
minería de datos con el origen de datos y con los modelos de minería de datos que la componen.
18. ALGORITMOS DE CLASIFICACIÓN
• Que predicen una o más variables discretas, basándose en los
demás atributos del conjunto de datos.
ALGORITMOS DE REGRESIÓN
• Que predicen una o más variables numéricas continuas, como
pérdidas o ganancias, basándose en otros atributos del conjunto
de datos.
ALGORITMOS DE SEGMENTACIÓN
• Que dividen los datos en grupos, o clústeres, de elementos que
tienen propiedades similares.
T
I
P
O
S
D
E
A
L
G
O
R
I
T
M
O
S
19. ALGORITMOS DE ASOCIACIÓN
• Que buscan correlaciones entre diferentes atributos de un
conjunto de datos. La aplicación más común de esta
clase de algoritmo es la creación de reglas de asociación,
que pueden usarse en un análisis de la cesta de compra.
ALGORITMOS DE ANÁLISIS DE SECUENCIAS
• Resumen las secuencias frecuentes o episodios en los
datos, como una serie de clics en un sitio web o una serie
de eventos de registro que preceden al mantenimiento del
equipo.
20. MINERÍA DE DATOS EN SQL SERVER 2012
Primeramente necesitamos generar un modelo de datos para trabajar con la minería. Para ello
abrimos nuestra base de datos en Analysis Services con SQL Data Tools y seleccionamos la
opción de generar un nuevo modelo de datos de minería de datos.
21. Minería de datos en un proyecto de Analysis Services de SQL Data Tools
Nos aparecerá un asistente para generar el modelo de minería. Primeramente debemos indicar
desde dónde vamos a obtener los datos:
22. Asistente de minería de datos: Donde obtener los datos.
Después debemos indicar el algoritmo de patrones que queremos utilizar.
23. Algoritmo de minería
En este caso vamos a seleccionar la técnica de árboles de decisión. Seguidamente en el
asistente debemos indicar qué tabla tiene los datos sobre los que vamos a aplicar el algoritmo.
24. La columna Input, son los posibles factores que afectan a la columna predictible y que sirven para
buscar un posible patrón . Por ejemplo la edad, si está casado, si tiene hijos, si tiene coche, y si
estos factores afectan o no a la posible compra de bicicletas.
25. Tabla de entrenamiento con las columnas Key, Input y Predictible.
En el siguiente paso indicamos el tipo de los datos. Por ejemplo si son valores discretos, continuos,
ordenados, cíclicos.
26. Tipo de dato que queremos modelar.
Una vez finalizado el asistente, publicamos el proyecto de SQL Data Tools en Analysis Services y
desde la pestaña del visor de minería de datos podemos ver el análisis.
En el último paso del asistente indicamos el porcentaje de los datos reales que queremos analizar.
27. Porcentaje que queremos analizar.
En este caso vemos en círculos más grandes, los factores que más influyen en la
compra de bicicletas.
28. Predicción de ventas de bicicletas
Para comprobar que estos valores son coherentes a nuestras necesidades de ventas, podemos
intentar utilizar otro algoritmo de análisis y ver los datos que tenemos y compararlos.
El complemento añadirá una pestaña nueva a Excel 2010 con todas las herramientas necesarias
para la minería. Puede ser descargado desde aquí: y este es el aspecto que tendría.
29. Por ejemplo, podemos analizar estos mismos datos con la técnica del modelo de Bayes y el modelo
de Árbol de decisión y el complemento nos generaría un gráfico con la comparativa. Para ello
usamos el botón de “Accuracy Chart“.