SlideShare una empresa de Scribd logo
1 de 30
OBJETIVO DE
MINERÍA DE
DATOS
El objetivo general del proceso de minería de datos
consiste en extraer información de un conjunto de datos
y transformarla en una estructura comprensible para su
uso posterior. Además de la etapa de análisis en bruto,
supone aspectos de gestión de datos y de bases de
datos, de procesamiento de datos, del modelo y de las
consideraciones de inferencia, de métricas de
Intereses, de consideraciones de la Teoría de la
complejidad computacional, de post-procesamiento de
las estructuras descubiertas, de la visualización y de la
actualización en línea minería de datos es una forma
innovadora de obtener información comercial
La minería de datos es el proceso de detectar la
información procesable de los conjuntos grandes de
datos. Utiliza el análisis matemático para deducir los
patrones y tendencias que existen en los datos.
CONCEPTO DE
MINERÍA DE
DATOS
Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. Los
modelos de minería de datos se pueden aplicar en escenarios como los siguientes:
Escenarios para Modelos de Minería de Datos:
• Pronostico .
• Calculo de Riesgo y Probabilidad.
• Recomendaciones.
• Búsqueda de secuencias.
• Agrupación.
El primer paso del proceso de minería de
datos, tal como se resalta en el siguiente
diagrama, consiste en definir claramente el
problema y considerar formas de usar los
datos para proporcionar una respuesta
para el mismo.
DEFINIR EL PROBLEMA
El segundo paso del proceso de minería de
datos, como se indica en el siguiente
diagrama, consiste en consolidar y limpiar
los datos identificados en el paso: Definir el
problema .
PREPARAR LOS DATOS
Al explorar los datos para conocer el
problema empresarial, puede decidir si el
conjunto de datos contiene datos
defectuosos
EXPLORAR LOS DATOS
El cuarto paso del proceso de minería de
datos, como se resalta en el siguiente
diagrama, consiste en generar el modelo o
modelos de minería de datos. Usará los
conocimientos adquiridos en el paso:
Explorar los datos para definir y crear los
modelos.
GENERAR MODELOS
El quinto paso del proceso de minería de
datos, como se resalta en el siguiente
diagrama, consiste en explorar los modelos
de minería de datos que ha generado y
comprobar su eficacia.
EXPLORAR Y VALIDAR LOS
MODELOS
El último paso del proceso de minería de
datos, como se resalta en el siguiente
diagrama, consiste en implementar los
modelos que funcionan mejor en un
entorno de producción.
IMPLEMENTAR Y ACTUALIZAR LOS
MODELOS
ESTRUCTURAS DE MINERÍA DE DATOS ANALYSIS
SERVICES - MINERÍA DE DATOS
Una misma estructura de minería de datos puede admitir varios modelos de minería de datos que
comparten el mismo dominio. En el diagrama siguiente, se muestra la relación de la estructura de
minería de datos con el origen de datos y con los modelos de minería de datos que la componen.
ALGORITMOS DE MINERÌA DE DATOS
ALGORITMOS DE CLASIFICACIÓN
• Que predicen una o más variables discretas, basándose en los
demás atributos del conjunto de datos.
ALGORITMOS DE REGRESIÓN
• Que predicen una o más variables numéricas continuas, como
pérdidas o ganancias, basándose en otros atributos del conjunto
de datos.
ALGORITMOS DE SEGMENTACIÓN
• Que dividen los datos en grupos, o clústeres, de elementos que
tienen propiedades similares.
T
I
P
O
S
D
E
A
L
G
O
R
I
T
M
O
S
ALGORITMOS DE ASOCIACIÓN
• Que buscan correlaciones entre diferentes atributos de un
conjunto de datos. La aplicación más común de esta
clase de algoritmo es la creación de reglas de asociación,
que pueden usarse en un análisis de la cesta de compra.
ALGORITMOS DE ANÁLISIS DE SECUENCIAS
• Resumen las secuencias frecuentes o episodios en los
datos, como una serie de clics en un sitio web o una serie
de eventos de registro que preceden al mantenimiento del
equipo.
MINERÍA DE DATOS EN SQL SERVER 2012
Primeramente necesitamos generar un modelo de datos para trabajar con la minería. Para ello
abrimos nuestra base de datos en Analysis Services con SQL Data Tools y seleccionamos la
opción de generar un nuevo modelo de datos de minería de datos.
Minería de datos en un proyecto de Analysis Services de SQL Data Tools
Nos aparecerá un asistente para generar el modelo de minería. Primeramente debemos indicar
desde dónde vamos a obtener los datos:
Asistente de minería de datos: Donde obtener los datos.
Después debemos indicar el algoritmo de patrones que queremos utilizar.
Algoritmo de minería
En este caso vamos a seleccionar la técnica de árboles de decisión. Seguidamente en el
asistente debemos indicar qué tabla tiene los datos sobre los que vamos a aplicar el algoritmo.
La columna Input, son los posibles factores que afectan a la columna predictible y que sirven para
buscar un posible patrón . Por ejemplo la edad, si está casado, si tiene hijos, si tiene coche, y si
estos factores afectan o no a la posible compra de bicicletas.
Tabla de entrenamiento con las columnas Key, Input y Predictible.
En el siguiente paso indicamos el tipo de los datos. Por ejemplo si son valores discretos, continuos,
ordenados, cíclicos.
Tipo de dato que queremos modelar.
Una vez finalizado el asistente, publicamos el proyecto de SQL Data Tools en Analysis Services y
desde la pestaña del visor de minería de datos podemos ver el análisis.
En el último paso del asistente indicamos el porcentaje de los datos reales que queremos analizar.
Porcentaje que queremos analizar.
En este caso vemos en círculos más grandes, los factores que más influyen en la
compra de bicicletas.
Predicción de ventas de bicicletas
Para comprobar que estos valores son coherentes a nuestras necesidades de ventas, podemos
intentar utilizar otro algoritmo de análisis y ver los datos que tenemos y compararlos.
El complemento añadirá una pestaña nueva a Excel 2010 con todas las herramientas necesarias
para la minería. Puede ser descargado desde aquí: y este es el aspecto que tendría.
Por ejemplo, podemos analizar estos mismos datos con la técnica del modelo de Bayes y el modelo
de Árbol de decisión y el complemento nos generaría un gráfico con la comparativa. Para ello
usamos el botón de “Accuracy Chart“.
Mineria de datos

Más contenido relacionado

La actualidad más candente

Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kddYaz_Cuapio
 
desarrollo de software
desarrollo de softwaredesarrollo de software
desarrollo de softwareJean Davila
 
Procesamiento de informacion
Procesamiento de informacionProcesamiento de informacion
Procesamiento de informacionVanessa Vázquez
 
Modelos de datos
Modelos de datosModelos de datos
Modelos de datosgberz
 
Edicion 1 mineria de datos
Edicion 1 mineria de datosEdicion 1 mineria de datos
Edicion 1 mineria de datosMCMurray
 
Método del desarrollo
Método del desarrolloMétodo del desarrollo
Método del desarrollojrllp
 

La actualidad más candente (8)

Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Reporte exel 3
Reporte exel 3Reporte exel 3
Reporte exel 3
 
desarrollo de software
desarrollo de softwaredesarrollo de software
desarrollo de software
 
Procesamiento de informacion
Procesamiento de informacionProcesamiento de informacion
Procesamiento de informacion
 
Introduccion a excel
Introduccion a excelIntroduccion a excel
Introduccion a excel
 
Modelos de datos
Modelos de datosModelos de datos
Modelos de datos
 
Edicion 1 mineria de datos
Edicion 1 mineria de datosEdicion 1 mineria de datos
Edicion 1 mineria de datos
 
Método del desarrollo
Método del desarrolloMétodo del desarrollo
Método del desarrollo
 

Similar a Mineria de datos

Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datosedwin
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data miningrenfer64
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos04071977
 
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...Metriplica
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datosSergio Salimbeni
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerEduardo Castro
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Ana Delgado
 
Revista TicNews Marzo 2015
Revista TicNews Marzo 2015Revista TicNews Marzo 2015
Revista TicNews Marzo 2015Edicion Ticnews
 

Similar a Mineria de datos (20)

Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Algoritmos de minería de datos
Algoritmos de minería de datos Algoritmos de minería de datos
Algoritmos de minería de datos
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Taller einstein analytics
Taller einstein analyticsTaller einstein analytics
Taller einstein analytics
 
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Tema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicosTema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicos
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL Server
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Diapositiva d
Diapositiva dDiapositiva d
Diapositiva d
 
Diapositiva 1
Diapositiva 1Diapositiva 1
Diapositiva 1
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
Actividad 4
Actividad 4Actividad 4
Actividad 4
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Diapositiva 1
Diapositiva 1Diapositiva 1
Diapositiva 1
 
Revista TicNews Marzo 2015
Revista TicNews Marzo 2015Revista TicNews Marzo 2015
Revista TicNews Marzo 2015
 

Más de Magaly Portocarrero Labajos (16)

Transacciones
Transacciones Transacciones
Transacciones
 
Administracion de la seguridad
Administracion de la seguridadAdministracion de la seguridad
Administracion de la seguridad
 
Trigger - Activadores
Trigger - ActivadoresTrigger - Activadores
Trigger - Activadores
 
Cursores
CursoresCursores
Cursores
 
Procedimientos Almacenados
Procedimientos AlmacenadosProcedimientos Almacenados
Procedimientos Almacenados
 
Vistas
VistasVistas
Vistas
 
Comandos DDL
Comandos DDLComandos DDL
Comandos DDL
 
Lenguaje Transact SQL
Lenguaje Transact SQLLenguaje Transact SQL
Lenguaje Transact SQL
 
PreparedStatement
PreparedStatementPreparedStatement
PreparedStatement
 
J table con base de datos
J table con base de datosJ table con base de datos
J table con base de datos
 
Resulset
Resulset Resulset
Resulset
 
Dispositivas de la clase statement
Dispositivas de la clase statementDispositivas de la clase statement
Dispositivas de la clase statement
 
CONNECTION
CONNECTIONCONNECTION
CONNECTION
 
Java con base de datos
Java con base de datosJava con base de datos
Java con base de datos
 
Diapositiva java
Diapositiva javaDiapositiva java
Diapositiva java
 
Diapositivas del jdbc magaly y duyen
Diapositivas del jdbc magaly y duyenDiapositivas del jdbc magaly y duyen
Diapositivas del jdbc magaly y duyen
 

Último

Six Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo processSix Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo processbarom
 
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdfCONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdfwduranteg
 
libro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operacioneslibro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operacionesRamon Bartolozzi
 
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNATINSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNATevercoyla
 
Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...Dr. Edwin Hernandez
 
EFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptx
EFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptxEFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptx
EFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptxfranklingerardoloma
 
Determinación de espacios en la instalación
Determinación de espacios en la instalaciónDeterminación de espacios en la instalación
Determinación de espacios en la instalaciónQualityAdviceService
 
Maquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfMaquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfdanielJAlejosC
 
Suelo, tratamiento saneamiento y mejoramiento
Suelo, tratamiento saneamiento y mejoramientoSuelo, tratamiento saneamiento y mejoramiento
Suelo, tratamiento saneamiento y mejoramientoluishumbertoalvarezv1
 
Estadística Anual y Multianual del Sector Eléctrico Ecuatoriano
Estadística Anual y Multianual del Sector Eléctrico EcuatorianoEstadística Anual y Multianual del Sector Eléctrico Ecuatoriano
Estadística Anual y Multianual del Sector Eléctrico EcuatorianoEduardoBriones22
 
PostgreSQL on Kubernetes Using GitOps and ArgoCD
PostgreSQL on Kubernetes Using GitOps and ArgoCDPostgreSQL on Kubernetes Using GitOps and ArgoCD
PostgreSQL on Kubernetes Using GitOps and ArgoCDEdith Puclla
 
Análisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdf
Análisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdfAnálisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdf
Análisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdfGabrielCayampiGutier
 
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der RoheAportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der RoheElisaLen4
 
PRESENTACION DE LAS PLAGAS Y ENFERMEDADES DEL PALTO
PRESENTACION DE LAS PLAGAS Y ENFERMEDADES DEL PALTOPRESENTACION DE LAS PLAGAS Y ENFERMEDADES DEL PALTO
PRESENTACION DE LAS PLAGAS Y ENFERMEDADES DEL PALTOwillanpedrazaperez
 
NTC 3883 análisis sensorial. metodología. prueba duo-trio.pdf
NTC 3883 análisis sensorial. metodología. prueba duo-trio.pdfNTC 3883 análisis sensorial. metodología. prueba duo-trio.pdf
NTC 3883 análisis sensorial. metodología. prueba duo-trio.pdfELIZABETHCRUZVALENCI
 
Presentación de Redes de alcantarillado y agua potable
Presentación de Redes de alcantarillado y agua potablePresentación de Redes de alcantarillado y agua potable
Presentación de Redes de alcantarillado y agua potableFabricioMogroMantill
 
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONALSESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONALEdwinC23
 
Sistemas de Ecuaciones no lineales-1.pptx
Sistemas de Ecuaciones no lineales-1.pptxSistemas de Ecuaciones no lineales-1.pptx
Sistemas de Ecuaciones no lineales-1.pptx170766
 
Introduction to Satellite Communication_esp_FINAL.ppt
Introduction to Satellite Communication_esp_FINAL.pptIntroduction to Satellite Communication_esp_FINAL.ppt
Introduction to Satellite Communication_esp_FINAL.pptReYMaStERHD
 
Clasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docxClasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docxwilliam801689
 

Último (20)

Six Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo processSix Sigma Process and the dmaic metodo process
Six Sigma Process and the dmaic metodo process
 
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdfCONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
CONEXIONES SERIE, PERALELO EN MÓDULOS FOTOVOLTAICOS.pdf
 
libro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operacioneslibro de ingeniería de petróleos y operaciones
libro de ingeniería de petróleos y operaciones
 
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNATINSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
INSUMOS QUIMICOS Y BIENES FISCALIZADOS POR LA SUNAT
 
Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...Propuesta para la creación de un Centro de Innovación para la Refundación ...
Propuesta para la creación de un Centro de Innovación para la Refundación ...
 
EFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptx
EFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptxEFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptx
EFICIENCIA ENERGETICA-ISO50001_INTEC_2.pptx
 
Determinación de espacios en la instalación
Determinación de espacios en la instalaciónDeterminación de espacios en la instalación
Determinación de espacios en la instalación
 
Maquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdfMaquinaria Agricola utilizada en la produccion de Piña.pdf
Maquinaria Agricola utilizada en la produccion de Piña.pdf
 
Suelo, tratamiento saneamiento y mejoramiento
Suelo, tratamiento saneamiento y mejoramientoSuelo, tratamiento saneamiento y mejoramiento
Suelo, tratamiento saneamiento y mejoramiento
 
Estadística Anual y Multianual del Sector Eléctrico Ecuatoriano
Estadística Anual y Multianual del Sector Eléctrico EcuatorianoEstadística Anual y Multianual del Sector Eléctrico Ecuatoriano
Estadística Anual y Multianual del Sector Eléctrico Ecuatoriano
 
PostgreSQL on Kubernetes Using GitOps and ArgoCD
PostgreSQL on Kubernetes Using GitOps and ArgoCDPostgreSQL on Kubernetes Using GitOps and ArgoCD
PostgreSQL on Kubernetes Using GitOps and ArgoCD
 
Análisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdf
Análisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdfAnálisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdf
Análisis_y_Diseño_de_Estructuras_con_SAP_2000,_5ta_Edición_ICG.pdf
 
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der RoheAportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
Aportes a la Arquitectura de Le Corbusier y Mies Van der Rohe
 
PRESENTACION DE LAS PLAGAS Y ENFERMEDADES DEL PALTO
PRESENTACION DE LAS PLAGAS Y ENFERMEDADES DEL PALTOPRESENTACION DE LAS PLAGAS Y ENFERMEDADES DEL PALTO
PRESENTACION DE LAS PLAGAS Y ENFERMEDADES DEL PALTO
 
NTC 3883 análisis sensorial. metodología. prueba duo-trio.pdf
NTC 3883 análisis sensorial. metodología. prueba duo-trio.pdfNTC 3883 análisis sensorial. metodología. prueba duo-trio.pdf
NTC 3883 análisis sensorial. metodología. prueba duo-trio.pdf
 
Presentación de Redes de alcantarillado y agua potable
Presentación de Redes de alcantarillado y agua potablePresentación de Redes de alcantarillado y agua potable
Presentación de Redes de alcantarillado y agua potable
 
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONALSESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
SESION 11 SUPERVISOR SSOMA SEGURIDAD Y SALUD OCUPACIONAL
 
Sistemas de Ecuaciones no lineales-1.pptx
Sistemas de Ecuaciones no lineales-1.pptxSistemas de Ecuaciones no lineales-1.pptx
Sistemas de Ecuaciones no lineales-1.pptx
 
Introduction to Satellite Communication_esp_FINAL.ppt
Introduction to Satellite Communication_esp_FINAL.pptIntroduction to Satellite Communication_esp_FINAL.ppt
Introduction to Satellite Communication_esp_FINAL.ppt
 
Clasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docxClasificación de Equipos e Instrumentos en Electricidad.docx
Clasificación de Equipos e Instrumentos en Electricidad.docx
 

Mineria de datos

  • 1.
  • 2.
  • 3. OBJETIVO DE MINERÍA DE DATOS El objetivo general del proceso de minería de datos consiste en extraer información de un conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Además de la etapa de análisis en bruto, supone aspectos de gestión de datos y de bases de datos, de procesamiento de datos, del modelo y de las consideraciones de inferencia, de métricas de Intereses, de consideraciones de la Teoría de la complejidad computacional, de post-procesamiento de las estructuras descubiertas, de la visualización y de la actualización en línea minería de datos es una forma innovadora de obtener información comercial
  • 4. La minería de datos es el proceso de detectar la información procesable de los conjuntos grandes de datos. Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos. CONCEPTO DE MINERÍA DE DATOS Estos patrones y tendencias se pueden recopilar y definir como un modelo de minería de datos. Los modelos de minería de datos se pueden aplicar en escenarios como los siguientes: Escenarios para Modelos de Minería de Datos: • Pronostico . • Calculo de Riesgo y Probabilidad. • Recomendaciones. • Búsqueda de secuencias. • Agrupación.
  • 5.
  • 6.
  • 7. El primer paso del proceso de minería de datos, tal como se resalta en el siguiente diagrama, consiste en definir claramente el problema y considerar formas de usar los datos para proporcionar una respuesta para el mismo. DEFINIR EL PROBLEMA
  • 8. El segundo paso del proceso de minería de datos, como se indica en el siguiente diagrama, consiste en consolidar y limpiar los datos identificados en el paso: Definir el problema . PREPARAR LOS DATOS
  • 9. Al explorar los datos para conocer el problema empresarial, puede decidir si el conjunto de datos contiene datos defectuosos EXPLORAR LOS DATOS
  • 10. El cuarto paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en generar el modelo o modelos de minería de datos. Usará los conocimientos adquiridos en el paso: Explorar los datos para definir y crear los modelos. GENERAR MODELOS
  • 11. El quinto paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en explorar los modelos de minería de datos que ha generado y comprobar su eficacia. EXPLORAR Y VALIDAR LOS MODELOS
  • 12. El último paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en implementar los modelos que funcionan mejor en un entorno de producción. IMPLEMENTAR Y ACTUALIZAR LOS MODELOS
  • 13.
  • 14.
  • 15.
  • 16. ESTRUCTURAS DE MINERÍA DE DATOS ANALYSIS SERVICES - MINERÍA DE DATOS Una misma estructura de minería de datos puede admitir varios modelos de minería de datos que comparten el mismo dominio. En el diagrama siguiente, se muestra la relación de la estructura de minería de datos con el origen de datos y con los modelos de minería de datos que la componen.
  • 18. ALGORITMOS DE CLASIFICACIÓN • Que predicen una o más variables discretas, basándose en los demás atributos del conjunto de datos. ALGORITMOS DE REGRESIÓN • Que predicen una o más variables numéricas continuas, como pérdidas o ganancias, basándose en otros atributos del conjunto de datos. ALGORITMOS DE SEGMENTACIÓN • Que dividen los datos en grupos, o clústeres, de elementos que tienen propiedades similares. T I P O S D E A L G O R I T M O S
  • 19. ALGORITMOS DE ASOCIACIÓN • Que buscan correlaciones entre diferentes atributos de un conjunto de datos. La aplicación más común de esta clase de algoritmo es la creación de reglas de asociación, que pueden usarse en un análisis de la cesta de compra. ALGORITMOS DE ANÁLISIS DE SECUENCIAS • Resumen las secuencias frecuentes o episodios en los datos, como una serie de clics en un sitio web o una serie de eventos de registro que preceden al mantenimiento del equipo.
  • 20. MINERÍA DE DATOS EN SQL SERVER 2012 Primeramente necesitamos generar un modelo de datos para trabajar con la minería. Para ello abrimos nuestra base de datos en Analysis Services con SQL Data Tools y seleccionamos la opción de generar un nuevo modelo de datos de minería de datos.
  • 21. Minería de datos en un proyecto de Analysis Services de SQL Data Tools Nos aparecerá un asistente para generar el modelo de minería. Primeramente debemos indicar desde dónde vamos a obtener los datos:
  • 22. Asistente de minería de datos: Donde obtener los datos. Después debemos indicar el algoritmo de patrones que queremos utilizar.
  • 23. Algoritmo de minería En este caso vamos a seleccionar la técnica de árboles de decisión. Seguidamente en el asistente debemos indicar qué tabla tiene los datos sobre los que vamos a aplicar el algoritmo.
  • 24. La columna Input, son los posibles factores que afectan a la columna predictible y que sirven para buscar un posible patrón . Por ejemplo la edad, si está casado, si tiene hijos, si tiene coche, y si estos factores afectan o no a la posible compra de bicicletas.
  • 25. Tabla de entrenamiento con las columnas Key, Input y Predictible. En el siguiente paso indicamos el tipo de los datos. Por ejemplo si son valores discretos, continuos, ordenados, cíclicos.
  • 26. Tipo de dato que queremos modelar. Una vez finalizado el asistente, publicamos el proyecto de SQL Data Tools en Analysis Services y desde la pestaña del visor de minería de datos podemos ver el análisis. En el último paso del asistente indicamos el porcentaje de los datos reales que queremos analizar.
  • 27. Porcentaje que queremos analizar. En este caso vemos en círculos más grandes, los factores que más influyen en la compra de bicicletas.
  • 28. Predicción de ventas de bicicletas Para comprobar que estos valores son coherentes a nuestras necesidades de ventas, podemos intentar utilizar otro algoritmo de análisis y ver los datos que tenemos y compararlos. El complemento añadirá una pestaña nueva a Excel 2010 con todas las herramientas necesarias para la minería. Puede ser descargado desde aquí: y este es el aspecto que tendría.
  • 29. Por ejemplo, podemos analizar estos mismos datos con la técnica del modelo de Bayes y el modelo de Árbol de decisión y el complemento nos generaría un gráfico con la comparativa. Para ello usamos el botón de “Accuracy Chart“.