SlideShare una empresa de Scribd logo
CURSO PARA TITULACIÓN ING.
EN SOFTWARE
MINERIA DE DATOS
1UNEDL-ING. RENATA BRISEÑO
Conceptos de minería de
datos
 Proceso de detectar la información de
grandes conjuntos de datos. Utiliza el análisis
matemático para deducir los patrones y
tendencias que existen en los
datos. Normalmente, estos patrones no se
pueden detectar mediante la exploración
tradicional de los datos porque las relaciones
son demasiado complejas o porque hay
demasiado datos.
UNEDL-ING. RENATA BRISEÑO 2
Estospatronesytendenciassepuedenrecopilarydefinircomounmodelode
mineríadedatos.Losmodelosdemineríadedatossepuedenaplicarenescenarios
comolossiguientes:
 Previsión: calcular las ventas y predecir las cargas de
servidor o el tiempo de inactividad del servidor.
 Riesgo y probabilidad: elegir los mejores clientes para la
distribución de correo directo, determinar el punto de
equilibrio probable para los escenarios de riesgo, y asignar
probabilidades a diagnósticos u otros resultados.
 Recomendaciones: determinar los productos que se
pueden vender juntos y generar recomendaciones.
 Buscar secuencias: analizar los artículos que los clientes
han introducido en el carrito de compra y predecir los
posibles eventos.
 Agrupación: separar los clientes o los eventos en clústeres
de elementos relacionados, y analizar y predecir afinidades.
UVEDL-ING. RENATA BRISEÑO 3
La generación de un modelo de
minería de datos forma parte
de un proceso mayor que
incluye desde la formulación
de preguntas acerca de los
datos y la creación de un
modelo para responderlas,
hasta la implementación del
modelo en un entorno de
trabajo.
UVEDL-ING. RENATA BRISEÑO 4
Proceso cíclico, dinámico e
iterativo.
UVEDL-ING. RENATA BRISEÑO 5
 La minería de datos de Microsoft SQL
Server ofrece un entorno integrado para
crear y trabajar con modelos de minería de
datos. Este entorno incluye SQL Server
Development Studio, que contiene
algoritmos de minería de datos y
herramientas de consulta que facilitan la
generación de una solución completa para
una serie de proyectos, y SQL Server
Management Studio, que contiene
herramientas que permiten examinar
modelos y administrar objetos de minería
de datos UVEDL-ING. RENATA BRISEÑO 6
Crear modelos
multidimensionales
utilizando las herramientas
de datos de SQL Server
(SSDT)
UVEDL-ING. RENATA BRISEÑO 7
1er.Paso- Definir el problema
 Consiste en definir
claramente el
problema y considerar
formas de usar los
datos para
proporcionar una
respuesta para el
mismo.
UVEDL-ING. RENATA BRISEÑO 8
 Este paso incluye analizar
los requisitos
empresariales, definir el
ámbito del problema,
definir las métricas por las
que se evaluará el modelo
y definir los objetivos
concretos del proyecto de
minería de datos. Estas
tareas se traducen en
preguntas como las
siguientes:
 Qué está buscando? ¿Qué tipos de
relaciones intenta buscar?
 ¿Refleja el problema que está
intentando resolver las directivas o
procesos de la empresa?
 ¿Desea realizar predicciones a partir
del modelo de minería de datos o
solamente buscar asociaciones y
patrones interesantes?
 ¿Qué resultado o atributo desea
predecir?
 ¿Qué tipo de datos tiene y qué tipo
de información hay en cada
columna? En caso de que haya
varias tablas, ¿cómo se
relacionan? ¿Necesita limpiar,
agregar o procesar los datos antes
de poder usarlos?
 ¿Cómo se distribuyen los
datos? ¿Los datos son
estacionales? ¿Los datos
representan con precisión los
procesos de la empresa?
UVEDL-ING. RENATA BRISEÑO 9
2do. Paso
UVEDL-ING. RENATA BRISEÑO 10
El segundo paso del proceso de minería de datos, como se indica en el
siguiente diagrama, consiste en consolidar y limpiar los datos
identificados en el paso Definir el problema.
LOS DATOS
 Los datos pueden estar
dispersos en la
empresa y
almacenados en
formatos distintos;
también pueden
contener incoherencias
como entradas que
faltan o incorrectas.
 Ejemplo, los datos
pueden mostrar que un
cliente adquirió un
producto incluso antes
que se ofreciera en el
mercado o que el
cliente compra
regularmente en una
tienda situada a 2.000
kilómetros de su casa.
UVEDL-ING. RENATA BRISEÑO 11
 La limpieza de datos no
solamente implica quitar
los datos no válidos o
interpolar valores que
faltan, sino también
buscar las correlaciones
ocultas en los datos,
identificar los orígenes
de datos que son más
precisos y determinar
qué columnas son las
más adecuadas para el
análisis.
 Por ejemplo, ¿debería
utilizar la fecha de
envío o la fecha de
pedido? ¿Qué influye
más en las ventas: la
cantidad, el precio
total o un precio con
descuento?
UVEDL-ING. RENATA BRISEÑO 12
Los datos incompletos, los datos incorrectos y las
entradas que parecen independientes, pero que de hecho
están estrechamente correlacionadas, pueden influir en los
resultados del modelo de maneras que no espera. Por
consiguiente, antes de empezar a generar los modelos de
minería de datos, debería identificar estos problemas y
determinar cómo los corregirá. En la minería de datos, por
lo general se trabaja con un conjunto de datos de gran
tamaño y no se puede examinar la calidad de los datos de
cada transacción; por tanto, es posible que necesite usar
herramientas de generación de perfiles de datos, y de
limpieza y filtrado automático de datos, como las que se
proporcionan en Integration Services, Microsoft SQL Server
2012 Master Data Services o SQL Server Data Quality
Services para explorar los datos y buscar
incoherencias. Para obtener más información, vea estos
recursos:
Introducción a Master Data Services
Data Quality Services
UVEDL-ING. RENATA BRISEÑO 13
3er. Paso EXPLORACIÓN DE DATOS
 Debe conocer los datos
para tomar las
decisiones adecuadas
al crear los modelos de
minería de datos.
UVEDL-ING. RENATA BRISEÑO 14
 Entre las técnicas de
exploración se
incluyen calcular los
valores mínimos y
máximos, calcular la
media y las
desviaciones
estándar, y
examinar la
distribución de los
datos.
 Por ejemplo, al revisar el máximo, el
mínimo y los valores de la media se
podría determinar que los datos no
son representativos de los clientes o
procesos de negocio, y que por
consiguiente debe obtener más
datos equilibrados o revisar las
suposiciones que son la base de sus
expectativas. Las desviaciones
estándar y otros valores de
distribución pueden proporcionar
información útil sobre la estabilidad
y exactitud de los resultados. Una
desviación estándar grande puede
indicar que agregar más datos
podría ayudarle a mejorar el
modelo. Los datos que se desvían
mucho de una distribución estándar
se podrían sesgar o podrían
representar una imagen precisa de
un problema de la vida real, pero
dificultan el ajustar un modelo a los
datos.
UVEDL-ING. RENATA BRISEÑO 15
 Al explorar los datos para
conocer el problema
empresarial, puede
decidir si el conjunto de
datos contiene datos
defectuosos y, a
continuación, puede
inventar una estrategia
para corregir los
problemas u obtener una
descripción más
profunda de los
comportamientos que
son típicos de su
negocio.
 Tenga en cuenta que
cuando se crea un
modelo,Analysis
Services crea
automáticamente
resúmenes estadísticos
de los datos contenidos
en él, que puede
consultar para su uso en
informes o análisis.
UVEDL-ING. RENATA BRISEÑO 16
4TO. Paso GENERAR MODELOS
 Antes de procesar la
estructura y el modelo,
un modelo de minería de
datos simplemente es un
contenedor que
especifica las columnas
que se usan para la
entrada, el atributo que
está prediciendo y
parámetros que indican
al algoritmo cómo
procesar los datos.
UVEDL-ING. RENATA BRISEÑO 17
 El procesamiento de un modelo a menudo se
denomina entrenamiento. El entrenamiento hace
referencia al proceso de aplicar un algoritmo
matemático concreto a los datos de la estructura
para extraer patrones. Los patrones que
encuentre en el proceso de entrenamiento
dependerán de la selección de los datos de
entrenamiento, el algoritmo que elija y cómo se
haya configurado el algoritmo
UVEDL-ING. RENATA BRISEÑO 18
5TO. Paso Explorar y Validar
los modelos
 El quinto paso del
proceso de minería de
datos, como se resalta
en el siguiente
diagrama, consiste en
explorar los modelos
de minería de datos
que ha generado y
comprobar su eficacia.
UVEDL-ING. RENATA BRISEÑO 19
 Antes de implementar un modelo en un entorno de
producción, es aconsejable probar si funciona
correctamente. Además, al generar un modelo,
normalmente se crean varios con configuraciones
diferentes y se prueban todos para ver cuál ofrece
los resultados mejores para su problema y sus
datos.
UVEDL-ING. RENATA BRISEÑO 20
5to.Paso IMPLEMENTAR Y
ACTUALIZAR LOS MODELOS
 El último paso del
proceso de minería de
datos, como se resalta
en el siguiente
diagrama, consiste en
implementar los
modelos que funcionan
mejor en un entorno de
producción.
UVEDL-ING. RENATA BRISEÑO 21
Una vez que los modelos de
minería de datos se encuentran
en el entorno de producción,
puede llevar acabo diferentes
tareas, dependiendo de sus
necesidades. Las siguientes
son algunas de las tareas que
puede realizar:
UVEDL-ING. RENATA BRISEÑO 22
 Use los modelos para crear predicciones que
luego podrá usar para tomar decisiones
comerciales. SQL Server pone a su
disposición el lenguaje DMX, que podrá usar
para crear consultas de predicción, y el
Generador de consultas de predicción, que le
ayudará a generar las consultas. Para obtener
más información, consulte Referencia de
Extensiones de minería de datos (DMX).
UVEDL-ING. RENATA BRISEÑO 23
 Crear consultas de contenido para recuperar
estadísticas, reglas o fórmulas del
modelo. Para obtener más información,
consulte Consultas de minería de datos.
UVEDL-ING. RENATA BRISEÑO 24
 Incrustar la funcionalidad de minería de datos
directamente en una aplicación. Puede incluir
Objetos de administración de análisis (AMO),
que contiene un conjunto de objetos que la
aplicación pueda utilizar para crear, cambiar,
procesar y eliminar estructuras y modelos de
minería de datos.También puede enviar
mensajes XML for Analysis (XMLA)
directamente a una instancia de Analysis
Services
UVEDL-ING. RENATA BRISEÑO 25
 Utilizar Integration Services para crear un
paquete en el que se utilice un modelo de
minería de datos para dividir de forma
inteligente los datos entrantes en varias
tablas. Por ejemplo, si una base de datos se
actualiza continuamente con clientes
potenciales, puede utilizar un modelo de minería
de datos junto con Integration Services para
dividir los datos entrantes en clientes que
probablemente compren un producto y clientes
que probablemente no compren un producto.
UVEDL-ING. RENATA BRISEÑO 26
 Crear un informe que permita a los usuarios
realizar consultas directamente en un modelo
de minería de datos existente. Para obtener
más información, consulteReporting Services
en SQL Server DataTools (SSDT).
UVEDL-ING. RENATA BRISEÑO 27
 Actualizar los modelos después de la revisión
y análisis. Cualquier actualización requiere
que vuelve a procesar los modelos. Para
obtener más información, consulteProcesar
objetos de minería de datos.
UVEDL-ING. RENATA BRISEÑO 28
 Actualizar dinámicamente los modelos,
cuando entren más datos en la organización,
y realizar modificaciones constantes para
mejorar la efectividad de la solución debería
ser parte de la estrategia de
implementación. Para obtener más
información, vea Administración de las
soluciones y los objetos de minería de datos
UVEDL-ING. RENATA BRISEÑO 29

Más contenido relacionado

La actualidad más candente

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Jhon Danny Castro Condor
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Anyeni Garay
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
Software Guru
 
Data Mining
Data MiningData Mining
Data Miningbrobelo
 
Proyecto mineria de_datos_caso_2
Proyecto mineria de_datos_caso_2Proyecto mineria de_datos_caso_2
Proyecto mineria de_datos_caso_2
Gustavo Rene Rojas Valdez
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Miningbrobelo
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
Alianzo Networks
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Néstor González
 
aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
Leopoldo Gonzalez Rosas
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Departamento de Redes UNL
 
Base de datos_aci_253_26_10 [autoguardado]
Base de datos_aci_253_26_10 [autoguardado]Base de datos_aci_253_26_10 [autoguardado]
Base de datos_aci_253_26_10 [autoguardado]
Rodrigo Cabello Silva
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I ufrj
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
Ana Delgado
 
Data Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesenData Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesen
Software Guru
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
04071977
 

La actualidad más candente (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Data Mining
Data MiningData Mining
Data Mining
 
Proyecto mineria de_datos_caso_2
Proyecto mineria de_datos_caso_2Proyecto mineria de_datos_caso_2
Proyecto mineria de_datos_caso_2
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Mining
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Base de datos_aci_253_26_10 [autoguardado]
Base de datos_aci_253_26_10 [autoguardado]Base de datos_aci_253_26_10 [autoguardado]
Base de datos_aci_253_26_10 [autoguardado]
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Mineria de Datos Parte I
Mineria de Datos Parte I Mineria de Datos Parte I
Mineria de Datos Parte I
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
Data Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesenData Mining: Torturando los datos hasta que confiesen
Data Mining: Torturando los datos hasta que confiesen
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 

Similar a Mineria de datos

Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
edwin
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
Magaly Portocarrero Labajos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
karin juneth soto horna
 
Mineria de datos en sql server 2012
Mineria de datos en sql server 2012Mineria de datos en sql server 2012
Mineria de datos en sql server 2012
Ris Fernandez
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL Server
Eduardo Castro
 
Hablemos de Big Data
Hablemos de Big DataHablemos de Big Data
Hablemos de Big Data
Business Data Scientists
 
Tema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicosTema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicos
Eric Úsgame González
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
renfer64
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
Sergio Salimbeni
 
Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
ADPTechnology
 
Power-BI-básico.pdf
Power-BI-básico.pdfPower-BI-básico.pdf
Power-BI-básico.pdf
CarlosCastro72554
 
Actividad 4
Actividad 4Actividad 4
Actividad 4
MARBELLA201613
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
Fernando Alfonso Casas De la Torre
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgSnoop Consulting
 
SEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdfSEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdf
CristianChicuiPrez
 
Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1
Michael Macavilca Mejia
 
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
Metriplica
 

Similar a Mineria de datos (20)

Conceptos de minería de datos
Conceptos de minería de datosConceptos de minería de datos
Conceptos de minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos en sql server 2012
Mineria de datos en sql server 2012Mineria de datos en sql server 2012
Mineria de datos en sql server 2012
 
Introducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL ServerIntroducción al análisis predictivo con SQL Server
Introducción al análisis predictivo con SQL Server
 
Hablemos de Big Data
Hablemos de Big DataHablemos de Big Data
Hablemos de Big Data
 
Tema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicosTema 4. modelo de datos lógicos
Tema 4. modelo de datos lógicos
 
Big data & data mining
Big data & data miningBig data & data mining
Big data & data mining
 
Mineria y modelado de datos
Mineria y modelado de datosMineria y modelado de datos
Mineria y modelado de datos
 
Session01.pptx
Session01.pptxSession01.pptx
Session01.pptx
 
Power-BI-básico.pdf
Power-BI-básico.pdfPower-BI-básico.pdf
Power-BI-básico.pdf
 
Actividad 4
Actividad 4Actividad 4
Actividad 4
 
Introduccion a mineria de datos
Introduccion a mineria de datosIntroduccion a mineria de datos
Introduccion a mineria de datos
 
Diapositiva d
Diapositiva dDiapositiva d
Diapositiva d
 
Diapositiva 1
Diapositiva 1Diapositiva 1
Diapositiva 1
 
Diapositiva 1
Diapositiva 1Diapositiva 1
Diapositiva 1
 
Data Mining Snoop Consulting Arg
Data Mining Snoop Consulting ArgData Mining Snoop Consulting Arg
Data Mining Snoop Consulting Arg
 
SEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdfSEMANA4_APUNTE_S4.pdf
SEMANA4_APUNTE_S4.pdf
 
Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1Curso : Inteligencia de Negocios - Dia1
Curso : Inteligencia de Negocios - Dia1
 
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
#Metricsday2017 Modelos de datos con sentido sobre Google Analytics. Roberto ...
 

Más de Renata Briseño

Plantilla de casos de uso
Plantilla de casos de usoPlantilla de casos de uso
Plantilla de casos de uso
Renata Briseño
 
Metodologia xp (tarea msmad)
Metodologia xp (tarea msmad)Metodologia xp (tarea msmad)
Metodologia xp (tarea msmad)
Renata Briseño
 
Código de ética Rubrial
Código de ética RubrialCódigo de ética Rubrial
Código de ética Rubrial
Renata Briseño
 
El Programa de desarrollo Informático en base al programa Nacional de desarrollo
El Programa de desarrollo Informático en base al programa Nacional de desarrolloEl Programa de desarrollo Informático en base al programa Nacional de desarrollo
El Programa de desarrollo Informático en base al programa Nacional de desarrollo
Renata Briseño
 
Datos agrupados y no agrupados
Datos agrupados y no agrupadosDatos agrupados y no agrupados
Datos agrupados y no agrupados
Renata Briseño
 
Presentacion rubrial
Presentacion rubrialPresentacion rubrial
Presentacion rubrial
Renata Briseño
 

Más de Renata Briseño (6)

Plantilla de casos de uso
Plantilla de casos de usoPlantilla de casos de uso
Plantilla de casos de uso
 
Metodologia xp (tarea msmad)
Metodologia xp (tarea msmad)Metodologia xp (tarea msmad)
Metodologia xp (tarea msmad)
 
Código de ética Rubrial
Código de ética RubrialCódigo de ética Rubrial
Código de ética Rubrial
 
El Programa de desarrollo Informático en base al programa Nacional de desarrollo
El Programa de desarrollo Informático en base al programa Nacional de desarrolloEl Programa de desarrollo Informático en base al programa Nacional de desarrollo
El Programa de desarrollo Informático en base al programa Nacional de desarrollo
 
Datos agrupados y no agrupados
Datos agrupados y no agrupadosDatos agrupados y no agrupados
Datos agrupados y no agrupados
 
Presentacion rubrial
Presentacion rubrialPresentacion rubrial
Presentacion rubrial
 

Último

UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
HaroldKewinCanaza1
 
Distribución Muestral de Diferencia de Medias
Distribución Muestral de Diferencia de MediasDistribución Muestral de Diferencia de Medias
Distribución Muestral de Diferencia de Medias
arielemelec005
 
libro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdflibro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdf
MiriamAquino27
 
Voladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.pptVoladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.ppt
AldithoPomatay2
 
Curso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorysCurso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorys
LuisPerezIgnacio1
 
Mapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIASMapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIAS
AlfonsoRosalesFonsec
 
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaaEspecificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
ssuserebb7f71
 
SESION 1 - SESION INTRODUCTORIA - INTRODUCCIÓN A LA PERFORACIÓN Y VOLADURA DE...
SESION 1 - SESION INTRODUCTORIA - INTRODUCCIÓN A LA PERFORACIÓN Y VOLADURA DE...SESION 1 - SESION INTRODUCTORIA - INTRODUCCIÓN A LA PERFORACIÓN Y VOLADURA DE...
SESION 1 - SESION INTRODUCTORIA - INTRODUCCIÓN A LA PERFORACIÓN Y VOLADURA DE...
JhonatanOQuionesChoq
 
1º Caso Practico Lubricacion Rodamiento Motor 10CV
1º Caso Practico Lubricacion Rodamiento Motor 10CV1º Caso Practico Lubricacion Rodamiento Motor 10CV
1º Caso Practico Lubricacion Rodamiento Motor 10CV
CarlosAroeira1
 
Hidrostatica_e_Hidrodinamica.pdggggggggf
Hidrostatica_e_Hidrodinamica.pdggggggggfHidrostatica_e_Hidrodinamica.pdggggggggf
Hidrostatica_e_Hidrodinamica.pdggggggggf
JavierAlejosM
 
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
JuanChaparro49
 
Diagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdfDiagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdf
joseabachesoto
 
CONTROL DE MOTORES DE CORRIENTE ALTERNA PPT
CONTROL DE MOTORES DE CORRIENTE ALTERNA  PPTCONTROL DE MOTORES DE CORRIENTE ALTERNA  PPT
CONTROL DE MOTORES DE CORRIENTE ALTERNA PPT
LuisLobatoingaruca
 
Material magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulasMaterial magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulas
michiotes33
 
Una solucion saturada contiene la cantidad máxima de un soluto que se disuel...
Una solucion saturada contiene la cantidad máxima de un  soluto que se disuel...Una solucion saturada contiene la cantidad máxima de un  soluto que se disuel...
Una solucion saturada contiene la cantidad máxima de un soluto que se disuel...
leonpool521
 
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de IloPlan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
AlbertoRiveraPrado
 
BOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuariaBOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuaria
mesiassalazarpresent
 
Desbalanceo Rotatorio cabeceo de flechas y elementos rotativos_GSV.pptx
Desbalanceo Rotatorio cabeceo de flechas y elementos rotativos_GSV.pptxDesbalanceo Rotatorio cabeceo de flechas y elementos rotativos_GSV.pptx
Desbalanceo Rotatorio cabeceo de flechas y elementos rotativos_GSV.pptx
ValGS2
 
Edafología - Presentacion Orden Histosoles
Edafología - Presentacion Orden HistosolesEdafología - Presentacion Orden Histosoles
Edafología - Presentacion Orden Histosoles
FacundoPortela1
 
PRESENTACION REUNION DEL COMITE DE SEGURIDAD
PRESENTACION REUNION DEL COMITE DE SEGURIDADPRESENTACION REUNION DEL COMITE DE SEGURIDAD
PRESENTACION REUNION DEL COMITE DE SEGURIDAD
mirellamilagrosvf
 

Último (20)

UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
UNIVERSIDAD NACIONAL ALTIPLANO PUNO - FACULTAD DE INGENIERIA MECANICA ELECTRICA.
 
Distribución Muestral de Diferencia de Medias
Distribución Muestral de Diferencia de MediasDistribución Muestral de Diferencia de Medias
Distribución Muestral de Diferencia de Medias
 
libro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdflibro conabilidad financiera, 5ta edicion.pdf
libro conabilidad financiera, 5ta edicion.pdf
 
Voladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.pptVoladura de mineria subterránea pppt.ppt
Voladura de mineria subterránea pppt.ppt
 
Curso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorysCurso Basico de DIgSILENT power factorys
Curso Basico de DIgSILENT power factorys
 
Mapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIASMapa de carreteras de Colombia 2022 INVIAS
Mapa de carreteras de Colombia 2022 INVIAS
 
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaaEspecificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
Especificacioes tecnicas.pdfaaaaaaaaaaaaaaaaaaaaaaaaaaa
 
SESION 1 - SESION INTRODUCTORIA - INTRODUCCIÓN A LA PERFORACIÓN Y VOLADURA DE...
SESION 1 - SESION INTRODUCTORIA - INTRODUCCIÓN A LA PERFORACIÓN Y VOLADURA DE...SESION 1 - SESION INTRODUCTORIA - INTRODUCCIÓN A LA PERFORACIÓN Y VOLADURA DE...
SESION 1 - SESION INTRODUCTORIA - INTRODUCCIÓN A LA PERFORACIÓN Y VOLADURA DE...
 
1º Caso Practico Lubricacion Rodamiento Motor 10CV
1º Caso Practico Lubricacion Rodamiento Motor 10CV1º Caso Practico Lubricacion Rodamiento Motor 10CV
1º Caso Practico Lubricacion Rodamiento Motor 10CV
 
Hidrostatica_e_Hidrodinamica.pdggggggggf
Hidrostatica_e_Hidrodinamica.pdggggggggfHidrostatica_e_Hidrodinamica.pdggggggggf
Hidrostatica_e_Hidrodinamica.pdggggggggf
 
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
CODIGO DE SEÑALES Y COLORES NTP399 - ANEXO 17 DS 024
 
Diagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdfDiagrama de flujo "Resolución de problemas".pdf
Diagrama de flujo "Resolución de problemas".pdf
 
CONTROL DE MOTORES DE CORRIENTE ALTERNA PPT
CONTROL DE MOTORES DE CORRIENTE ALTERNA  PPTCONTROL DE MOTORES DE CORRIENTE ALTERNA  PPT
CONTROL DE MOTORES DE CORRIENTE ALTERNA PPT
 
Material magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulasMaterial magnetismo.pdf material del electromagnetismo con fórmulas
Material magnetismo.pdf material del electromagnetismo con fórmulas
 
Una solucion saturada contiene la cantidad máxima de un soluto que se disuel...
Una solucion saturada contiene la cantidad máxima de un  soluto que se disuel...Una solucion saturada contiene la cantidad máxima de un  soluto que se disuel...
Una solucion saturada contiene la cantidad máxima de un soluto que se disuel...
 
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de IloPlan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
Plan de Desarrollo Urbano de la Municipalidad Provincial de Ilo
 
BOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuariaBOTAnica mesias orland role.pptx1 ciclo agropecuaria
BOTAnica mesias orland role.pptx1 ciclo agropecuaria
 
Desbalanceo Rotatorio cabeceo de flechas y elementos rotativos_GSV.pptx
Desbalanceo Rotatorio cabeceo de flechas y elementos rotativos_GSV.pptxDesbalanceo Rotatorio cabeceo de flechas y elementos rotativos_GSV.pptx
Desbalanceo Rotatorio cabeceo de flechas y elementos rotativos_GSV.pptx
 
Edafología - Presentacion Orden Histosoles
Edafología - Presentacion Orden HistosolesEdafología - Presentacion Orden Histosoles
Edafología - Presentacion Orden Histosoles
 
PRESENTACION REUNION DEL COMITE DE SEGURIDAD
PRESENTACION REUNION DEL COMITE DE SEGURIDADPRESENTACION REUNION DEL COMITE DE SEGURIDAD
PRESENTACION REUNION DEL COMITE DE SEGURIDAD
 

Mineria de datos

  • 1. CURSO PARA TITULACIÓN ING. EN SOFTWARE MINERIA DE DATOS 1UNEDL-ING. RENATA BRISEÑO
  • 2. Conceptos de minería de datos  Proceso de detectar la información de grandes conjuntos de datos. Utiliza el análisis matemático para deducir los patrones y tendencias que existen en los datos. Normalmente, estos patrones no se pueden detectar mediante la exploración tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiado datos. UNEDL-ING. RENATA BRISEÑO 2
  • 3. Estospatronesytendenciassepuedenrecopilarydefinircomounmodelode mineríadedatos.Losmodelosdemineríadedatossepuedenaplicarenescenarios comolossiguientes:  Previsión: calcular las ventas y predecir las cargas de servidor o el tiempo de inactividad del servidor.  Riesgo y probabilidad: elegir los mejores clientes para la distribución de correo directo, determinar el punto de equilibrio probable para los escenarios de riesgo, y asignar probabilidades a diagnósticos u otros resultados.  Recomendaciones: determinar los productos que se pueden vender juntos y generar recomendaciones.  Buscar secuencias: analizar los artículos que los clientes han introducido en el carrito de compra y predecir los posibles eventos.  Agrupación: separar los clientes o los eventos en clústeres de elementos relacionados, y analizar y predecir afinidades. UVEDL-ING. RENATA BRISEÑO 3
  • 4. La generación de un modelo de minería de datos forma parte de un proceso mayor que incluye desde la formulación de preguntas acerca de los datos y la creación de un modelo para responderlas, hasta la implementación del modelo en un entorno de trabajo. UVEDL-ING. RENATA BRISEÑO 4
  • 5. Proceso cíclico, dinámico e iterativo. UVEDL-ING. RENATA BRISEÑO 5
  • 6.  La minería de datos de Microsoft SQL Server ofrece un entorno integrado para crear y trabajar con modelos de minería de datos. Este entorno incluye SQL Server Development Studio, que contiene algoritmos de minería de datos y herramientas de consulta que facilitan la generación de una solución completa para una serie de proyectos, y SQL Server Management Studio, que contiene herramientas que permiten examinar modelos y administrar objetos de minería de datos UVEDL-ING. RENATA BRISEÑO 6
  • 7. Crear modelos multidimensionales utilizando las herramientas de datos de SQL Server (SSDT) UVEDL-ING. RENATA BRISEÑO 7
  • 8. 1er.Paso- Definir el problema  Consiste en definir claramente el problema y considerar formas de usar los datos para proporcionar una respuesta para el mismo. UVEDL-ING. RENATA BRISEÑO 8
  • 9.  Este paso incluye analizar los requisitos empresariales, definir el ámbito del problema, definir las métricas por las que se evaluará el modelo y definir los objetivos concretos del proyecto de minería de datos. Estas tareas se traducen en preguntas como las siguientes:  Qué está buscando? ¿Qué tipos de relaciones intenta buscar?  ¿Refleja el problema que está intentando resolver las directivas o procesos de la empresa?  ¿Desea realizar predicciones a partir del modelo de minería de datos o solamente buscar asociaciones y patrones interesantes?  ¿Qué resultado o atributo desea predecir?  ¿Qué tipo de datos tiene y qué tipo de información hay en cada columna? En caso de que haya varias tablas, ¿cómo se relacionan? ¿Necesita limpiar, agregar o procesar los datos antes de poder usarlos?  ¿Cómo se distribuyen los datos? ¿Los datos son estacionales? ¿Los datos representan con precisión los procesos de la empresa? UVEDL-ING. RENATA BRISEÑO 9
  • 10. 2do. Paso UVEDL-ING. RENATA BRISEÑO 10 El segundo paso del proceso de minería de datos, como se indica en el siguiente diagrama, consiste en consolidar y limpiar los datos identificados en el paso Definir el problema.
  • 11. LOS DATOS  Los datos pueden estar dispersos en la empresa y almacenados en formatos distintos; también pueden contener incoherencias como entradas que faltan o incorrectas.  Ejemplo, los datos pueden mostrar que un cliente adquirió un producto incluso antes que se ofreciera en el mercado o que el cliente compra regularmente en una tienda situada a 2.000 kilómetros de su casa. UVEDL-ING. RENATA BRISEÑO 11
  • 12.  La limpieza de datos no solamente implica quitar los datos no válidos o interpolar valores que faltan, sino también buscar las correlaciones ocultas en los datos, identificar los orígenes de datos que son más precisos y determinar qué columnas son las más adecuadas para el análisis.  Por ejemplo, ¿debería utilizar la fecha de envío o la fecha de pedido? ¿Qué influye más en las ventas: la cantidad, el precio total o un precio con descuento? UVEDL-ING. RENATA BRISEÑO 12
  • 13. Los datos incompletos, los datos incorrectos y las entradas que parecen independientes, pero que de hecho están estrechamente correlacionadas, pueden influir en los resultados del modelo de maneras que no espera. Por consiguiente, antes de empezar a generar los modelos de minería de datos, debería identificar estos problemas y determinar cómo los corregirá. En la minería de datos, por lo general se trabaja con un conjunto de datos de gran tamaño y no se puede examinar la calidad de los datos de cada transacción; por tanto, es posible que necesite usar herramientas de generación de perfiles de datos, y de limpieza y filtrado automático de datos, como las que se proporcionan en Integration Services, Microsoft SQL Server 2012 Master Data Services o SQL Server Data Quality Services para explorar los datos y buscar incoherencias. Para obtener más información, vea estos recursos: Introducción a Master Data Services Data Quality Services UVEDL-ING. RENATA BRISEÑO 13
  • 14. 3er. Paso EXPLORACIÓN DE DATOS  Debe conocer los datos para tomar las decisiones adecuadas al crear los modelos de minería de datos. UVEDL-ING. RENATA BRISEÑO 14
  • 15.  Entre las técnicas de exploración se incluyen calcular los valores mínimos y máximos, calcular la media y las desviaciones estándar, y examinar la distribución de los datos.  Por ejemplo, al revisar el máximo, el mínimo y los valores de la media se podría determinar que los datos no son representativos de los clientes o procesos de negocio, y que por consiguiente debe obtener más datos equilibrados o revisar las suposiciones que son la base de sus expectativas. Las desviaciones estándar y otros valores de distribución pueden proporcionar información útil sobre la estabilidad y exactitud de los resultados. Una desviación estándar grande puede indicar que agregar más datos podría ayudarle a mejorar el modelo. Los datos que se desvían mucho de una distribución estándar se podrían sesgar o podrían representar una imagen precisa de un problema de la vida real, pero dificultan el ajustar un modelo a los datos. UVEDL-ING. RENATA BRISEÑO 15
  • 16.  Al explorar los datos para conocer el problema empresarial, puede decidir si el conjunto de datos contiene datos defectuosos y, a continuación, puede inventar una estrategia para corregir los problemas u obtener una descripción más profunda de los comportamientos que son típicos de su negocio.  Tenga en cuenta que cuando se crea un modelo,Analysis Services crea automáticamente resúmenes estadísticos de los datos contenidos en él, que puede consultar para su uso en informes o análisis. UVEDL-ING. RENATA BRISEÑO 16
  • 17. 4TO. Paso GENERAR MODELOS  Antes de procesar la estructura y el modelo, un modelo de minería de datos simplemente es un contenedor que especifica las columnas que se usan para la entrada, el atributo que está prediciendo y parámetros que indican al algoritmo cómo procesar los datos. UVEDL-ING. RENATA BRISEÑO 17
  • 18.  El procesamiento de un modelo a menudo se denomina entrenamiento. El entrenamiento hace referencia al proceso de aplicar un algoritmo matemático concreto a los datos de la estructura para extraer patrones. Los patrones que encuentre en el proceso de entrenamiento dependerán de la selección de los datos de entrenamiento, el algoritmo que elija y cómo se haya configurado el algoritmo UVEDL-ING. RENATA BRISEÑO 18
  • 19. 5TO. Paso Explorar y Validar los modelos  El quinto paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en explorar los modelos de minería de datos que ha generado y comprobar su eficacia. UVEDL-ING. RENATA BRISEÑO 19
  • 20.  Antes de implementar un modelo en un entorno de producción, es aconsejable probar si funciona correctamente. Además, al generar un modelo, normalmente se crean varios con configuraciones diferentes y se prueban todos para ver cuál ofrece los resultados mejores para su problema y sus datos. UVEDL-ING. RENATA BRISEÑO 20
  • 21. 5to.Paso IMPLEMENTAR Y ACTUALIZAR LOS MODELOS  El último paso del proceso de minería de datos, como se resalta en el siguiente diagrama, consiste en implementar los modelos que funcionan mejor en un entorno de producción. UVEDL-ING. RENATA BRISEÑO 21
  • 22. Una vez que los modelos de minería de datos se encuentran en el entorno de producción, puede llevar acabo diferentes tareas, dependiendo de sus necesidades. Las siguientes son algunas de las tareas que puede realizar: UVEDL-ING. RENATA BRISEÑO 22
  • 23.  Use los modelos para crear predicciones que luego podrá usar para tomar decisiones comerciales. SQL Server pone a su disposición el lenguaje DMX, que podrá usar para crear consultas de predicción, y el Generador de consultas de predicción, que le ayudará a generar las consultas. Para obtener más información, consulte Referencia de Extensiones de minería de datos (DMX). UVEDL-ING. RENATA BRISEÑO 23
  • 24.  Crear consultas de contenido para recuperar estadísticas, reglas o fórmulas del modelo. Para obtener más información, consulte Consultas de minería de datos. UVEDL-ING. RENATA BRISEÑO 24
  • 25.  Incrustar la funcionalidad de minería de datos directamente en una aplicación. Puede incluir Objetos de administración de análisis (AMO), que contiene un conjunto de objetos que la aplicación pueda utilizar para crear, cambiar, procesar y eliminar estructuras y modelos de minería de datos.También puede enviar mensajes XML for Analysis (XMLA) directamente a una instancia de Analysis Services UVEDL-ING. RENATA BRISEÑO 25
  • 26.  Utilizar Integration Services para crear un paquete en el que se utilice un modelo de minería de datos para dividir de forma inteligente los datos entrantes en varias tablas. Por ejemplo, si una base de datos se actualiza continuamente con clientes potenciales, puede utilizar un modelo de minería de datos junto con Integration Services para dividir los datos entrantes en clientes que probablemente compren un producto y clientes que probablemente no compren un producto. UVEDL-ING. RENATA BRISEÑO 26
  • 27.  Crear un informe que permita a los usuarios realizar consultas directamente en un modelo de minería de datos existente. Para obtener más información, consulteReporting Services en SQL Server DataTools (SSDT). UVEDL-ING. RENATA BRISEÑO 27
  • 28.  Actualizar los modelos después de la revisión y análisis. Cualquier actualización requiere que vuelve a procesar los modelos. Para obtener más información, consulteProcesar objetos de minería de datos. UVEDL-ING. RENATA BRISEÑO 28
  • 29.  Actualizar dinámicamente los modelos, cuando entren más datos en la organización, y realizar modificaciones constantes para mejorar la efectividad de la solución debería ser parte de la estrategia de implementación. Para obtener más información, vea Administración de las soluciones y los objetos de minería de datos UVEDL-ING. RENATA BRISEÑO 29