SlideShare una empresa de Scribd logo
1 de 36
PROCESO DE LA MINERIA DE
DATOS EN ELANALYSIS
SERVICES
GUSTAVO ROJAS -NAZARENA DORADO - NOEMI TICONA DOCENTE: ING. DAVID ENRIQUE MENDOZA GUTIÉRREZ
GRUPO #6 :
- MARIA NAZARENA DORADO MEDEIROS
- GUSTAVO RENE ROJAS VALDEZ
- NOEMI TICONA ANGLES
Trabajaremos con el SQL
Server Analysis Services
(SSAS) que permite crear una
esquema para administrar los
objetos de una base de datos
de Analysis Services definidas
por: Cubos OLAP (Primera
parte del curso) Modelos de
minería de datos. (Segunda
parte del curso)
HERRAMIENTAS DEL SQL SERVER
El Microsoft SQL Server ofrece 4 de
herramientas principales:
ENTORNOS DE DESARROLLO
El SSAS ofrece un entorno integrado para crear
cubos OLAP y modelos de minería de datos y
trabajar con ellos, conformado por:
SQL Server Management Studio. Herramienta
principal para administrar Database Engine (Motor
de base de datos) y escribir código de Transact-
SQL.
SQL Server Business Intelligence Development
studio. Es el Microsoft Visual Studio con tipos de
proyecto adicionales específicos de Business
Intelligence. Es el entorno que se utilizará para
desarrollar soluciones de Analysis Services,
Integration Services y Reporting Services usando
plantillas específicas.
OBJETIVOS
 Crear una base de datos de Analysis Services, agregar un origen de datos, crear una
vista de origen de datos y modificar una vista de origenes de datos para preparar
una nueva base de datos que se va a utilizar para la minería de datos.
 Crear un escenario de modelos de minería de datos para predecir la respuesta de
clientes ante una campaña de correo directo
 Crear y utilizar los algoritmos de minería de datos, los visores del modelo de minería
de datos y las herramientas de minería de datos:
 Árboles de decisión de Microsoft
 Clústeres de Microsoft Bayes
 naive de Microsoft
CONCEPTOS A CONOCER PARA EL
PROCESO DE MINERÍA DE DATOS.
 Plantilla de proyecto. Permite crea un proyecto vacío del tipo seleccionado en el que se
definen objetos del Database Engine o del Analysis Services.
 Origenes de datos. Es una conexión de datos que se administra en el proyecto y se
implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde
residen los datos del origen.
 Vista de origenes de datos. Son vistas unificadas de los metadatos, desde las tablas y
vistas seleccionadas en los orígenes de datos
TAREAS
1. Crear un proyecto de Analysis Services basado en una plantilla de proyecto del SSAS.
2. 2. Agregar uno o varios origenes de datos.
3. 3. Crear una vista de origen de datos.
4. 4. Modificar una vista de origen de datos.
Estas tarea son comunes a cuando se desea crear y trabajar con un cubo OLAP
1. Crear un proyecto de Analysis Services
Un proyecto de SSAS permite definir un esquema que contiene los objetos de
una BD del Analysis Services, estos es modelos de minería de datos y objetos
complementarios.
Para crear un proyecto de Analysis Services
a. Abra el Business Intelligence Development Studio.
b. b. En el menú Archivo, seleccione Nuevo y haga clic en Proyecto.
c. Seleccione Proyecto de Analysis Services en el panel Plantillas
d. Denomine nombre al Proyecto Prueba de Concepto 1
e. Haga clic en Aceptar.
2. Crear un origen de datos Un origen de datos es una conexión de datos que se administra en el
proyecto y se implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde
residen los datos del origen.
Para crear un origen de datos
1. Seleccione la carpeta Orígenes de datos y luego Nuevo
origen de datos en el Explorador de soluciones
3. Se abrirá el Asistente para orígenes de datos, haga clic en Siguiente.
4. Haga clic en Nuevo para agregar una conexión a las bases de datos, se abrirá el cuadro de diálogo
Administrador de conexión.
5. En la lista Nombre del servidor, seleccione el servidor en el que se aloja la base de datos AdventureWorksDW
(seleccione localhost si la base de datos se aloja en el servidor local.)
6.Se selecciona la Base de Datos y le damos
Siguiente
7. En asistente de orígenes seleccionamos
Utilizar la cuenta de servicio.
9. Presione el boton Finalizar.
10. El nuevo origen de datos, Adventure Works DW, aparecerá en la carpeta Orígenes de datos
del Explorador de soluciones.
imagen
3. Crear una vista de origen de datos
Una vista de origen de datos es una abstracción del origen de datos, permite modificar la estructura de los datos (sin modificar
los objetos de la base de datos original) para que sean más significativos en el contexto del proyecto. Se puede seleccionar
tablas, establecer relaciones entre ellas, adicionar columnas calculadas y vistas con nombre.
Para crear una vista de origen de datos
1. En el Explorador de soluciones, haga clic con el botón secundario en Vistas de origen de datos y seleccione Nueva
vista de origen de datos.
2. Se abrirá el Asistente para vistas de origen de
datos.
3. En la página Seleccionar un origen de datos, el
origen de datos Adventure Works DW que se creó
en la última tarea aparecerá seleccionado de forma
predeterminada en Orígenes de datos relacionales.
Haga clic en Siguiente.
4. En la página Seleccionar tablas y vistas, seleccione las siguientes tablas y vistas, use la flecha
derecha para incluirlas: dbo.ProspectiveBuyer dbo.vAssocSeqLineItems dbo.vAssocSeqOrders
dbo.vTargetMail dbo.vTimeSeries
presione Siguiente.
5. En la página Finalizando el asistente, la vista de origen de datos tendrá el nombre Adventure
Works DW de forma predeterminada. Haga clic en Finalizar.
6. Se abrirá el Diseñador de vistas de origen de datos para mostrar la vista de
origen de datos Adventure Works DW.En la cual Arrastre la columna hasta la
tabla vAssocSeqOrders y colóquela en la columna OrderNumber.
Crear una estructura del modelo de minería de datos Targeted Mailing
El primer paso para crear un escenario de correo directo consiste en utilizar el Asistente para
minería de datos para crear la estructura de minería de datos y luego un modelo de minería de
datos de árboles de decisión. Para crear una estructura de minería de datos para un escenario de
correo directo
1. En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de
datos y seleccione Nueva estructura de minería de datos. Se abrirá el Asistente para minería de
datos.
2. En la página de inicio del Asistente para
minería de datos, haga clic en Siguiente.
3. En la página Seleccionar el método de definición,
compruebe que la opción A partir de una base de datos
relacional o un almacén de datos se ha seleccionado y, a
continuación, haga clic en Siguiente.
4. En la página Seleccionar la técnica de
minería de datos, en ¿Qué técnica de minería
de datos desea utilizar?, seleccione Árboles de
decisión de Microsoft.
5. En la página Seleccionar vista de origen de datos,
observe que Adventure Works DW se ha seleccionado de
forma predeterminada. Haga clic en Explorar para ver las
tablas de la vista de origen de datos. Presione siguiente. .
6. En la página Especificar tipos de tablas, active la casilla de verificación de la
columna Escenario, situada junto a la tabla vTargetMail; a continuación, haga clic
en Siguiente.
7. En la página Especificar los datos de entrenamiento,
seleccione las siguiente columnas:
8.En la página Especificar el contenido y el tipo de
datos de las columnas, haga clic en Detectar. Un
algoritmo usará los datos de la vista y
determinará si las columnas numéricas contienen
valores continuos o discretos.
9. Después de hacer clic en Detectar, compruebe que las entradas de las columnas Tipo de contenido y
Tipo de datos tengan la configuración especificada en la siguiente tabla.
Usted debe de modificar para que corresponda a los valores de la tabla de arriba, revise el caso por ejemplo
de: GeographyKey
10. Haga clic en Siguiente.
En porcentaje de datos para prueba no coloque 30%. En máximo número de casos en el conjunto de datos
de prueba no coloque nada, borre el valor.
11. En la página Finalización del asistente hago lo siguiente: En Nombre de la estructura de
minería de datos, escriba Targeted Mailing. En Nombre del modelo de minería de datos, escriba
TM_Decision_Tree. Active la casilla de verificación Permitir obtención de detalles. Haga clic en
Finalizar.
2. Modificar el modelo Targeted Mailing En esta tarea se definirá dos modelos de minería
(estructuras) de adicionales al algoritmo de árboles de decisión mediante la ficha Modelos de
minería de datos del Diseñador de minería de datos. En esta tarea, definirá un modelo Naive
Bayes y un modelo Clustering. a. Crear un modelo Microsoft Clustering Para crear un modelo de
minería de datos de clúster debe ejecutar los siguientes pasos: 1. Cambie a la ficha Modelos de
minería de datos del Diseñador de minería de datos en Business Intelligence Development
Studio.
Observe que el diseñador muestra dos columnas: una para
la estructura de minería de datos y otra para el modelo de
minería de datos inicial, que creó en la tarea anterior de
esta lección
2. Haga clic con el botón secundario en la
columna Estructura y seleccione Nuevo
modelo de minería de datos.
3. Se abrirá el cuadro de diálogo Nuevo modelo de
minería de datos. En Nombre del modelo, escriba
TM_Clustering. En Nombre del algoritmo, seleccione
Clústeres de Microsoft.
4. Aparece un modelo nuevo en la ficha Modelos de
minería de datos del Diseñador de minería de datos.
b. Crear un modelo Microsoft Naive Bayes Para crear un modelo Naive Bayes: 1. En la ficha
Modelos de minería de datos del Diseñador de minería de datos, haga clic con el botón
secundario en la columna Estructura y seleccione Nuevo modelo de minería de datos. 2. Se
abrirá el cuadro de diálogo Nuevo modelo de minería de datos. En Nombre del modelo, escriba
TM_NaiveBayes. En Nombre del algoritmo, seleccione Bayes naive de Microsoft..
3. Aparece un modelo nuevo en la ficha Modelos de minería de datos. Aunque puede
modificar el uso y las propiedades de la columna para todos los modelos de la ficha, en este
laboratorio, no es necesario hacer cambios en el modelo TM_NaiveBayes.
c. Procesar los modelos de minería de datos
Esto permitirá que la base de datos Analysis Services se implemente en el equipo servidor y los
modelos de minería de datos se procesen.
3. Explorar los modelos Targeted Mailing Una vez que se procesen los modelos de su
proyecto, podrá verlos utilizando la ficha Visor de modelos de minería de datos del
Diseñador de minería de datos.
Puede utilizar la lista Modelos de minería de datos, ubicada en la parte superior de la ficha, para examinar los
modelos individuales en la estructura de minería de datos.
Las secciones siguientes describen cómo explorar los modelos de minería de datos en los visores. Modelo
Microsoft Decision Tree Modelo Microsoft Clustering Modelo Microsoft Naive Bayes
Ficha Árbol de decisión 2. En la ficha Árbol de decisión, puede examinar los modelos de árbol que componen
un modelo de minería de datos. Si hubiera más árboles, podría utilizar el cuadro Árbol para elegir uno
diferente, en este caso dado que contiene un único atributo de predicción (Bike Buyer), sólo hay un árbol para
ver. 3. El visor muestra por defecto los primeros tres niveles del árbol, si el árbol contiene menos se mostrará
sólo los niveles existentes, puede ver más niveles utilizando el control deslizante Mostrar nivel o la lista
Expansión predeterminada.
La ficha Red de dependencias muestra las relaciones entre los atributos que contribuyen a la
capacidad de predicción del modelo de minería de datos.
El nodo central, representa el atributo de predicción del modelo de minería de datos. Cada nodo
adyacente representa un atributo que afecta al resultado del atributo de predicción. Utilice el control de
la izquierda para controlar la intensidad de los vínculos que se muestran. Si desplaza el control hacia
abajo, se mostrarán los vínculos de mayor intensidad. Si hace clic en un nodo de la red puede consultar la
leyenda de color situada en la parte inferior, si predice o es predicho.
GRACIAS POR SU
ATENCIÓN

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Modelos De Data Mining
Modelos De Data MiningModelos De Data Mining
Modelos De Data Mining
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Fundamentos de Data Mining con R
Fundamentos de Data Mining con RFundamentos de Data Mining con R
Fundamentos de Data Mining con R
 
La Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisisLa Minería de Datos y herramientas de análisis
La Minería de Datos y herramientas de análisis
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Base de datos_aci_253_26_10 [autoguardado]
Base de datos_aci_253_26_10 [autoguardado]Base de datos_aci_253_26_10 [autoguardado]
Base de datos_aci_253_26_10 [autoguardado]
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Mineria de Datos
Mineria de DatosMineria de Datos
Mineria de Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 

Similar a Análisis de datos y modelos de minería en SSAS

Similar a Análisis de datos y modelos de minería en SSAS (20)

Sql server 2012
Sql  server 2012Sql  server 2012
Sql server 2012
 
Tarea4
Tarea4Tarea4
Tarea4
 
Guía para la creación de cubos de datos
Guía para la creación de cubos de datosGuía para la creación de cubos de datos
Guía para la creación de cubos de datos
 
Reportes y graficos en .net
Reportes y graficos en .net Reportes y graficos en .net
Reportes y graficos en .net
 
Microsoft access
Microsoft accessMicrosoft access
Microsoft access
 
Universidad tecnológica de tehuacán datamart
Universidad tecnológica de tehuacán datamartUniversidad tecnológica de tehuacán datamart
Universidad tecnológica de tehuacán datamart
 
Vb access
Vb accessVb access
Vb access
 
Vb access
Vb accessVb access
Vb access
 
Vb access
Vb accessVb access
Vb access
 
Vb access
Vb accessVb access
Vb access
 
Conexion mysql
Conexion mysqlConexion mysql
Conexion mysql
 
Resumen Semana 3 Topicos
Resumen Semana 3 TopicosResumen Semana 3 Topicos
Resumen Semana 3 Topicos
 
Toturial aplicacion base de datos jsp
Toturial aplicacion base de datos jspToturial aplicacion base de datos jsp
Toturial aplicacion base de datos jsp
 
Lenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-proLenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-pro
 
Lenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-proLenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-pro
 
Lozada ivonne-Principales características de Access que se necesita para elab...
Lozada ivonne-Principales características de Access que se necesita para elab...Lozada ivonne-Principales características de Access que se necesita para elab...
Lozada ivonne-Principales características de Access que se necesita para elab...
 
Cubos ppt
Cubos pptCubos ppt
Cubos ppt
 
Práctica guiada1
Práctica guiada1Práctica guiada1
Práctica guiada1
 
Leo
LeoLeo
Leo
 
ADO NET.ppt
ADO NET.pptADO NET.ppt
ADO NET.ppt
 

Más de MARIANAZARENADORADOM

Más de MARIANAZARENADORADOM (7)

Proyecto mineria de datos caso1
Proyecto mineria de datos caso1Proyecto mineria de datos caso1
Proyecto mineria de datos caso1
 
Proyecto mineria de datos caso2
Proyecto mineria de datos caso2Proyecto mineria de datos caso2
Proyecto mineria de datos caso2
 
Internet de las cosas
Internet de las cosasInternet de las cosas
Internet de las cosas
 
Machine e learning
Machine e learningMachine e learning
Machine e learning
 
Resumen codigo enigma
Resumen codigo enigmaResumen codigo enigma
Resumen codigo enigma
 
Resumen codigo enigma
Resumen codigo enigmaResumen codigo enigma
Resumen codigo enigma
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 

Último

Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfyoseka196
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfKEVINYOICIAQUINOSORI
 
Linealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfLinealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfrolandolazartep
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdfFernandaGarca788912
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdffredyflores58
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Francisco Javier Mora Serrano
 
Caldera Recuperadora de químicos en celulosa tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa  tipos y funcionamientoCaldera Recuperadora de químicos en celulosa  tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa tipos y funcionamientoRobertoAlejandroCast6
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7luisanthonycarrascos
 
Propositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicacionesPropositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicaciones025ca20
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfAntonioGonzalezIzqui
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdfEdwinAlexanderSnchez2
 
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptxPPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptxSergioGJimenezMorean
 
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptxGARCIARAMIREZCESAR
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaSHERELYNSAMANTHAPALO1
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxClaudiaPerez86192
 
Sesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERUSesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERUMarcosAlvarezSalinas
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxEduardoSnchezHernnde5
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdfAnthonyTiclia
 
clases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfclases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfDanielaVelasquez553560
 

Último (20)

Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdf
 
Elaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdfElaboración de la estructura del ADN y ARN en papel.pdf
Elaboración de la estructura del ADN y ARN en papel.pdf
 
Linealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdfLinealización de sistemas no lineales.pdf
Linealización de sistemas no lineales.pdf
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdf
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
 
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
Hanns Recabarren Diaz (2024), Implementación de una herramienta de realidad v...
 
Caldera Recuperadora de químicos en celulosa tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa  tipos y funcionamientoCaldera Recuperadora de químicos en celulosa  tipos y funcionamiento
Caldera Recuperadora de químicos en celulosa tipos y funcionamiento
 
sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7sistema de construcción Drywall semana 7
sistema de construcción Drywall semana 7
 
Propositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicacionesPropositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicaciones
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
 
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdfVALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
 
183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf183045401-Terminal-Terrestre-de-Trujillo.pdf
183045401-Terminal-Terrestre-de-Trujillo.pdf
 
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptxPPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
 
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
4.6 DEFINICION DEL PROBLEMA DE ASIGNACION.pptx
 
CICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresaCICLO DE DEMING que se encarga en como mejorar una empresa
CICLO DE DEMING que se encarga en como mejorar una empresa
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptx
 
Sesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERUSesion 02 Patentes REGISTRO EN INDECOPI PERU
Sesion 02 Patentes REGISTRO EN INDECOPI PERU
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptx
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
 
clases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfclases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdf
 

Análisis de datos y modelos de minería en SSAS

  • 1. PROCESO DE LA MINERIA DE DATOS EN ELANALYSIS SERVICES GUSTAVO ROJAS -NAZARENA DORADO - NOEMI TICONA DOCENTE: ING. DAVID ENRIQUE MENDOZA GUTIÉRREZ GRUPO #6 : - MARIA NAZARENA DORADO MEDEIROS - GUSTAVO RENE ROJAS VALDEZ - NOEMI TICONA ANGLES
  • 2. Trabajaremos con el SQL Server Analysis Services (SSAS) que permite crear una esquema para administrar los objetos de una base de datos de Analysis Services definidas por: Cubos OLAP (Primera parte del curso) Modelos de minería de datos. (Segunda parte del curso) HERRAMIENTAS DEL SQL SERVER El Microsoft SQL Server ofrece 4 de herramientas principales:
  • 3. ENTORNOS DE DESARROLLO El SSAS ofrece un entorno integrado para crear cubos OLAP y modelos de minería de datos y trabajar con ellos, conformado por: SQL Server Management Studio. Herramienta principal para administrar Database Engine (Motor de base de datos) y escribir código de Transact- SQL. SQL Server Business Intelligence Development studio. Es el Microsoft Visual Studio con tipos de proyecto adicionales específicos de Business Intelligence. Es el entorno que se utilizará para desarrollar soluciones de Analysis Services, Integration Services y Reporting Services usando plantillas específicas.
  • 4. OBJETIVOS  Crear una base de datos de Analysis Services, agregar un origen de datos, crear una vista de origen de datos y modificar una vista de origenes de datos para preparar una nueva base de datos que se va a utilizar para la minería de datos.  Crear un escenario de modelos de minería de datos para predecir la respuesta de clientes ante una campaña de correo directo  Crear y utilizar los algoritmos de minería de datos, los visores del modelo de minería de datos y las herramientas de minería de datos:  Árboles de decisión de Microsoft  Clústeres de Microsoft Bayes  naive de Microsoft
  • 5. CONCEPTOS A CONOCER PARA EL PROCESO DE MINERÍA DE DATOS.  Plantilla de proyecto. Permite crea un proyecto vacío del tipo seleccionado en el que se definen objetos del Database Engine o del Analysis Services.  Origenes de datos. Es una conexión de datos que se administra en el proyecto y se implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde residen los datos del origen.  Vista de origenes de datos. Son vistas unificadas de los metadatos, desde las tablas y vistas seleccionadas en los orígenes de datos
  • 6. TAREAS 1. Crear un proyecto de Analysis Services basado en una plantilla de proyecto del SSAS. 2. 2. Agregar uno o varios origenes de datos. 3. 3. Crear una vista de origen de datos. 4. 4. Modificar una vista de origen de datos. Estas tarea son comunes a cuando se desea crear y trabajar con un cubo OLAP
  • 7. 1. Crear un proyecto de Analysis Services Un proyecto de SSAS permite definir un esquema que contiene los objetos de una BD del Analysis Services, estos es modelos de minería de datos y objetos complementarios. Para crear un proyecto de Analysis Services a. Abra el Business Intelligence Development Studio. b. b. En el menú Archivo, seleccione Nuevo y haga clic en Proyecto.
  • 8. c. Seleccione Proyecto de Analysis Services en el panel Plantillas d. Denomine nombre al Proyecto Prueba de Concepto 1 e. Haga clic en Aceptar.
  • 9. 2. Crear un origen de datos Un origen de datos es una conexión de datos que se administra en el proyecto y se implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde residen los datos del origen. Para crear un origen de datos 1. Seleccione la carpeta Orígenes de datos y luego Nuevo origen de datos en el Explorador de soluciones
  • 10. 3. Se abrirá el Asistente para orígenes de datos, haga clic en Siguiente. 4. Haga clic en Nuevo para agregar una conexión a las bases de datos, se abrirá el cuadro de diálogo Administrador de conexión.
  • 11. 5. En la lista Nombre del servidor, seleccione el servidor en el que se aloja la base de datos AdventureWorksDW (seleccione localhost si la base de datos se aloja en el servidor local.)
  • 12. 6.Se selecciona la Base de Datos y le damos Siguiente 7. En asistente de orígenes seleccionamos Utilizar la cuenta de servicio.
  • 13. 9. Presione el boton Finalizar.
  • 14. 10. El nuevo origen de datos, Adventure Works DW, aparecerá en la carpeta Orígenes de datos del Explorador de soluciones. imagen 3. Crear una vista de origen de datos Una vista de origen de datos es una abstracción del origen de datos, permite modificar la estructura de los datos (sin modificar los objetos de la base de datos original) para que sean más significativos en el contexto del proyecto. Se puede seleccionar tablas, establecer relaciones entre ellas, adicionar columnas calculadas y vistas con nombre. Para crear una vista de origen de datos 1. En el Explorador de soluciones, haga clic con el botón secundario en Vistas de origen de datos y seleccione Nueva vista de origen de datos.
  • 15. 2. Se abrirá el Asistente para vistas de origen de datos. 3. En la página Seleccionar un origen de datos, el origen de datos Adventure Works DW que se creó en la última tarea aparecerá seleccionado de forma predeterminada en Orígenes de datos relacionales. Haga clic en Siguiente.
  • 16. 4. En la página Seleccionar tablas y vistas, seleccione las siguientes tablas y vistas, use la flecha derecha para incluirlas: dbo.ProspectiveBuyer dbo.vAssocSeqLineItems dbo.vAssocSeqOrders dbo.vTargetMail dbo.vTimeSeries presione Siguiente.
  • 17. 5. En la página Finalizando el asistente, la vista de origen de datos tendrá el nombre Adventure Works DW de forma predeterminada. Haga clic en Finalizar.
  • 18. 6. Se abrirá el Diseñador de vistas de origen de datos para mostrar la vista de origen de datos Adventure Works DW.En la cual Arrastre la columna hasta la tabla vAssocSeqOrders y colóquela en la columna OrderNumber.
  • 19. Crear una estructura del modelo de minería de datos Targeted Mailing El primer paso para crear un escenario de correo directo consiste en utilizar el Asistente para minería de datos para crear la estructura de minería de datos y luego un modelo de minería de datos de árboles de decisión. Para crear una estructura de minería de datos para un escenario de correo directo 1. En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos. Se abrirá el Asistente para minería de datos.
  • 20. 2. En la página de inicio del Asistente para minería de datos, haga clic en Siguiente. 3. En la página Seleccionar el método de definición, compruebe que la opción A partir de una base de datos relacional o un almacén de datos se ha seleccionado y, a continuación, haga clic en Siguiente.
  • 21. 4. En la página Seleccionar la técnica de minería de datos, en ¿Qué técnica de minería de datos desea utilizar?, seleccione Árboles de decisión de Microsoft. 5. En la página Seleccionar vista de origen de datos, observe que Adventure Works DW se ha seleccionado de forma predeterminada. Haga clic en Explorar para ver las tablas de la vista de origen de datos. Presione siguiente. .
  • 22. 6. En la página Especificar tipos de tablas, active la casilla de verificación de la columna Escenario, situada junto a la tabla vTargetMail; a continuación, haga clic en Siguiente.
  • 23. 7. En la página Especificar los datos de entrenamiento, seleccione las siguiente columnas: 8.En la página Especificar el contenido y el tipo de datos de las columnas, haga clic en Detectar. Un algoritmo usará los datos de la vista y determinará si las columnas numéricas contienen valores continuos o discretos.
  • 24. 9. Después de hacer clic en Detectar, compruebe que las entradas de las columnas Tipo de contenido y Tipo de datos tengan la configuración especificada en la siguiente tabla. Usted debe de modificar para que corresponda a los valores de la tabla de arriba, revise el caso por ejemplo de: GeographyKey 10. Haga clic en Siguiente. En porcentaje de datos para prueba no coloque 30%. En máximo número de casos en el conjunto de datos de prueba no coloque nada, borre el valor.
  • 25. 11. En la página Finalización del asistente hago lo siguiente: En Nombre de la estructura de minería de datos, escriba Targeted Mailing. En Nombre del modelo de minería de datos, escriba TM_Decision_Tree. Active la casilla de verificación Permitir obtención de detalles. Haga clic en Finalizar.
  • 26. 2. Modificar el modelo Targeted Mailing En esta tarea se definirá dos modelos de minería (estructuras) de adicionales al algoritmo de árboles de decisión mediante la ficha Modelos de minería de datos del Diseñador de minería de datos. En esta tarea, definirá un modelo Naive Bayes y un modelo Clustering. a. Crear un modelo Microsoft Clustering Para crear un modelo de minería de datos de clúster debe ejecutar los siguientes pasos: 1. Cambie a la ficha Modelos de minería de datos del Diseñador de minería de datos en Business Intelligence Development Studio. Observe que el diseñador muestra dos columnas: una para la estructura de minería de datos y otra para el modelo de minería de datos inicial, que creó en la tarea anterior de esta lección
  • 27. 2. Haga clic con el botón secundario en la columna Estructura y seleccione Nuevo modelo de minería de datos. 3. Se abrirá el cuadro de diálogo Nuevo modelo de minería de datos. En Nombre del modelo, escriba TM_Clustering. En Nombre del algoritmo, seleccione Clústeres de Microsoft.
  • 28. 4. Aparece un modelo nuevo en la ficha Modelos de minería de datos del Diseñador de minería de datos.
  • 29. b. Crear un modelo Microsoft Naive Bayes Para crear un modelo Naive Bayes: 1. En la ficha Modelos de minería de datos del Diseñador de minería de datos, haga clic con el botón secundario en la columna Estructura y seleccione Nuevo modelo de minería de datos. 2. Se abrirá el cuadro de diálogo Nuevo modelo de minería de datos. En Nombre del modelo, escriba TM_NaiveBayes. En Nombre del algoritmo, seleccione Bayes naive de Microsoft..
  • 30. 3. Aparece un modelo nuevo en la ficha Modelos de minería de datos. Aunque puede modificar el uso y las propiedades de la columna para todos los modelos de la ficha, en este laboratorio, no es necesario hacer cambios en el modelo TM_NaiveBayes.
  • 31. c. Procesar los modelos de minería de datos
  • 32. Esto permitirá que la base de datos Analysis Services se implemente en el equipo servidor y los modelos de minería de datos se procesen.
  • 33. 3. Explorar los modelos Targeted Mailing Una vez que se procesen los modelos de su proyecto, podrá verlos utilizando la ficha Visor de modelos de minería de datos del Diseñador de minería de datos. Puede utilizar la lista Modelos de minería de datos, ubicada en la parte superior de la ficha, para examinar los modelos individuales en la estructura de minería de datos. Las secciones siguientes describen cómo explorar los modelos de minería de datos en los visores. Modelo Microsoft Decision Tree Modelo Microsoft Clustering Modelo Microsoft Naive Bayes
  • 34. Ficha Árbol de decisión 2. En la ficha Árbol de decisión, puede examinar los modelos de árbol que componen un modelo de minería de datos. Si hubiera más árboles, podría utilizar el cuadro Árbol para elegir uno diferente, en este caso dado que contiene un único atributo de predicción (Bike Buyer), sólo hay un árbol para ver. 3. El visor muestra por defecto los primeros tres niveles del árbol, si el árbol contiene menos se mostrará sólo los niveles existentes, puede ver más niveles utilizando el control deslizante Mostrar nivel o la lista Expansión predeterminada.
  • 35. La ficha Red de dependencias muestra las relaciones entre los atributos que contribuyen a la capacidad de predicción del modelo de minería de datos. El nodo central, representa el atributo de predicción del modelo de minería de datos. Cada nodo adyacente representa un atributo que afecta al resultado del atributo de predicción. Utilice el control de la izquierda para controlar la intensidad de los vínculos que se muestran. Si desplaza el control hacia abajo, se mostrarán los vínculos de mayor intensidad. Si hace clic en un nodo de la red puede consultar la leyenda de color situada en la parte inferior, si predice o es predicho.