SlideShare una empresa de Scribd logo
1 de 36
PRUEBA DE CONCEPTO
PROYECTO FINAL DE MÓDULO
GUSTAVO ROJAS -NAZARENA DORADO - NOEMI TICONA DOCENTE: ING. DAVID ENRIQUE MENDOZA GUTIÉRREZ
GRUPO #6 :
- MARIA NAZARENA DORADO MEDEIROS
- GUSTAVO RENE ROJAS VALDEZ
- NOEMI TICONA ANGLES
Trabajaremos con el SQL
Server Analysis Services
(SSAS) que permite crear una
esquema para administrar los
objetos de una base de datos
de Analysis Services definidas
por: Cubos OLAP (Primera
parte del curso) Modelos de
minería de datos. (Segunda
parte del curso)
HERRAMIENTAS DEL SQL SERVER
El Microsoft SQL Server ofrece 4 de
herramientas principales:
ENTORNOS DE DESARROLLO
El SSAS ofrece un entorno integrado para crear
cubos OLAP y modelos de minería de datos y
trabajar con ellos, conformado por:
SQL Server Management Studio. Herramienta
principal para administrar Database Engine (Motor
de base de datos) y escribir código de Transact-
SQL.
SQL Server Business Intelligence Development
studio. Es el Microsoft Visual Studio con tipos de
proyecto adicionales específicos de Business
Intelligence. Es el entorno que se utilizará para
desarrollar soluciones de Analysis Services,
Integration Services y Reporting Services usando
plantillas específicas.
OBJETIVOS
 Crear una base de datos de Analysis Services, agregar un origen de datos, crear una
vista de origen de datos y modificar una vista de origenes de datos para preparar
una nueva base de datos que se va a utilizar para la minería de datos.
 Crear un escenario de modelos de minería de datos para predecir la respuesta de
clientes ante una campaña de correo directo
 Crear y utilizar los algoritmos de minería de datos, los visores del modelo de minería
de datos y las herramientas de minería de datos:
 Árboles de decisión de Microsoft
 Clústeres de Microsoft Bayes
 naive de Microsoft
CONCEPTOS A CONOCER PARA EL
PROCESO DE MINERÍA DE DATOS.
 Plantilla de proyecto. Permite crea un proyecto vacío del tipo seleccionado en el que se
definen objetos del Database Engine o del Analysis Services.
 Origenes de datos. Es una conexión de datos que se administra en el proyecto y se
implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde
residen los datos del origen.
 Vista de origenes de datos. Son vistas unificadas de los metadatos, desde las tablas y
vistas seleccionadas en los orígenes de datos
TAREAS
1. Crear un proyecto de Analysis Services basado en una plantilla de proyecto del SSAS.
2. 2. Agregar uno o varios origenes de datos.
3. 3. Crear una vista de origen de datos.
4. 4. Modificar una vista de origen de datos.
Estas tarea son comunes a cuando se desea crear y trabajar con un cubo OLAP
1. Crear un proyecto de Analysis Services
Un proyecto de SSAS permite definir un esquema que contiene los objetos de
una BD del Analysis Services, estos es modelos de minería de datos y objetos
complementarios.
Para crear un proyecto de Analysis Services
a. Abra el Business Intelligence Development Studio.
b. b. En el menú Archivo, seleccione Nuevo y haga clic en Proyecto.
c. Seleccione Proyecto de Analysis Services en el panel Plantillas
d. Denomine nombre al Proyecto Prueba de Concepto 1
e. Haga clic en Aceptar.
2. Crear un origen de datos Un origen de datos es una conexión de datos que se administra en el
proyecto y se implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde
residen los datos del origen.
Para crear un origen de datos
1. Seleccione la carpeta Orígenes de datos y luego Nuevo
origen de datos en el Explorador de soluciones
3. Se abrirá el Asistente para orígenes de datos, haga clic en Siguiente.
4. Haga clic en Nuevo para agregar una conexión a las bases de datos, se abrirá el cuadro de diálogo
Administrador de conexión.
5. En la lista Nombre del servidor, seleccione el servidor en el que se aloja la base de datos AdventureWorksDW
(seleccione localhost si la base de datos se aloja en el servidor local.)
6.Se selecciona la Base de Datos y le damos
Siguiente
7. En asistente de orígenes seleccionamos
Utilizar la cuenta de servicio.
9. Presione el boton Finalizar.
10. El nuevo origen de datos, Adventure Works DW, aparecerá en la carpeta Orígenes de datos
del Explorador de soluciones.
imagen
3. Crear una vista de origen de datos
Una vista de origen de datos es una abstracción del origen de datos, permite modificar la estructura de los datos (sin modificar
los objetos de la base de datos original) para que sean más significativos en el contexto del proyecto. Se puede seleccionar
tablas, establecer relaciones entre ellas, adicionar columnas calculadas y vistas con nombre.
Para crear una vista de origen de datos
1. En el Explorador de soluciones, haga clic con el botón secundario en Vistas de origen de datos y seleccione Nueva
vista de origen de datos.
2. Se abrirá el Asistente para vistas de origen de
datos.
3. En la página Seleccionar un origen de datos, el
origen de datos Adventure Works DW que se creó
en la última tarea aparecerá seleccionado de forma
predeterminada en Orígenes de datos relacionales.
Haga clic en Siguiente.
4. En la página Seleccionar tablas y vistas, seleccione las siguientes tablas y vistas, use la flecha
derecha para incluirlas: dbo.ProspectiveBuyer dbo.vAssocSeqLineItems dbo.vAssocSeqOrders
dbo.vTargetMail dbo.vTimeSeries
presione Siguiente.
5. En la página Finalizando el asistente, la vista de origen de datos tendrá el nombre Adventure
Works DW de forma predeterminada. Haga clic en Finalizar.
6. Se abrirá el Diseñador de vistas de origen de datos para mostrar la vista de
origen de datos Adventure Works DW.En la cual Arrastre la columna hasta la
tabla vAssocSeqOrders y colóquela en la columna OrderNumber.
Crear una estructura del modelo de minería de datos Targeted Mailing
El primer paso para crear un escenario de correo directo consiste en utilizar el Asistente para
minería de datos para crear la estructura de minería de datos y luego un modelo de minería de
datos de árboles de decisión. Para crear una estructura de minería de datos para un escenario de
correo directo
1. En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de
datos y seleccione Nueva estructura de minería de datos. Se abrirá el Asistente para minería de
datos.
2. En la página de inicio del Asistente para
minería de datos, haga clic en Siguiente.
3. En la página Seleccionar el método de definición,
compruebe que la opción A partir de una base de datos
relacional o un almacén de datos se ha seleccionado y, a
continuación, haga clic en Siguiente.
4. En la página Seleccionar la técnica de
minería de datos, en ¿Qué técnica de minería
de datos desea utilizar?, seleccione Árboles de
decisión de Microsoft.
5. En la página Seleccionar vista de origen de datos,
observe que Adventure Works DW se ha seleccionado de
forma predeterminada. Haga clic en Explorar para ver las
tablas de la vista de origen de datos. Presione siguiente. .
6. En la página Especificar tipos de tablas, active la casilla de verificación de la
columna Escenario, situada junto a la tabla vTargetMail; a continuación, haga clic
en Siguiente.
7. En la página Especificar los datos de entrenamiento,
seleccione las siguiente columnas:
8.En la página Especificar el contenido y el tipo de
datos de las columnas, haga clic en Detectar. Un
algoritmo usará los datos de la vista y
determinará si las columnas numéricas contienen
valores continuos o discretos.
10. Después de hacer clic en Detectar, compruebe que las entradas de las columnas Tipo de contenido y
Tipo de datos tengan la configuración especificada en la siguiente tabla.
Usted debe de modificar para que corresponda a los valores de la tabla de arriba, revise el caso por ejemplo
de: GeographyKey
11. Haga clic en Siguiente.
En porcentaje de datos para prueba no coloque 30%. En máximo número de casos en el conjunto de datos
de prueba no coloque nada, borre el valor.
12. En la página Finalización del asistente hago lo siguiente: En Nombre de la estructura de
minería de datos, escriba Targeted Mailing. En Nombre del modelo de minería de datos, escriba
TM_Decision_Tree. Active la casilla de verificación Permitir obtención de detalles. Haga clic en
Finalizar.
2. Modificar el modelo Targeted Mailing En esta tarea se definirá dos modelos de minería
(estructuras) de adicionales al algoritmo de árboles de decisión mediante la ficha Modelos de
minería de datos del Diseñador de minería de datos. En esta tarea, definirá un modelo Naive
Bayes y un modelo Clustering. a. Crear un modelo Microsoft Clustering Para crear un modelo de
minería de datos de clúster debe ejecutar los siguientes pasos: 1. Cambie a la ficha Modelos de
minería de datos del Diseñador de minería de datos en Business Intelligence Development
Studio.
Observe que el diseñador muestra dos columnas: una para
la estructura de minería de datos y otra para el modelo de
minería de datos inicial, que creó en la tarea anterior de
esta lección
2. Haga clic con el botón secundario en la
columna Estructura y seleccione Nuevo
modelo de minería de datos.
3. Se abrirá el cuadro de diálogo Nuevo modelo de
minería de datos. En Nombre del modelo, escriba
TM_Clustering. En Nombre del algoritmo, seleccione
Clústeres de Microsoft.
4. Aparece un modelo nuevo en la ficha Modelos de
minería de datos del Diseñador de minería de datos.
b. Crear un modelo Microsoft Naive Bayes Para crear un modelo Naive Bayes: 1. En la ficha
Modelos de minería de datos del Diseñador de minería de datos, haga clic con el botón
secundario en la columna Estructura y seleccione Nuevo modelo de minería de datos. 2. Se
abrirá el cuadro de diálogo Nuevo modelo de minería de datos. En Nombre del modelo, escriba
TM_NaiveBayes. En Nombre del algoritmo, seleccione Bayes naive de Microsoft..
3. Aparece un modelo nuevo en la ficha Modelos de minería de datos. Aunque puede
modificar el uso y las propiedades de la columna para todos los modelos de la ficha, en este
laboratorio, no es necesario hacer cambios en el modelo TM_NaiveBayes.
c. Procesar los modelos de minería de datos
Esto permitirá que la base de datos Analysis Services se implemente en el equipo servidor y los
modelos de minería de datos se procesen.
3. Explorar los modelos Targeted Mailing Una vez que se procesen los modelos de su
proyecto, podrá verlos utilizando la ficha Visor de modelos de minería de datos del
Diseñador de minería de datos.
Puede utilizar la lista Modelos de minería de datos, ubicada en la parte superior de la ficha, para examinar los
modelos individuales en la estructura de minería de datos.
Las secciones siguientes describen cómo explorar los modelos de minería de datos en los visores. Modelo
Microsoft Decision Tree Modelo Microsoft Clustering Modelo Microsoft Naive Bayes
Ficha Árbol de decisión 2. En la ficha Árbol de decisión, puede examinar los modelos de árbol que componen
un modelo de minería de datos. Si hubiera más árboles, podría utilizar el cuadro Árbol para elegir uno
diferente, en este caso dado que contiene un único atributo de predicción (Bike Buyer), sólo hay un árbol para
ver. 3. El visor muestra por defecto los primeros tres niveles del árbol, si el árbol contiene menos se mostrará
sólo los niveles existentes, puede ver más niveles utilizando el control deslizante Mostrar nivel o la lista
Expansión predeterminada.
La ficha Red de dependencias muestra las relaciones entre los atributos que contribuyen a la
capacidad de predicción del modelo de minería de datos.
El nodo central, representa el atributo de predicción del modelo de minería de datos. Cada nodo
adyacente representa un atributo que afecta al resultado del atributo de predicción. Utilice el control de
la izquierda para controlar la intensidad de los vínculos que se muestran. Si desplaza el control hacia
abajo, se mostrarán los vínculos de mayor intensidad. Si hace clic en un nodo de la red puede consultar la
leyenda de color situada en la parte inferior, si predice o es predicho.
GRACIAS POR SU
ATENCIÓN

Más contenido relacionado

La actualidad más candente

MongoDB Database Replication
MongoDB Database ReplicationMongoDB Database Replication
MongoDB Database ReplicationMehdi Valikhani
 
Large Table Partitioning with PostgreSQL and Django
 Large Table Partitioning with PostgreSQL and Django Large Table Partitioning with PostgreSQL and Django
Large Table Partitioning with PostgreSQL and DjangoEDB
 
Lenguaje estructurado sql
Lenguaje estructurado sqlLenguaje estructurado sql
Lenguaje estructurado sqlDiego Sánchez
 
Building Data Intensive Analytic Application on Top of Delta Lakes
Building Data Intensive Analytic Application on Top of Delta LakesBuilding Data Intensive Analytic Application on Top of Delta Lakes
Building Data Intensive Analytic Application on Top of Delta LakesDatabricks
 
PySpark Best Practices
PySpark Best PracticesPySpark Best Practices
PySpark Best PracticesCloudera, Inc.
 
Mastering the MongoDB Shell
Mastering the MongoDB ShellMastering the MongoDB Shell
Mastering the MongoDB ShellMongoDB
 
Cuadro Comparativo Bd
Cuadro Comparativo BdCuadro Comparativo Bd
Cuadro Comparativo Bdalinacarrion
 
Java and SPARQL
Java and SPARQLJava and SPARQL
Java and SPARQLRaji Ghawi
 
Degrading Performance? You Might be Suffering From the Small Files Syndrome
Degrading Performance? You Might be Suffering From the Small Files SyndromeDegrading Performance? You Might be Suffering From the Small Files Syndrome
Degrading Performance? You Might be Suffering From the Small Files SyndromeDatabricks
 
Capítulo07 usodediagramasflujodatos
Capítulo07 usodediagramasflujodatosCapítulo07 usodediagramasflujodatos
Capítulo07 usodediagramasflujodatosRicardo Guzman
 
Programación MySQL-Ejercicios
Programación MySQL-EjerciciosProgramación MySQL-Ejercicios
Programación MySQL-Ejerciciostestgrupocomex
 
Json in Postgres - the Roadmap
 Json in Postgres - the Roadmap Json in Postgres - the Roadmap
Json in Postgres - the RoadmapEDB
 
Creación Indices y Constraints en bases de datos de SQL Server.pptx
Creación Indices y Constraints en bases de datos de SQL Server.pptxCreación Indices y Constraints en bases de datos de SQL Server.pptx
Creación Indices y Constraints en bases de datos de SQL Server.pptxPedro Figueroa
 
Delta from a Data Engineer's Perspective
Delta from a Data Engineer's PerspectiveDelta from a Data Engineer's Perspective
Delta from a Data Engineer's PerspectiveDatabricks
 
Advanced SQL
Advanced SQLAdvanced SQL
Advanced SQLSabiha M
 
[215]네이버콘텐츠통계서비스소개 김기영
[215]네이버콘텐츠통계서비스소개 김기영[215]네이버콘텐츠통계서비스소개 김기영
[215]네이버콘텐츠통계서비스소개 김기영NAVER D2
 

La actualidad más candente (20)

MongoDB Database Replication
MongoDB Database ReplicationMongoDB Database Replication
MongoDB Database Replication
 
Large Table Partitioning with PostgreSQL and Django
 Large Table Partitioning with PostgreSQL and Django Large Table Partitioning with PostgreSQL and Django
Large Table Partitioning with PostgreSQL and Django
 
Lenguaje estructurado sql
Lenguaje estructurado sqlLenguaje estructurado sql
Lenguaje estructurado sql
 
Calculo relacional
Calculo relacionalCalculo relacional
Calculo relacional
 
Building Data Intensive Analytic Application on Top of Delta Lakes
Building Data Intensive Analytic Application on Top of Delta LakesBuilding Data Intensive Analytic Application on Top of Delta Lakes
Building Data Intensive Analytic Application on Top of Delta Lakes
 
PySpark Best Practices
PySpark Best PracticesPySpark Best Practices
PySpark Best Practices
 
Mastering the MongoDB Shell
Mastering the MongoDB ShellMastering the MongoDB Shell
Mastering the MongoDB Shell
 
Cuadro Comparativo Bd
Cuadro Comparativo BdCuadro Comparativo Bd
Cuadro Comparativo Bd
 
Prepared statement
Prepared statementPrepared statement
Prepared statement
 
Java and SPARQL
Java and SPARQLJava and SPARQL
Java and SPARQL
 
Degrading Performance? You Might be Suffering From the Small Files Syndrome
Degrading Performance? You Might be Suffering From the Small Files SyndromeDegrading Performance? You Might be Suffering From the Small Files Syndrome
Degrading Performance? You Might be Suffering From the Small Files Syndrome
 
Get to know PostgreSQL!
Get to know PostgreSQL!Get to know PostgreSQL!
Get to know PostgreSQL!
 
Capítulo07 usodediagramasflujodatos
Capítulo07 usodediagramasflujodatosCapítulo07 usodediagramasflujodatos
Capítulo07 usodediagramasflujodatos
 
Programación MySQL-Ejercicios
Programación MySQL-EjerciciosProgramación MySQL-Ejercicios
Programación MySQL-Ejercicios
 
Json in Postgres - the Roadmap
 Json in Postgres - the Roadmap Json in Postgres - the Roadmap
Json in Postgres - the Roadmap
 
Creación Indices y Constraints en bases de datos de SQL Server.pptx
Creación Indices y Constraints en bases de datos de SQL Server.pptxCreación Indices y Constraints en bases de datos de SQL Server.pptx
Creación Indices y Constraints en bases de datos de SQL Server.pptx
 
Stored procedure
Stored procedureStored procedure
Stored procedure
 
Delta from a Data Engineer's Perspective
Delta from a Data Engineer's PerspectiveDelta from a Data Engineer's Perspective
Delta from a Data Engineer's Perspective
 
Advanced SQL
Advanced SQLAdvanced SQL
Advanced SQL
 
[215]네이버콘텐츠통계서비스소개 김기영
[215]네이버콘텐츠통계서비스소개 김기영[215]네이버콘텐츠통계서비스소개 김기영
[215]네이버콘텐츠통계서비스소개 김기영
 

Similar a Presentación de Minería de Datos_ Adventure Works

Similar a Presentación de Minería de Datos_ Adventure Works (20)

Sql server 2012
Sql  server 2012Sql  server 2012
Sql server 2012
 
Tarea4
Tarea4Tarea4
Tarea4
 
Guía para la creación de cubos de datos
Guía para la creación de cubos de datosGuía para la creación de cubos de datos
Guía para la creación de cubos de datos
 
Reportes y graficos en .net
Reportes y graficos en .net Reportes y graficos en .net
Reportes y graficos en .net
 
Microsoft access
Microsoft accessMicrosoft access
Microsoft access
 
Conexion mysql
Conexion mysqlConexion mysql
Conexion mysql
 
Universidad tecnológica de tehuacán datamart
Universidad tecnológica de tehuacán datamartUniversidad tecnológica de tehuacán datamart
Universidad tecnológica de tehuacán datamart
 
Toturial aplicacion base de datos jsp
Toturial aplicacion base de datos jspToturial aplicacion base de datos jsp
Toturial aplicacion base de datos jsp
 
Resumen Semana 3 Topicos
Resumen Semana 3 TopicosResumen Semana 3 Topicos
Resumen Semana 3 Topicos
 
Vb access
Vb accessVb access
Vb access
 
Vb access
Vb accessVb access
Vb access
 
Vb access
Vb accessVb access
Vb access
 
Vb access
Vb accessVb access
Vb access
 
Lozada ivonne-Principales características de Access que se necesita para elab...
Lozada ivonne-Principales características de Access que se necesita para elab...Lozada ivonne-Principales características de Access que se necesita para elab...
Lozada ivonne-Principales características de Access que se necesita para elab...
 
Lenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-proLenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-pro
 
Lenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-proLenguaje de-programacion-iii-visual-fox-pro
Lenguaje de-programacion-iii-visual-fox-pro
 
Práctica guiada1
Práctica guiada1Práctica guiada1
Práctica guiada1
 
Cubos ppt
Cubos pptCubos ppt
Cubos ppt
 
Leo
LeoLeo
Leo
 
ADO NET.ppt
ADO NET.pptADO NET.ppt
ADO NET.ppt
 

Último

Descubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundialDescubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundialyajhairatapia
 
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023ANDECE
 
NOM-002-STPS-2010, combate contra incendio.pptx
NOM-002-STPS-2010, combate contra incendio.pptxNOM-002-STPS-2010, combate contra incendio.pptx
NOM-002-STPS-2010, combate contra incendio.pptxJairReyna1
 
Fisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdfFisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdfJessLeonelVargasJimn
 
Físicas 1: Ecuaciones Dimensionales y Vectores
Físicas 1: Ecuaciones Dimensionales y VectoresFísicas 1: Ecuaciones Dimensionales y Vectores
Físicas 1: Ecuaciones Dimensionales y VectoresSegundo Silva Maguiña
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)ssuser6958b11
 
Sistema de Base de Datos (Rubén Alberto)
Sistema de Base de Datos (Rubén Alberto)Sistema de Base de Datos (Rubén Alberto)
Sistema de Base de Datos (Rubén Alberto)mendezruben1901
 
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...Arquitecto Alejandro Gomez cornejo muñoz
 
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfCONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfErikNivor
 
SOUDAL: Soluciones de sellado, pegado y hermeticidad
SOUDAL: Soluciones de sellado, pegado y hermeticidadSOUDAL: Soluciones de sellado, pegado y hermeticidad
SOUDAL: Soluciones de sellado, pegado y hermeticidadANDECE
 
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptxNayeliZarzosa1
 
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBRQUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBRyanimarca23
 
Electricidad y electronica industrial unidad 1
Electricidad y electronica industrial unidad 1Electricidad y electronica industrial unidad 1
Electricidad y electronica industrial unidad 1victorrodrigues972054
 
Sistema de Gestión de Freelancers (Base de Datos)
Sistema de Gestión de Freelancers (Base de Datos)Sistema de Gestión de Freelancers (Base de Datos)
Sistema de Gestión de Freelancers (Base de Datos)dianamateo1513
 
Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para PlataformasSegundo Silva Maguiña
 
Electromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdfElectromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdfAnonymous0pBRsQXfnx
 
Peligros de Excavaciones y Zanjas presentacion
Peligros de Excavaciones y Zanjas presentacionPeligros de Excavaciones y Zanjas presentacion
Peligros de Excavaciones y Zanjas presentacionOsdelTacusiPancorbo
 
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinaciónEstacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinaciónAlexisHernandez885688
 
Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.ALEJANDROLEONGALICIA
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfIsbelRodrguez
 

Último (20)

Descubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundialDescubrimiento de la penicilina en la segunda guerra mundial
Descubrimiento de la penicilina en la segunda guerra mundial
 
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
Centro Integral del Transporte de Metro de Madrid (CIT). Premio COAM 2023
 
NOM-002-STPS-2010, combate contra incendio.pptx
NOM-002-STPS-2010, combate contra incendio.pptxNOM-002-STPS-2010, combate contra incendio.pptx
NOM-002-STPS-2010, combate contra incendio.pptx
 
Fisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdfFisiología del azufre en plantas S.S.pdf
Fisiología del azufre en plantas S.S.pdf
 
Físicas 1: Ecuaciones Dimensionales y Vectores
Físicas 1: Ecuaciones Dimensionales y VectoresFísicas 1: Ecuaciones Dimensionales y Vectores
Físicas 1: Ecuaciones Dimensionales y Vectores
 
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
VIRUS FITOPATÓGENOS (GENERALIDADES EN PLANTAS)
 
Sistema de Base de Datos (Rubén Alberto)
Sistema de Base de Datos (Rubén Alberto)Sistema de Base de Datos (Rubén Alberto)
Sistema de Base de Datos (Rubén Alberto)
 
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
MEC. FLUIDOS - Análisis Diferencial del Movimiento de un Fluido -GRUPO5 sergi...
 
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdfCONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
CONSTRUCCIONES II - SEMANA 01 - REGLAMENTO NACIONAL DE EDIFICACIONES.pdf
 
SOUDAL: Soluciones de sellado, pegado y hermeticidad
SOUDAL: Soluciones de sellado, pegado y hermeticidadSOUDAL: Soluciones de sellado, pegado y hermeticidad
SOUDAL: Soluciones de sellado, pegado y hermeticidad
 
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
5.1 MATERIAL COMPLEMENTARIO Sesión 02.pptx
 
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBRQUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
QUIMICA ORGANICA I ENOLES Y ENAMINAS LIBR
 
Electricidad y electronica industrial unidad 1
Electricidad y electronica industrial unidad 1Electricidad y electronica industrial unidad 1
Electricidad y electronica industrial unidad 1
 
Sistema de Gestión de Freelancers (Base de Datos)
Sistema de Gestión de Freelancers (Base de Datos)Sistema de Gestión de Freelancers (Base de Datos)
Sistema de Gestión de Freelancers (Base de Datos)
 
Parámetros de Perforación y Voladura. para Plataformas
Parámetros de  Perforación y Voladura. para PlataformasParámetros de  Perforación y Voladura. para Plataformas
Parámetros de Perforación y Voladura. para Plataformas
 
Electromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdfElectromagnetismo Fisica FisicaFisica.pdf
Electromagnetismo Fisica FisicaFisica.pdf
 
Peligros de Excavaciones y Zanjas presentacion
Peligros de Excavaciones y Zanjas presentacionPeligros de Excavaciones y Zanjas presentacion
Peligros de Excavaciones y Zanjas presentacion
 
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinaciónEstacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
Estacionamientos, Existen 3 tipos, y tienen diferentes ángulos de inclinación
 
Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.Flujo potencial, conceptos básicos y ejemplos resueltos.
Flujo potencial, conceptos básicos y ejemplos resueltos.
 
Historia de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdfHistoria de la Arquitectura II, 1era actividad..pdf
Historia de la Arquitectura II, 1era actividad..pdf
 

Presentación de Minería de Datos_ Adventure Works

  • 1. PRUEBA DE CONCEPTO PROYECTO FINAL DE MÓDULO GUSTAVO ROJAS -NAZARENA DORADO - NOEMI TICONA DOCENTE: ING. DAVID ENRIQUE MENDOZA GUTIÉRREZ GRUPO #6 : - MARIA NAZARENA DORADO MEDEIROS - GUSTAVO RENE ROJAS VALDEZ - NOEMI TICONA ANGLES
  • 2. Trabajaremos con el SQL Server Analysis Services (SSAS) que permite crear una esquema para administrar los objetos de una base de datos de Analysis Services definidas por: Cubos OLAP (Primera parte del curso) Modelos de minería de datos. (Segunda parte del curso) HERRAMIENTAS DEL SQL SERVER El Microsoft SQL Server ofrece 4 de herramientas principales:
  • 3. ENTORNOS DE DESARROLLO El SSAS ofrece un entorno integrado para crear cubos OLAP y modelos de minería de datos y trabajar con ellos, conformado por: SQL Server Management Studio. Herramienta principal para administrar Database Engine (Motor de base de datos) y escribir código de Transact- SQL. SQL Server Business Intelligence Development studio. Es el Microsoft Visual Studio con tipos de proyecto adicionales específicos de Business Intelligence. Es el entorno que se utilizará para desarrollar soluciones de Analysis Services, Integration Services y Reporting Services usando plantillas específicas.
  • 4. OBJETIVOS  Crear una base de datos de Analysis Services, agregar un origen de datos, crear una vista de origen de datos y modificar una vista de origenes de datos para preparar una nueva base de datos que se va a utilizar para la minería de datos.  Crear un escenario de modelos de minería de datos para predecir la respuesta de clientes ante una campaña de correo directo  Crear y utilizar los algoritmos de minería de datos, los visores del modelo de minería de datos y las herramientas de minería de datos:  Árboles de decisión de Microsoft  Clústeres de Microsoft Bayes  naive de Microsoft
  • 5. CONCEPTOS A CONOCER PARA EL PROCESO DE MINERÍA DE DATOS.  Plantilla de proyecto. Permite crea un proyecto vacío del tipo seleccionado en el que se definen objetos del Database Engine o del Analysis Services.  Origenes de datos. Es una conexión de datos que se administra en el proyecto y se implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde residen los datos del origen.  Vista de origenes de datos. Son vistas unificadas de los metadatos, desde las tablas y vistas seleccionadas en los orígenes de datos
  • 6. TAREAS 1. Crear un proyecto de Analysis Services basado en una plantilla de proyecto del SSAS. 2. 2. Agregar uno o varios origenes de datos. 3. 3. Crear una vista de origen de datos. 4. 4. Modificar una vista de origen de datos. Estas tarea son comunes a cuando se desea crear y trabajar con un cubo OLAP
  • 7. 1. Crear un proyecto de Analysis Services Un proyecto de SSAS permite definir un esquema que contiene los objetos de una BD del Analysis Services, estos es modelos de minería de datos y objetos complementarios. Para crear un proyecto de Analysis Services a. Abra el Business Intelligence Development Studio. b. b. En el menú Archivo, seleccione Nuevo y haga clic en Proyecto.
  • 8. c. Seleccione Proyecto de Analysis Services en el panel Plantillas d. Denomine nombre al Proyecto Prueba de Concepto 1 e. Haga clic en Aceptar.
  • 9. 2. Crear un origen de datos Un origen de datos es una conexión de datos que se administra en el proyecto y se implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde residen los datos del origen. Para crear un origen de datos 1. Seleccione la carpeta Orígenes de datos y luego Nuevo origen de datos en el Explorador de soluciones
  • 10. 3. Se abrirá el Asistente para orígenes de datos, haga clic en Siguiente. 4. Haga clic en Nuevo para agregar una conexión a las bases de datos, se abrirá el cuadro de diálogo Administrador de conexión.
  • 11. 5. En la lista Nombre del servidor, seleccione el servidor en el que se aloja la base de datos AdventureWorksDW (seleccione localhost si la base de datos se aloja en el servidor local.)
  • 12. 6.Se selecciona la Base de Datos y le damos Siguiente 7. En asistente de orígenes seleccionamos Utilizar la cuenta de servicio.
  • 13. 9. Presione el boton Finalizar.
  • 14. 10. El nuevo origen de datos, Adventure Works DW, aparecerá en la carpeta Orígenes de datos del Explorador de soluciones. imagen 3. Crear una vista de origen de datos Una vista de origen de datos es una abstracción del origen de datos, permite modificar la estructura de los datos (sin modificar los objetos de la base de datos original) para que sean más significativos en el contexto del proyecto. Se puede seleccionar tablas, establecer relaciones entre ellas, adicionar columnas calculadas y vistas con nombre. Para crear una vista de origen de datos 1. En el Explorador de soluciones, haga clic con el botón secundario en Vistas de origen de datos y seleccione Nueva vista de origen de datos.
  • 15. 2. Se abrirá el Asistente para vistas de origen de datos. 3. En la página Seleccionar un origen de datos, el origen de datos Adventure Works DW que se creó en la última tarea aparecerá seleccionado de forma predeterminada en Orígenes de datos relacionales. Haga clic en Siguiente.
  • 16. 4. En la página Seleccionar tablas y vistas, seleccione las siguientes tablas y vistas, use la flecha derecha para incluirlas: dbo.ProspectiveBuyer dbo.vAssocSeqLineItems dbo.vAssocSeqOrders dbo.vTargetMail dbo.vTimeSeries presione Siguiente.
  • 17. 5. En la página Finalizando el asistente, la vista de origen de datos tendrá el nombre Adventure Works DW de forma predeterminada. Haga clic en Finalizar.
  • 18. 6. Se abrirá el Diseñador de vistas de origen de datos para mostrar la vista de origen de datos Adventure Works DW.En la cual Arrastre la columna hasta la tabla vAssocSeqOrders y colóquela en la columna OrderNumber.
  • 19. Crear una estructura del modelo de minería de datos Targeted Mailing El primer paso para crear un escenario de correo directo consiste en utilizar el Asistente para minería de datos para crear la estructura de minería de datos y luego un modelo de minería de datos de árboles de decisión. Para crear una estructura de minería de datos para un escenario de correo directo 1. En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos. Se abrirá el Asistente para minería de datos.
  • 20. 2. En la página de inicio del Asistente para minería de datos, haga clic en Siguiente. 3. En la página Seleccionar el método de definición, compruebe que la opción A partir de una base de datos relacional o un almacén de datos se ha seleccionado y, a continuación, haga clic en Siguiente.
  • 21. 4. En la página Seleccionar la técnica de minería de datos, en ¿Qué técnica de minería de datos desea utilizar?, seleccione Árboles de decisión de Microsoft. 5. En la página Seleccionar vista de origen de datos, observe que Adventure Works DW se ha seleccionado de forma predeterminada. Haga clic en Explorar para ver las tablas de la vista de origen de datos. Presione siguiente. .
  • 22. 6. En la página Especificar tipos de tablas, active la casilla de verificación de la columna Escenario, situada junto a la tabla vTargetMail; a continuación, haga clic en Siguiente.
  • 23. 7. En la página Especificar los datos de entrenamiento, seleccione las siguiente columnas: 8.En la página Especificar el contenido y el tipo de datos de las columnas, haga clic en Detectar. Un algoritmo usará los datos de la vista y determinará si las columnas numéricas contienen valores continuos o discretos.
  • 24. 10. Después de hacer clic en Detectar, compruebe que las entradas de las columnas Tipo de contenido y Tipo de datos tengan la configuración especificada en la siguiente tabla. Usted debe de modificar para que corresponda a los valores de la tabla de arriba, revise el caso por ejemplo de: GeographyKey 11. Haga clic en Siguiente. En porcentaje de datos para prueba no coloque 30%. En máximo número de casos en el conjunto de datos de prueba no coloque nada, borre el valor.
  • 25. 12. En la página Finalización del asistente hago lo siguiente: En Nombre de la estructura de minería de datos, escriba Targeted Mailing. En Nombre del modelo de minería de datos, escriba TM_Decision_Tree. Active la casilla de verificación Permitir obtención de detalles. Haga clic en Finalizar.
  • 26. 2. Modificar el modelo Targeted Mailing En esta tarea se definirá dos modelos de minería (estructuras) de adicionales al algoritmo de árboles de decisión mediante la ficha Modelos de minería de datos del Diseñador de minería de datos. En esta tarea, definirá un modelo Naive Bayes y un modelo Clustering. a. Crear un modelo Microsoft Clustering Para crear un modelo de minería de datos de clúster debe ejecutar los siguientes pasos: 1. Cambie a la ficha Modelos de minería de datos del Diseñador de minería de datos en Business Intelligence Development Studio. Observe que el diseñador muestra dos columnas: una para la estructura de minería de datos y otra para el modelo de minería de datos inicial, que creó en la tarea anterior de esta lección
  • 27. 2. Haga clic con el botón secundario en la columna Estructura y seleccione Nuevo modelo de minería de datos. 3. Se abrirá el cuadro de diálogo Nuevo modelo de minería de datos. En Nombre del modelo, escriba TM_Clustering. En Nombre del algoritmo, seleccione Clústeres de Microsoft.
  • 28. 4. Aparece un modelo nuevo en la ficha Modelos de minería de datos del Diseñador de minería de datos.
  • 29. b. Crear un modelo Microsoft Naive Bayes Para crear un modelo Naive Bayes: 1. En la ficha Modelos de minería de datos del Diseñador de minería de datos, haga clic con el botón secundario en la columna Estructura y seleccione Nuevo modelo de minería de datos. 2. Se abrirá el cuadro de diálogo Nuevo modelo de minería de datos. En Nombre del modelo, escriba TM_NaiveBayes. En Nombre del algoritmo, seleccione Bayes naive de Microsoft..
  • 30. 3. Aparece un modelo nuevo en la ficha Modelos de minería de datos. Aunque puede modificar el uso y las propiedades de la columna para todos los modelos de la ficha, en este laboratorio, no es necesario hacer cambios en el modelo TM_NaiveBayes.
  • 31. c. Procesar los modelos de minería de datos
  • 32. Esto permitirá que la base de datos Analysis Services se implemente en el equipo servidor y los modelos de minería de datos se procesen.
  • 33. 3. Explorar los modelos Targeted Mailing Una vez que se procesen los modelos de su proyecto, podrá verlos utilizando la ficha Visor de modelos de minería de datos del Diseñador de minería de datos. Puede utilizar la lista Modelos de minería de datos, ubicada en la parte superior de la ficha, para examinar los modelos individuales en la estructura de minería de datos. Las secciones siguientes describen cómo explorar los modelos de minería de datos en los visores. Modelo Microsoft Decision Tree Modelo Microsoft Clustering Modelo Microsoft Naive Bayes
  • 34. Ficha Árbol de decisión 2. En la ficha Árbol de decisión, puede examinar los modelos de árbol que componen un modelo de minería de datos. Si hubiera más árboles, podría utilizar el cuadro Árbol para elegir uno diferente, en este caso dado que contiene un único atributo de predicción (Bike Buyer), sólo hay un árbol para ver. 3. El visor muestra por defecto los primeros tres niveles del árbol, si el árbol contiene menos se mostrará sólo los niveles existentes, puede ver más niveles utilizando el control deslizante Mostrar nivel o la lista Expansión predeterminada.
  • 35. La ficha Red de dependencias muestra las relaciones entre los atributos que contribuyen a la capacidad de predicción del modelo de minería de datos. El nodo central, representa el atributo de predicción del modelo de minería de datos. Cada nodo adyacente representa un atributo que afecta al resultado del atributo de predicción. Utilice el control de la izquierda para controlar la intensidad de los vínculos que se muestran. Si desplaza el control hacia abajo, se mostrarán los vínculos de mayor intensidad. Si hace clic en un nodo de la red puede consultar la leyenda de color situada en la parte inferior, si predice o es predicho.