Historia de la Arquitectura II, 1era actividad..pdf
Presentación de Minería de Datos_ Adventure Works
1. PRUEBA DE CONCEPTO
PROYECTO FINAL DE MÓDULO
GUSTAVO ROJAS -NAZARENA DORADO - NOEMI TICONA DOCENTE: ING. DAVID ENRIQUE MENDOZA GUTIÉRREZ
GRUPO #6 :
- MARIA NAZARENA DORADO MEDEIROS
- GUSTAVO RENE ROJAS VALDEZ
- NOEMI TICONA ANGLES
2. Trabajaremos con el SQL
Server Analysis Services
(SSAS) que permite crear una
esquema para administrar los
objetos de una base de datos
de Analysis Services definidas
por: Cubos OLAP (Primera
parte del curso) Modelos de
minería de datos. (Segunda
parte del curso)
HERRAMIENTAS DEL SQL SERVER
El Microsoft SQL Server ofrece 4 de
herramientas principales:
3. ENTORNOS DE DESARROLLO
El SSAS ofrece un entorno integrado para crear
cubos OLAP y modelos de minería de datos y
trabajar con ellos, conformado por:
SQL Server Management Studio. Herramienta
principal para administrar Database Engine (Motor
de base de datos) y escribir código de Transact-
SQL.
SQL Server Business Intelligence Development
studio. Es el Microsoft Visual Studio con tipos de
proyecto adicionales específicos de Business
Intelligence. Es el entorno que se utilizará para
desarrollar soluciones de Analysis Services,
Integration Services y Reporting Services usando
plantillas específicas.
4. OBJETIVOS
Crear una base de datos de Analysis Services, agregar un origen de datos, crear una
vista de origen de datos y modificar una vista de origenes de datos para preparar
una nueva base de datos que se va a utilizar para la minería de datos.
Crear un escenario de modelos de minería de datos para predecir la respuesta de
clientes ante una campaña de correo directo
Crear y utilizar los algoritmos de minería de datos, los visores del modelo de minería
de datos y las herramientas de minería de datos:
Árboles de decisión de Microsoft
Clústeres de Microsoft Bayes
naive de Microsoft
5. CONCEPTOS A CONOCER PARA EL
PROCESO DE MINERÍA DE DATOS.
Plantilla de proyecto. Permite crea un proyecto vacío del tipo seleccionado en el que se
definen objetos del Database Engine o del Analysis Services.
Origenes de datos. Es una conexión de datos que se administra en el proyecto y se
implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde
residen los datos del origen.
Vista de origenes de datos. Son vistas unificadas de los metadatos, desde las tablas y
vistas seleccionadas en los orígenes de datos
6. TAREAS
1. Crear un proyecto de Analysis Services basado en una plantilla de proyecto del SSAS.
2. 2. Agregar uno o varios origenes de datos.
3. 3. Crear una vista de origen de datos.
4. 4. Modificar una vista de origen de datos.
Estas tarea son comunes a cuando se desea crear y trabajar con un cubo OLAP
7. 1. Crear un proyecto de Analysis Services
Un proyecto de SSAS permite definir un esquema que contiene los objetos de
una BD del Analysis Services, estos es modelos de minería de datos y objetos
complementarios.
Para crear un proyecto de Analysis Services
a. Abra el Business Intelligence Development Studio.
b. b. En el menú Archivo, seleccione Nuevo y haga clic en Proyecto.
8. c. Seleccione Proyecto de Analysis Services en el panel Plantillas
d. Denomine nombre al Proyecto Prueba de Concepto 1
e. Haga clic en Aceptar.
9. 2. Crear un origen de datos Un origen de datos es una conexión de datos que se administra en el
proyecto y se implementa en el (SSAS), contiene el nombre del servidor y la base de datos donde
residen los datos del origen.
Para crear un origen de datos
1. Seleccione la carpeta Orígenes de datos y luego Nuevo
origen de datos en el Explorador de soluciones
10. 3. Se abrirá el Asistente para orígenes de datos, haga clic en Siguiente.
4. Haga clic en Nuevo para agregar una conexión a las bases de datos, se abrirá el cuadro de diálogo
Administrador de conexión.
11. 5. En la lista Nombre del servidor, seleccione el servidor en el que se aloja la base de datos AdventureWorksDW
(seleccione localhost si la base de datos se aloja en el servidor local.)
12. 6.Se selecciona la Base de Datos y le damos
Siguiente
7. En asistente de orígenes seleccionamos
Utilizar la cuenta de servicio.
14. 10. El nuevo origen de datos, Adventure Works DW, aparecerá en la carpeta Orígenes de datos
del Explorador de soluciones.
imagen
3. Crear una vista de origen de datos
Una vista de origen de datos es una abstracción del origen de datos, permite modificar la estructura de los datos (sin modificar
los objetos de la base de datos original) para que sean más significativos en el contexto del proyecto. Se puede seleccionar
tablas, establecer relaciones entre ellas, adicionar columnas calculadas y vistas con nombre.
Para crear una vista de origen de datos
1. En el Explorador de soluciones, haga clic con el botón secundario en Vistas de origen de datos y seleccione Nueva
vista de origen de datos.
15. 2. Se abrirá el Asistente para vistas de origen de
datos.
3. En la página Seleccionar un origen de datos, el
origen de datos Adventure Works DW que se creó
en la última tarea aparecerá seleccionado de forma
predeterminada en Orígenes de datos relacionales.
Haga clic en Siguiente.
16. 4. En la página Seleccionar tablas y vistas, seleccione las siguientes tablas y vistas, use la flecha
derecha para incluirlas: dbo.ProspectiveBuyer dbo.vAssocSeqLineItems dbo.vAssocSeqOrders
dbo.vTargetMail dbo.vTimeSeries
presione Siguiente.
17. 5. En la página Finalizando el asistente, la vista de origen de datos tendrá el nombre Adventure
Works DW de forma predeterminada. Haga clic en Finalizar.
18. 6. Se abrirá el Diseñador de vistas de origen de datos para mostrar la vista de
origen de datos Adventure Works DW.En la cual Arrastre la columna hasta la
tabla vAssocSeqOrders y colóquela en la columna OrderNumber.
19. Crear una estructura del modelo de minería de datos Targeted Mailing
El primer paso para crear un escenario de correo directo consiste en utilizar el Asistente para
minería de datos para crear la estructura de minería de datos y luego un modelo de minería de
datos de árboles de decisión. Para crear una estructura de minería de datos para un escenario de
correo directo
1. En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de
datos y seleccione Nueva estructura de minería de datos. Se abrirá el Asistente para minería de
datos.
20. 2. En la página de inicio del Asistente para
minería de datos, haga clic en Siguiente.
3. En la página Seleccionar el método de definición,
compruebe que la opción A partir de una base de datos
relacional o un almacén de datos se ha seleccionado y, a
continuación, haga clic en Siguiente.
21. 4. En la página Seleccionar la técnica de
minería de datos, en ¿Qué técnica de minería
de datos desea utilizar?, seleccione Árboles de
decisión de Microsoft.
5. En la página Seleccionar vista de origen de datos,
observe que Adventure Works DW se ha seleccionado de
forma predeterminada. Haga clic en Explorar para ver las
tablas de la vista de origen de datos. Presione siguiente. .
22. 6. En la página Especificar tipos de tablas, active la casilla de verificación de la
columna Escenario, situada junto a la tabla vTargetMail; a continuación, haga clic
en Siguiente.
23. 7. En la página Especificar los datos de entrenamiento,
seleccione las siguiente columnas:
8.En la página Especificar el contenido y el tipo de
datos de las columnas, haga clic en Detectar. Un
algoritmo usará los datos de la vista y
determinará si las columnas numéricas contienen
valores continuos o discretos.
24. 10. Después de hacer clic en Detectar, compruebe que las entradas de las columnas Tipo de contenido y
Tipo de datos tengan la configuración especificada en la siguiente tabla.
Usted debe de modificar para que corresponda a los valores de la tabla de arriba, revise el caso por ejemplo
de: GeographyKey
11. Haga clic en Siguiente.
En porcentaje de datos para prueba no coloque 30%. En máximo número de casos en el conjunto de datos
de prueba no coloque nada, borre el valor.
25. 12. En la página Finalización del asistente hago lo siguiente: En Nombre de la estructura de
minería de datos, escriba Targeted Mailing. En Nombre del modelo de minería de datos, escriba
TM_Decision_Tree. Active la casilla de verificación Permitir obtención de detalles. Haga clic en
Finalizar.
26. 2. Modificar el modelo Targeted Mailing En esta tarea se definirá dos modelos de minería
(estructuras) de adicionales al algoritmo de árboles de decisión mediante la ficha Modelos de
minería de datos del Diseñador de minería de datos. En esta tarea, definirá un modelo Naive
Bayes y un modelo Clustering. a. Crear un modelo Microsoft Clustering Para crear un modelo de
minería de datos de clúster debe ejecutar los siguientes pasos: 1. Cambie a la ficha Modelos de
minería de datos del Diseñador de minería de datos en Business Intelligence Development
Studio.
Observe que el diseñador muestra dos columnas: una para
la estructura de minería de datos y otra para el modelo de
minería de datos inicial, que creó en la tarea anterior de
esta lección
27. 2. Haga clic con el botón secundario en la
columna Estructura y seleccione Nuevo
modelo de minería de datos.
3. Se abrirá el cuadro de diálogo Nuevo modelo de
minería de datos. En Nombre del modelo, escriba
TM_Clustering. En Nombre del algoritmo, seleccione
Clústeres de Microsoft.
28. 4. Aparece un modelo nuevo en la ficha Modelos de
minería de datos del Diseñador de minería de datos.
29. b. Crear un modelo Microsoft Naive Bayes Para crear un modelo Naive Bayes: 1. En la ficha
Modelos de minería de datos del Diseñador de minería de datos, haga clic con el botón
secundario en la columna Estructura y seleccione Nuevo modelo de minería de datos. 2. Se
abrirá el cuadro de diálogo Nuevo modelo de minería de datos. En Nombre del modelo, escriba
TM_NaiveBayes. En Nombre del algoritmo, seleccione Bayes naive de Microsoft..
30. 3. Aparece un modelo nuevo en la ficha Modelos de minería de datos. Aunque puede
modificar el uso y las propiedades de la columna para todos los modelos de la ficha, en este
laboratorio, no es necesario hacer cambios en el modelo TM_NaiveBayes.
32. Esto permitirá que la base de datos Analysis Services se implemente en el equipo servidor y los
modelos de minería de datos se procesen.
33. 3. Explorar los modelos Targeted Mailing Una vez que se procesen los modelos de su
proyecto, podrá verlos utilizando la ficha Visor de modelos de minería de datos del
Diseñador de minería de datos.
Puede utilizar la lista Modelos de minería de datos, ubicada en la parte superior de la ficha, para examinar los
modelos individuales en la estructura de minería de datos.
Las secciones siguientes describen cómo explorar los modelos de minería de datos en los visores. Modelo
Microsoft Decision Tree Modelo Microsoft Clustering Modelo Microsoft Naive Bayes
34. Ficha Árbol de decisión 2. En la ficha Árbol de decisión, puede examinar los modelos de árbol que componen
un modelo de minería de datos. Si hubiera más árboles, podría utilizar el cuadro Árbol para elegir uno
diferente, en este caso dado que contiene un único atributo de predicción (Bike Buyer), sólo hay un árbol para
ver. 3. El visor muestra por defecto los primeros tres niveles del árbol, si el árbol contiene menos se mostrará
sólo los niveles existentes, puede ver más niveles utilizando el control deslizante Mostrar nivel o la lista
Expansión predeterminada.
35. La ficha Red de dependencias muestra las relaciones entre los atributos que contribuyen a la
capacidad de predicción del modelo de minería de datos.
El nodo central, representa el atributo de predicción del modelo de minería de datos. Cada nodo
adyacente representa un atributo que afecta al resultado del atributo de predicción. Utilice el control de
la izquierda para controlar la intensidad de los vínculos que se muestran. Si desplaza el control hacia
abajo, se mostrarán los vínculos de mayor intensidad. Si hace clic en un nodo de la red puede consultar la
leyenda de color situada en la parte inferior, si predice o es predicho.