1. Grupo Nº 5-6 Integrantes: Bajaña Dian Guamán Ernesto Pino Jefferson Rodas Jonathan John Sánchez Robinson Ortiz Andrés Reyes
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22. En resumen, los sistemas OLAP organizan los datos por intersecciones multidimensionales. Esta organización, acompañada por una herramienta de interfaz para rotar y anidar dimensiones, permite a los usuarios visualizar rápidamente los valores en detalle, patrones, variaciones y anomalías de los datos que estarían de otra manera ocultos por un análisis dimensional simple. A mayor número de dimensiones, mayor es la profundidad del análisis.
23. El miembro cerezas de la dimensión producto atraviesa todas las intersecciones de las dimensiones de tiempo y mercado. Una vez mas, slice-and-dice en el mundo OLAP está identificando un subconjunto de celdas, que el usuario ha seleccionado para visualizar, desde el cubo maestro OLAP almacenado en un servidor de datos. Cerezas Uvas Manzanas Dimensión Tiempo 1º 2º 3º 4º Trimestres Atlanta Chicago Denver Detroit Melones
24.
25. Dimensión Tiempo Año Trimestre Meses TIEMPO 2001 Q1 Enero Febrero Marzo Q2 Abril Mayo Junio Q3 Julio Agosto Septiembre Q4 Octubre Noviembre Diciembre
26.
27.
28. MODO DE ALMACENAMIENTO OLAP El concepto << a la velocidad del pensamiento >> que tanto hemos usado se evidencia en el sistema OLAP (análisis multidimensional) porque los datos encuentran almacenados en estructuras que está optimizadas para permitir la rápida recuperación de la información. Definición de los tres paradigmas de almacenamiento para dar apoyo al análisis multidimensional. Desktop file: Conocido como DOLAP (desktop online analytical processing). Los datos son almacenados en máquinas individuales de sobremesa, este tipo de almacenamiento es útil cuando se deseen desarrollar aplicaciones de pequeña escala donde no existe la necesidad de que múltiples usuarios tengan que acceder a los datos como si fuera un servidor central.
29. Servidores de base de datos relacionales: Es conocido como ROLAP (relational omline analytical processing). Almacena datos en una base de datos relacional permite tomar ventaja de uno de sus más grandes beneficios, el almacenamiento de inmensas cantidades de datos. Lo que suele ocurrir es que el rendimiento de recuperación de la información para ROLAP frecuentemente no es tan rápido como otras opciones de almacenamiento. Servidores de base de datos multidimensionales: Es conocido como MOLAP (Multidimensional online analytical processing). Los datos son colocados en estructuras especiales que se encuentran en un servidor central. MOLAP ofrecen mayor rendimiento de recuperación de información. Un cuarto modo de almacenamiento es HOLAP (Hybryd online analytical processing) no es realmente un modo diferente de almacenamiento de datos. Más bien es la habilidad para diseminar los datos a través de la base de datos relacionales y multidimensionales con la finalidad de obtener lo mejor de ambos sistemas.
30. CUALES SON LAS TECNOLOGIAS DE BUSINESS INTELLIGENCE ? Cuando una compañía decide implementar una plataforma Business Intelligence, existen consideraciones que necesitan ser tomadas en cuenta relativas al tipo de plataformas en la que será construida, las herramientas y tecnologías que será usada para convertir los datos originales o << crudos>> en información útil. LA VISION MACRO El proceso que utiliza las plataformas de Business Intelligence para capturar datos y convertirlos en información útil puede ser simple o muy complicada.
31. ¿dónde están los datos almacenados? Conociendo las limitaciones de los sistemas operacionales, muchas compañías consiguen cubrir sus necesidades de análisis e información de negocios acumulando los mismos en un repositorio colectivo. Este repositorio no sólo tienen nombre especial que podría ser bastante familiar: el data warehouse, sino que también identifica lugar donde los datos son almacenados en la plataforma de Business Intelligence. ¿cómo se obtienen los datos para los usuarios de negocio? Una vez descarga la información en el data warehouse, los procesos de análisis e información de negocio son responsables de tomar los datos desde el data warehouse, ensamblar los datos, presentarlos en formatos amigables para el usuario (tales como hojas de cálculo y gráficos) y entregar esta información a los usuarios de negocio.
32. Para llevar a cabo los procesos de análisis y presentación de informes, de las herramientas de front-end recogen los datos de data warehouse y presentan estos a los usuarios en forma de informes. HERRAMIENTAS DE front -end DATA MINING Puede ser utilizado para analizar las relaciones detalladas de los datos; por ejemplo, data mining puede responder preguntas relacionadas sobre qué cliente deben atacarse para un nuevo producto.
33. DATA WAREHOUSE El objetivo primario de data warehouse es apoyar a los procesos de análisis y presentación de informes, los requirimientos de los usuarios tienen influencia en su diseño y contenido. En la práctica esto tiene doble significado, uno de los usuarios definen la información que les ayudará a ellos a tomar las mejores decisiones rápidamente y dos para que los profesionales de tecnología puedan construir un data warehouse para alcanzar sus necesidades. Esta práctica es más exitosa cuando los usuarios y los especialistas en tecnologías comparten los mismos lineamientos sobre cuáles son las necesidades de la organización y como un data warehouse cumple con estos requerimientos.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49. GRUPO Nº 6 INTEGRANTES : ROBINSON ORTIZ V. JOHN SANCHEZ V. ANDRES REYES C.
50.
51. CompUSA Inc. ha pasado por varias transformaciones en su funcionamiento. Inicialmente la compañía vendía directamente a clientes de empresas, pero luego abrió sus ventas al mercado minorista. Cabe señalar que desde su inicio hasta el presente esta empresa ha crecido mediante expansión de adquisiciones hasta convertirse en el mayor minorista informático de Norteamérica.
52. El equipo de gestión de operaciones abarca toda la organización e incluye al Director General de cada tienda, Directores regionales, directores de división y ejecutivos corporativos. La empresa no podía realizar comparaciones entre venta en bruto y rentabilidad entre tiendas y regiones; y de la misma manera no podía ofrecer una información que reflejara las ventas en relación a las visitas de los clientes en el día. La idea que hay detrás del Bussines Analytics Data Warehouse era ofrecer una solución ideal para todas las necesidades mediante un solo repositorio centralizado de información y proporcionar los informes para obtener vistas distintas de la misma.
53. La primera fase antes de construir el diseño de datos consistía la recopilación y consolidación de los datos (Análisis de Requerimientos) Una vez incorporada en el diseño la información recibida, se tomó un enfoque iterativo para construir el almacén de datos. Poco a poco se fue añadiendo la información de todos los puntos de venta existentes lo que resultó en una satisfactoria consolidación de los datos. Una vez hecho esto, se podía realizar el estudio del comportamiento de cada uno de los puntos de venta de la empresa y así identificar cuales son las que necesitan una mejora.
54. La aplicación del Bussines Analytics Data Warehouse ayudó en gran parte a la mejora en la toma de decisiones para el buen desempeño de la compañía. En cada tienda, hasta cuatro directores tienen acceso a la información a través de la intranet corporativa obteniendo información de las ventas, margen bruto y servicios que ofrece cada tienda.
55. Otro beneficio, es que permite la recolección de información que puede ser muy importante para identificar el desempeño de cada miembro de una organización o de la actividad de los clientes. El tercer beneficio importante es que se pudo mejorar la productividad y evitar pérdidas manteniendo un almacén de datos que recolecte todos los datos del negocio y colocar estos en hojas de cálculos consolidándolos de una reforma que resulten utilizables.
56. Era muy importante tener en consideración que los datos podían crecer en altas magnitudes por lo que Microsoft SQL-Server fue de gran utilidad para el manejo de estos datos de forma regular Este era un problema común ya que los datos se encontraban en distintos sistemas de origen. Para esto fue necesario validar los datos de los diversos sistemas antes de integrarlos.
57. Muchas veces se solía perder datos durante el sistema de conversión debido a la interfaz del software. Para esto se hizo necesario revisar periódicamente la calidad de datos que se estaban almacenando y si fuere necesario realizar nuevos procesos que permitan mejorar la recolección de datos de los diferentes sistemas. Se puede decir que clave del éxito del almacén de datos dependió mucho del estudio que se realizó en cuanto a las necesidades de la empresa y así almacenar los datos realmente necesarios de manera que se pudiera entregar la información en tiempo casi real para obtener una imagen completa de la actividad diaria del negocio.
58.
59. A pesar de tener un Programa denominado DiscoPlus, los usuarios dependían del departamento de tecnología para conocer la información proveniente de los sistemas transaccionales. Los informes podían ser actualizados con nuevos datos en intervalos semanales y además producir un nuevo informe tomaba varias horas y se requería de la gente de tecnología. Por ello el departamento de tecnología sugirió la implementación de un Data Warehouse y de esta manera se solucionarían los problemas de acceso a la información.
60. Evaluar la funcionalidad de OLAP y de data mining. El equipo llegó a la conclusión que la tecnología OLAP era la mejor opción ya que permitiría el acceso a información detallada y consolidada. Los datos genéricos fueron recopilados desde los puntos de venta para ser almacenados en el data warehouse diariamente. El equipo de Data warehouse utilizó combinaciones de técnicas descriptivas: la segmentación y el clustering. La segmentación consistía en agrupar a los clientes de acuerdo a la frecuencia de compra, tamaño de la compra que luego sería combinada con la información de los clientes inscritos en el DiscoPlus. El clustering evalúa cada grupo segmentado de los clientes para localizar características comunes de cada grupo.
61. Después de almacenar los datos en el data warehouse se creó un cubo OLAP que proporcionaría a los usuarios finales una rápida vista multidimensional de los datos de ventas a clientes. Rápido y fácil acceso a la información por haber aplicado técnicas correctas de análisis para los problemas del negocio. Con las técnicas de segmentación y clustering ha sido creado un perfil para grupos específicos de clientes. Cabe recalcar que el éxito del data mining depende mucho de la calidad de los datos que se almacenan. Por ello esta es la fase más larga y compleja de este proyecto.
62. Producto Uvas Manzanas Melones Cerezas Peras T4 Tiempo T1 T2 T3 Localidad Guayaquil Salinas Milagro
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94. Escalabilidad Ambas bases de datos deben tener la capacidad de manejar el número de usuarios y volúmenes de datos que usted tiene en la actualidad y los que prevé tener en el futuro. Ambas bases de datos deben mantener sus objetivos de rendimiento. Estos objetivos pueden ser divididos en dos categorías: Rendimiento Velocidad de procesamiento de datos Velocidad de recuperación de los datos.
95. En combinación con el rendimiento, las bases de datos relacionales y las OLAP deben tener un mecanismo para gestionar y optimizar los motores de bases de datos como sea necesario. Ambas bases de datos deben tener un mecanismo para administrar la seguridad con la finalidad de tener la garantía de que los usuarios adecuados tienen acceso a los datos correctos. Manejabilidad Seguridad
96. Ambas bases de datos deben cubrir las necesidades de disponibilidad o accesibilidad necesarias para garantizar que el sistema siempre este en funcionamiento y con la posibilidad de ser respaldados o restaurados cuando algo funcione de forma inadecuada. Ambas bases de datos deben permitir a los programadores configurar y adaptar las mismas, tanto como sea necesario para mantener almacenamiento de datos específicos y necesidades de administración. Disponibilidad Adaptación
97. las bases de datos relacionales proporcionan grandes capacidades para introducir actualizaciones. Es importante resaltar que muchas bases de datos OLAP son muy débiles en este aspecto. Las bases de datos relacionales proporcionan un gran soporte para tener acceso a la última información esencialmente en tiempo real. Write Back Tiempo Real
98.
99.
100.
101.
102.
103. PRUEBA DE DISEÑO DE DIMENSIONES: AÑOS Y PRODUCTOS PRUEBA DE DISEÑO DE DIMENSIONES: PRODUCTOS Y CATEGORIA DE PRODUCTOS Tiene sentido No tiene sentido