Análisis de Datos
Multidimensional
MSC . PATRICIA SUAREZ
2016
Introducción
 Desde el inicio de la era de la computación las organizaciones han usado los datos
desde sus sistemas operacionales para atender sus necesidades de información. Algunas
proporcionan acceso directo a la información contenida dentro de las aplicaciones
operacionales. Otras, han extraído los datos desde sus bases de datos operacionales
para combinarlos de varias formas no estructuradas, en su intento por atender a los
usuarios en sus necesidades de información.
Introducción
 Ambos métodos han evolucionado a través del tiempo y ahora las organizaciones
manejan datos aislados e incompletos, sobre los cuales, en la mayoría de las veces, se
toman importantes decisiones.
Introducción
 La razón principal es la manera en que han evolucionado las computadoras, basadas en
las tecnologías de información y los sistemas. La mayoría de las organizaciones hacen lo
posible por conseguir buena información, pero el logro de ese objetivo depende,
fundamentalmente, tanto de su arquitectura actual, como del hardware y software.
Inteligencia de Negocios
Inteligencia de Negocios
 OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical
Processing). Es una solución utilizada en el campo de la Inteligencia de Negocios
(Business Intelligence), la cual consiste en consultas a estructuras multidimensionales (o
Cubos OLAP y que le permite al usuario tener una visión más rápida e interactiva de los
mismos. Se usa en informes de negocios de ventas, márketing, informes de dirección,
minería de datos y áreas similares.
 Este análisis, también conocido como análisis del hipercubo, organiza la información
según los parámetros que se consulten, de manera tal que a partir de estructuras
multidimensionales que contienen los datos resumidos de Sistemas Transaccionales,
conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendrá
la información requerida.
 Es muy utilizado en el área de marketing, ventas, informes, etc., especialmente porque las
respuestas a consultas complejas se obtienen muy rápidamente y además porque puede
obtener los datos tanto de una fuente externa como de una base interna.
Inteligencia de Negocios
 La razón de usar OLAP para las consultas es la velocidad de respuesta. Una base de
datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta
estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es
relativamente lenta. Un modelo mejor para búsquedas, aunque peor desde el punto de
vista operativo, es una base de datos multidimensional. La principal característica que
potencia a OLAP, es que es lo más rápido a la hora de hacer selects, en contraposición
con OLTP que es la mejor opción para INSERTS, UPDATES Y DELETES.
Inteligencia de Negocios
Existen algunas clasificaciones entre las implementaciones OLAP.
 ROLAP es una implementación OLAP que almacena los datos en un motor relacional.
Típicamente, los datos son detallados, evitando las agregaciones y las tablas se
encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja son
estrella ó copo de nieve, aunque es posible trabajar sobre cualquier base de datos
relacional. La arquitectura está compuesta por un servidor de banco de datos relacional
y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esa
arquitectura es que permite el análisis de una enorme cantidad de datos
Inteligencia de Negocios
 MOLAP es una implementación OLAP que almacena los datos en una base de datos
multidimensional. Para optimizar los tiempos de respuesta, el resumen de la infomación es
usualmente calculado por adelantado. Estos valores precalculados o agregaciones son
la base de las ganacias de desempeño de este sistema. Algunos sistemas utilizan técnicas
de compresión de datos para disminuir el espacio de almacenamiento en disco debido
a los valores precalculados.
Inteligencia de Negocios
 HOLAP (Hybrid OLAP) almacena algunos datos en un motor relacional y otros en
una base de datos multidimensional

 DOLAP es un OLAP orientado a equipos de escritorio (Desktop OLAP). Trae toda la
información que necesita analizar desde la base de datos relacional y la guarda en el
escritorio. Desde ese momento, todas las consultas y análisis son hechas contra los datos
guardados en el escritorio.
Inteligencia de Negocios
Acciones básicas sobre la información:
 Segmentar: ventas por producto y por trimestre
 Filtrar: informe de ventas en un año
 Profundizar (Drill down): Los datos de trimestre 2 y miramos el desglose de abril, mayo, junio.
 Sintetizar (Drill up): Deshacer el desglose anterior y vuelves al desglose por trimestre.
 Rotar (Drill anywhere): Cuando en lugar de pasar de un desglose por trimestres a uno mensual,
te interesa un desglose por familia de producto, o por nacionalidad, es decir, por una
característica de una jerarquía distinta a la que lo estas viendo actualmente.
Analisis Avanzados y Predictivos
 Los análisis avanzados y predictivos ofrecen a los usuarios de negocio avanzados y a los
analistas de información la posibilidad de investigar exhaustivamente para buscar los
detalles escondidos tras los resultados específicos de rendimiento. Estos requisitos
exceden normalmente los límites del análisis OLAP.
 Se ha creado un entorno que permite a los usuarios pasar de forma transparente del
análisis OLAP básico al análisis estadístico avanzado y a las posibilidades completas.
Nuestra tecnología se ha diseñado específicamente para ofrecer la funcionalidad
común de las herramientas estadísticas de una forma que resulte familiar y coherente
con el uso cotidiano.
Inteligencia de Negocios
SEGMENTAR
 Análisis de conjuntos y segmentación de datos. Los usuarios pueden aprovechar los
conjuntos de análisis que proporciona para realizar una segmentación sencilla de los
datos. Pueden manipular y combinar conjuntos de datos definidos por el usuario para
obtener un conjunto de datos depurado para su posterior análisis. El análisis de conjuntos
es una parte esencial de la plataforma y se puede aplicar al almacén de datos
completo. Los conjuntos se pueden personalizar por usuario, compartir en un
departamento, combinar mediante operadores lógicos y reutilizar en múltiples informes.
Inteligencia de Negocios
FILTRAR
 Los usuarios pueden crear informes personalizados seleccionando objetos de datos para
mostrar y definir calificaciones como criterios de filtro del informe. Ofrece varios enfoques
guiados para crear informes nuevos - desde preguntas paso a paso al usuario para
seleccionar y calificar los atributos y métricas empresariales hasta asistentes que
incorporan plantillas y filtros existentes.
Inteligencia de Negocios
PROFUNDIZAR
 Proporciona el conjunto más amplio y exhaustivo de funciones analíticas disponible en
cualquier plataforma. Incluyen desde simples funciones matemáticas, como totales
actualizados, a cálculos estadísticos avanzados como los f-tests. Los paquetes analíticos
disponibles incluyen bibliotecas de funciones estadísticas, financieras y matemáticas. Esto
permite a la empresa obtener respuesta a todos sus análisis utilizando una sola
plataforma.
Inteligencia de Negocios
SINTETIZAR
 La plataforma ofrece análisis SQL iterativo multi-paso, una técnica que combina las
funciones analíticas integradas con proceso de base de datos. Preguntas complejas que
son imposibles de resolver con otras soluciones obtienen respuesta de forma rápida y
fácil. Al combinar potentes funciones analíticas con el motor de generación SQL líder en
el sector, pone al alcance de todos los usuarios posibilidades inigualables de análisis.
Inteligencia de Negocios
ROTAR
 Cambiar dimensiones unas con otras. Ej.: salidas por ítems vs. ítems por salida. Cuando en
lugar de pasar de un desglose por trimestres a uno mensual, te interesa un desglose por
familia de producto, o por nacionalidad, es decir, por una característica de una jerarquía
distinta a la que lo estas viendo actualmente.
Inteligencia de Negocios

Analisis multidemensional.pdf

  • 1.
  • 2.
    Introducción  Desde elinicio de la era de la computación las organizaciones han usado los datos desde sus sistemas operacionales para atender sus necesidades de información. Algunas proporcionan acceso directo a la información contenida dentro de las aplicaciones operacionales. Otras, han extraído los datos desde sus bases de datos operacionales para combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus necesidades de información.
  • 3.
    Introducción  Ambos métodoshan evolucionado a través del tiempo y ahora las organizaciones manejan datos aislados e incompletos, sobre los cuales, en la mayoría de las veces, se toman importantes decisiones.
  • 4.
    Introducción  La razónprincipal es la manera en que han evolucionado las computadoras, basadas en las tecnologías de información y los sistemas. La mayoría de las organizaciones hacen lo posible por conseguir buena información, pero el logro de ese objetivo depende, fundamentalmente, tanto de su arquitectura actual, como del hardware y software.
  • 5.
  • 6.
    Inteligencia de Negocios OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la Inteligencia de Negocios (Business Intelligence), la cual consiste en consultas a estructuras multidimensionales (o Cubos OLAP y que le permite al usuario tener una visión más rápida e interactiva de los mismos. Se usa en informes de negocios de ventas, márketing, informes de dirección, minería de datos y áreas similares.
  • 7.
     Este análisis,también conocido como análisis del hipercubo, organiza la información según los parámetros que se consulten, de manera tal que a partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas Transaccionales, conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendrá la información requerida.  Es muy utilizado en el área de marketing, ventas, informes, etc., especialmente porque las respuestas a consultas complejas se obtienen muy rápidamente y además porque puede obtener los datos tanto de una fuente externa como de una base interna.
  • 8.
    Inteligencia de Negocios La razón de usar OLAP para las consultas es la velocidad de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para búsquedas, aunque peor desde el punto de vista operativo, es una base de datos multidimensional. La principal característica que potencia a OLAP, es que es lo más rápido a la hora de hacer selects, en contraposición con OLTP que es la mejor opción para INSERTS, UPDATES Y DELETES.
  • 9.
    Inteligencia de Negocios Existenalgunas clasificaciones entre las implementaciones OLAP.  ROLAP es una implementación OLAP que almacena los datos en un motor relacional. Típicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas. Los esquemas más comunes sobre los que se trabaja son estrella ó copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La arquitectura está compuesta por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esa arquitectura es que permite el análisis de una enorme cantidad de datos
  • 10.
    Inteligencia de Negocios MOLAP es una implementación OLAP que almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la infomación es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganacias de desempeño de este sistema. Algunos sistemas utilizan técnicas de compresión de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados.
  • 11.
    Inteligencia de Negocios HOLAP (Hybrid OLAP) almacena algunos datos en un motor relacional y otros en una base de datos multidimensional   DOLAP es un OLAP orientado a equipos de escritorio (Desktop OLAP). Trae toda la información que necesita analizar desde la base de datos relacional y la guarda en el escritorio. Desde ese momento, todas las consultas y análisis son hechas contra los datos guardados en el escritorio.
  • 12.
    Inteligencia de Negocios Accionesbásicas sobre la información:  Segmentar: ventas por producto y por trimestre  Filtrar: informe de ventas en un año  Profundizar (Drill down): Los datos de trimestre 2 y miramos el desglose de abril, mayo, junio.  Sintetizar (Drill up): Deshacer el desglose anterior y vuelves al desglose por trimestre.  Rotar (Drill anywhere): Cuando en lugar de pasar de un desglose por trimestres a uno mensual, te interesa un desglose por familia de producto, o por nacionalidad, es decir, por una característica de una jerarquía distinta a la que lo estas viendo actualmente.
  • 13.
    Analisis Avanzados yPredictivos  Los análisis avanzados y predictivos ofrecen a los usuarios de negocio avanzados y a los analistas de información la posibilidad de investigar exhaustivamente para buscar los detalles escondidos tras los resultados específicos de rendimiento. Estos requisitos exceden normalmente los límites del análisis OLAP.  Se ha creado un entorno que permite a los usuarios pasar de forma transparente del análisis OLAP básico al análisis estadístico avanzado y a las posibilidades completas. Nuestra tecnología se ha diseñado específicamente para ofrecer la funcionalidad común de las herramientas estadísticas de una forma que resulte familiar y coherente con el uso cotidiano.
  • 14.
    Inteligencia de Negocios SEGMENTAR Análisis de conjuntos y segmentación de datos. Los usuarios pueden aprovechar los conjuntos de análisis que proporciona para realizar una segmentación sencilla de los datos. Pueden manipular y combinar conjuntos de datos definidos por el usuario para obtener un conjunto de datos depurado para su posterior análisis. El análisis de conjuntos es una parte esencial de la plataforma y se puede aplicar al almacén de datos completo. Los conjuntos se pueden personalizar por usuario, compartir en un departamento, combinar mediante operadores lógicos y reutilizar en múltiples informes.
  • 15.
    Inteligencia de Negocios FILTRAR Los usuarios pueden crear informes personalizados seleccionando objetos de datos para mostrar y definir calificaciones como criterios de filtro del informe. Ofrece varios enfoques guiados para crear informes nuevos - desde preguntas paso a paso al usuario para seleccionar y calificar los atributos y métricas empresariales hasta asistentes que incorporan plantillas y filtros existentes.
  • 16.
    Inteligencia de Negocios PROFUNDIZAR Proporciona el conjunto más amplio y exhaustivo de funciones analíticas disponible en cualquier plataforma. Incluyen desde simples funciones matemáticas, como totales actualizados, a cálculos estadísticos avanzados como los f-tests. Los paquetes analíticos disponibles incluyen bibliotecas de funciones estadísticas, financieras y matemáticas. Esto permite a la empresa obtener respuesta a todos sus análisis utilizando una sola plataforma.
  • 17.
    Inteligencia de Negocios SINTETIZAR La plataforma ofrece análisis SQL iterativo multi-paso, una técnica que combina las funciones analíticas integradas con proceso de base de datos. Preguntas complejas que son imposibles de resolver con otras soluciones obtienen respuesta de forma rápida y fácil. Al combinar potentes funciones analíticas con el motor de generación SQL líder en el sector, pone al alcance de todos los usuarios posibilidades inigualables de análisis.
  • 18.
    Inteligencia de Negocios ROTAR Cambiar dimensiones unas con otras. Ej.: salidas por ítems vs. ítems por salida. Cuando en lugar de pasar de un desglose por trimestres a uno mensual, te interesa un desglose por familia de producto, o por nacionalidad, es decir, por una característica de una jerarquía distinta a la que lo estas viendo actualmente.
  • 19.