SlideShare una empresa de Scribd logo
1 de 21
CUBOS
Cubos de información
 Los cubos de información o cubos OLAP funcionan como los
cubos de rompecabezas en los juegos, en el juego se trata de
armar los colores y en el data warehouse se trata de organizar
los datos por tablas o relaciones los primeros (el juego) tienen
3 dimensiones, los cubos OLAP tienen un número indefinido
de dimensiones, razón por la cual también reciben el nombre
de hipercubos. Un cubo OLAP contendrá datos de una
determinada variable que se desea analizar, proporcionando
una vista lógica de los datos provistos por el sistema de
información hacia el data warehouse.
CUBOS
Ejemplo
 Dimensiones: Las dimensiones de un cubo son atributos relativos a las
variables, son las perspectivas de análisis de las variables (forman parte de la
tabla de dimensiones). Son catálogos de información general
complementaria a cada uno de los registros de la tabla de hechos. Eje:
producto (diferentes tipos o denominaciones de productos) ,localidades (o
provincia, o regiones, o zonas geográficas) , tiempo (medido de diferentes
maneras, por horas, por días, por meses, por años, ...) tipo de cliente
(casado/soltero, joven/adulto/anciano, ...) . etc
 Variables: También llamadas “indicadores de gestión”, son los datos que
están siendo analizados. Forman parte de la tabla de hechos. Más
formalmente, las variables representan algún aspecto cuantificable o
medible de los objetos o eventos a analizar. Normalmente, las variables son
representadas por valores detallados y numéricos para cada instancia del
objeto o evento medido. Eje: Beneficios, Gastos, Ventas .etc
 Jerarquías: Una jerarquía representa una relación lógica entre dos o más
atributos pertenecientes a un cubo multidimensional; siempre y cuando
posean su correspondiente relación “padre-hijo”.
Formación de Cubos
 Relación: Una relación representa la forma en que dos atributos
interactúan dentro de una jerarquía. Existen básicamente dos
tipos de relaciones:
 Explícitas: son las más comunes y se pueden modelar a partir de
atributos directos y están en línea continua de una jerarquía, por
ejemplo, un país posee una o más provincias y una provincia
pertenece solo a un país.
 Implícitas: son las que ocurren en la vida real, pero su relación
no es de vista directa, por ejemplo, una provincia tiene uno o
más ríos, pero un río pertenece a una o más provincias. Como se
puede observar, este caso se trata de una relación muchos a
muchos.
• Granularidad: La granularidad representa el nivel de detalle al que se
desea almacenar la información sobre el negocio que se esté
analizando. Por ejemplo, los datos referentes a ventas o compras
realizadas por una empresa, pueden registrarse día a día, en cambio, los
datos pertinentes a pagos de sueldos o cuotas de socios, podrán
almacenarse a nivel de mes.
Mientras mayor sea el nivel de detalle de los datos, se tendrán mayores
posibilidades analíticas, ya que los mismos podrán ser resumidos o
sumarizados. Es decir, los datos que posean granularidad fina (nivel de
detalle) podrán ser resumidos hasta obtener una granularidad media o
gruesa. No sucede lo mismo en sentido contrario, ya que por ejemplo, los
datos almacenados con granularidad media podrán resumirse, pero no
tendrán la facultad de ser analizados a nivel de detalle.
 Estrella: Consiste de una gran tabla central conteniendo
información sobre los hechos, y tablas más pequeñas
(relacionadas a la tabla de hechos) con información sobre las
dimensiones. Kimball propone lineamientos prácticos para
construir un esquema estrella pero no presenta una
metodología general.
Modelos de Implementación de un DWH
Taba Hechos
Dim 1
Dim 2
Dim 3
Este modelo debe estar totalmente desnormalizado, es decir que no puede
presentarse en tercera forma normal (3ra FN), es por ello que por ejemplo, la
tabla de dimensión “PRODUCTOS” contiene los campos “Rubro”, “Tipo” y
“NombreProducto”
 Copo de nieve: Este esquema representa una extensión del
modelo en estrella cuando las tablas de dimensiones se
organizan en jerarquías de dimensiones. Existe una tabla de
hechos central que está relacionada con una o más tablas de
dimensiones, quienes a su vez pueden estar relacionadas o
no con una o más tablas de dimensiones. Este modelo es
más cercano a un modelo de entidad relación, que al modelo
en estrella, debido a que sus tablas de dimensiones están
normalizadas.
Modelos de Implementación de un
DWH
 Esquema Constelación: Este modelo está compuesto por una serie
de esquemas en estrella, está formado por una tabla de hechos
principal (“HECHOS_A”) y por una o más tablas de hechos auxiliares
(“HECHOS_B”), las cuales pueden ser sumarizaciones de la principal.
Dichas tablas yacen en el centro del modelo y están relacionadas con
sus respectivas tablas de dimensiones. No es necesario que las
diferentes tablas de hechos compartan las mismas tablas de
dimensiones, ya que, las tablas de hechos auxiliares pueden
vincularse con solo algunas de las tablas de dimensiones asignadas a
la tabla de hechos principal, y también pueden hacerlo con nuevas
tablas de dimensiones.
Modelos de Implementación de un
DWH
OLTP Vs DWH
ROLAP Vs MOLAP
 En el caso de las jerarquías, los atributos que la
componen, también deben estructurarse en forma de
árbol, teniendo en cuenta su respectiva relación
padre-hijo. Se tomará como base para la realización
de los ejemplos, el siguiente esquema en estrella:
CONSTRUCCION DE CUBO
MULTIDIMENSIONAL
1. crear un cubo multidimensional llamado ”Cubo de Ventas”.
2. se crean dos atributos:
 De la tabla de dimensión “PRODUCTOS”, se tomará el campo
Producto” para la creación del atributo denominado:
“PRODUCTOS - Producto”.
 De la tabla dimensión “MARCAS”, se tomará el campo “Marca”
para la creación del atributo denominado: “MARCAS - Marca”
CONSTRUCCION DE CUBO
MULTIDIMENSIONAL «PASOS»
1. También se crea un indicador:
 De la tabla de hechos “VENTAS”, se sumarizará el hecho
“Venta” para crear el indicador denominado: “VENTAS -
Venta”. La fórmula utilizada para crear este indicador es la
siguiente: “VENTAS - Venta” = SUM(VENTAS.Venta).
 Tenemos un cubo multidimensional de dos dimensiones,
cuya representación matricial sería la siguiente:
Se pueden obtener los siguientes indicadores:
Las ventas asociadas al producto “P1” y a la marca “M1” son 40.
Las ventas asociadas al producto “P1” y a la marca “M2” son 25.
Las ventas asociadas al producto “P1” y a la marca “M3” son 60.
 De la tabla de dimensión “CLIENTES”, se tomará el campo
“Cliente” para la creación del atributo denominado:
“CLIENTES - Cliente”.
 De esta manera, ahora tenemos un cubo multidimensional de
tres dimensiones, cuya representación matricial sería la
siguiente:
En este caso los valores del indicador “VENTAS - Venta” están dados
de acuerdo a las ventas de cada producto, de cada marca, a cada cliente.
 De la tabla de dimensión “TIEMPO”, se tomará el campo
“Año” para la creación del atributo denominado: “TIEMPO -
Año”.
 Entonces, la representación matricial del cubo multidimensional
resultante sería la siguiente:
Los valores del indicador “VENTAS - Venta” en este momento,
estarán condicionados por las ventas de cada producto, de cada marca,
a cada cliente, en cada año.
 Software especializado en la creación de cubos
 Pentaho es la solución BI Open Source líder del mercado y la mejor
alternativa a los productos comerciales. Las soluciones que Pentaho
pretende ofrecer se componen fundamentalmente de una infraestructura
de herramientas de análisis e informes integrados con un motor de
workflow de procesos de negocio.
 Mondrian es un servidor OLAP que está escrito en Java.
Permite interactuar con grandes cantidades de datos almacenados en Bases
de Datos relacionales, sin necesidad de utilizar complejas sentencias SQL.
 MS-SQL Server OLAP 2014- . Facilita a los usuarios de empresa la elaboración
de potentes modelizaciones y análisis utilizando un entorno como Microsoft
Office
 IBM Business Analytics es el único que permite que la organización aplique
la analítica en la toma de decisiones, en cualquier momento y en cualquier
lugar .
 Oracle OLAP - una opción de Oracle Database 11g Enterprise Edition.
 Microsoft SQL Server 2005 Analysis Services: ofrece funciones de
procesamiento analítico en línea (OLAP) y minería de datos para
aplicaciones de Business Intelligence. Analysis Services admite OLAP y
permite diseñar, crear y administrar estructuras multidimensionales que
contienen datos agregados desde otros orígenes de datos, como bases de
datos relacionales
Proveedores
 Similaridad y Consultas: La similaridad se trata como una
función de distancia entre los objetos de la base de datos, es
decir la distancia nos puede dar una idea, de que tanto se
parecen y por lo tanto si pueden regresarse como parte de los
resultados de una consulta. Estas consultas pueden manejar un
rango y/o cardinalidad de la respuesta, es decir obtener los k-
vecinos más cercanos. En este tipo de enfoque se destaca la
utilización de estructuras indexadas, b-tree, x-tree y r-tree.
 un árbol B es una estructura de datos de árbol que mantiene
datos ordenados y permite búsquedas, de acceso secuencial,
inserciones y deleciones en tiempo logarítmico. El árbol B es una
generalización de un árbol binario de búsqueda en que un nodo
puede tener más de dos hijos
ALGORITMOS
Algoritmo para Buscar Similaridad en Objetos
 Un árboles de R son estructuras de datos de árboles utilizados
para los métodos de acceso espacial, es decir, para la indexación
de la información multidimensional como coordenadas
geográficas, rectángulos o polígonos.
 un árbol de X (para árbol de nodos eXtended) es una estructura
de árbol índice basado en el árbol R utilizado para almacenar
datos en muchas dimensiones
 Se han diseñado otras estructuras para almacenar en
memoria secundaria o memoria principal [Ho, 1997] para
agilizar ciertas operaciones especiales que se definen sobre
rangos en los cubos de datos, y donde se agilizan las
búsquedas, al realizar pre-cálculos y organizar los
resultados en un orden de tal forma que se pueden realizar
mejor las búsquedas, pues de antemano se sabe que se
busca y cómo conviene organizarlas.
ALGORITMOS
Gracias por su atención

Más contenido relacionado

Similar a Tecnicas de presentacion de Cubos de analisis OLAP.pptx

Similar a Tecnicas de presentacion de Cubos de analisis OLAP.pptx (20)

Bases de datos    introducción
Bases de datos    introducciónBases de datos    introducción
Bases de datos    introducción
 
Diapositivas informatik!
Diapositivas informatik!Diapositivas informatik!
Diapositivas informatik!
 
Accsses
AccssesAccsses
Accsses
 
Funciones de un DBA y tipos de Base de Datos
Funciones de un DBA y tipos de Base de DatosFunciones de un DBA y tipos de Base de Datos
Funciones de un DBA y tipos de Base de Datos
 
Base de datos-Primera Parte-
Base de datos-Primera Parte-Base de datos-Primera Parte-
Base de datos-Primera Parte-
 
Informatica-Base De Datos
Informatica-Base De DatosInformatica-Base De Datos
Informatica-Base De Datos
 
Plantilla 903 icontec
Plantilla 903 icontecPlantilla 903 icontec
Plantilla 903 icontec
 
Churk
ChurkChurk
Churk
 
Plantilla con-normas-icontec (4)
Plantilla con-normas-icontec (4)Plantilla con-normas-icontec (4)
Plantilla con-normas-icontec (4)
 
Silvia
SilviaSilvia
Silvia
 
Base de datos "primera parte"
Base de datos "primera parte"Base de datos "primera parte"
Base de datos "primera parte"
 
Introducción a Bases de Datos
Introducción a Bases de DatosIntroducción a Bases de Datos
Introducción a Bases de Datos
 
Funciones del dba y tipos de bd
Funciones del dba y tipos de bdFunciones del dba y tipos de bd
Funciones del dba y tipos de bd
 
Analisis y mineriadedatos
Analisis y mineriadedatosAnalisis y mineriadedatos
Analisis y mineriadedatos
 
Bases de datos!
Bases de datos!Bases de datos!
Bases de datos!
 
01 introduccion (1)my sql
01 introduccion (1)my sql01 introduccion (1)my sql
01 introduccion (1)my sql
 
Consulta
ConsultaConsulta
Consulta
 
base de datos
base de datosbase de datos
base de datos
 
Consulta
ConsultaConsulta
Consulta
 
Consulta
ConsultaConsulta
Consulta
 

Último

CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxbingoscarlet
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdffredyflores58
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfAntonioGonzalezIzqui
 
Propositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicacionesPropositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicaciones025ca20
 
Sesión N°2_Curso_Ingeniería_Sanitaria.pdf
Sesión N°2_Curso_Ingeniería_Sanitaria.pdfSesión N°2_Curso_Ingeniería_Sanitaria.pdf
Sesión N°2_Curso_Ingeniería_Sanitaria.pdfannavarrom
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAJAMESDIAZ55
 
Falla de san andres y el gran cañon : enfoque integral
Falla de san andres y el gran cañon : enfoque integralFalla de san andres y el gran cañon : enfoque integral
Falla de san andres y el gran cañon : enfoque integralsantirangelcor
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfyoseka196
 
Ingeniería de Tránsito. Proyecto Geométrico de calles y carreteras, es el pro...
Ingeniería de Tránsito. Proyecto Geométrico de calles y carreteras, es el pro...Ingeniería de Tránsito. Proyecto Geométrico de calles y carreteras, es el pro...
Ingeniería de Tránsito. Proyecto Geométrico de calles y carreteras, es el pro...wvernetlopez
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxClaudiaPerez86192
 
Introducción a los sistemas neumaticos.ppt
Introducción a los sistemas neumaticos.pptIntroducción a los sistemas neumaticos.ppt
Introducción a los sistemas neumaticos.pptEduardoCorado
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaXimenaFallaLecca1
 
CLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilCLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilDissneredwinPaivahua
 
hitos del desarrollo psicomotor en niños.docx
hitos del desarrollo psicomotor en niños.docxhitos del desarrollo psicomotor en niños.docx
hitos del desarrollo psicomotor en niños.docxMarcelaArancibiaRojo
 
clases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfclases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfDanielaVelasquez553560
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPJosLuisFrancoCaldern
 
Proyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctricaProyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctricaXjoseantonio01jossed
 
Presentación electricidad y magnetismo.pptx
Presentación electricidad y magnetismo.pptxPresentación electricidad y magnetismo.pptx
Presentación electricidad y magnetismo.pptxYajairaMartinez30
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdfAnthonyTiclia
 

Último (20)

CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptx
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
 
Propositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicacionesPropositos del comportamiento de fases y aplicaciones
Propositos del comportamiento de fases y aplicaciones
 
Sesión N°2_Curso_Ingeniería_Sanitaria.pdf
Sesión N°2_Curso_Ingeniería_Sanitaria.pdfSesión N°2_Curso_Ingeniería_Sanitaria.pdf
Sesión N°2_Curso_Ingeniería_Sanitaria.pdf
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
 
Falla de san andres y el gran cañon : enfoque integral
Falla de san andres y el gran cañon : enfoque integralFalla de san andres y el gran cañon : enfoque integral
Falla de san andres y el gran cañon : enfoque integral
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdf
 
Ingeniería de Tránsito. Proyecto Geométrico de calles y carreteras, es el pro...
Ingeniería de Tránsito. Proyecto Geométrico de calles y carreteras, es el pro...Ingeniería de Tránsito. Proyecto Geométrico de calles y carreteras, es el pro...
Ingeniería de Tránsito. Proyecto Geométrico de calles y carreteras, es el pro...
 
Comite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptxComite Operativo Ciberseguridad 012020.pptx
Comite Operativo Ciberseguridad 012020.pptx
 
Introducción a los sistemas neumaticos.ppt
Introducción a los sistemas neumaticos.pptIntroducción a los sistemas neumaticos.ppt
Introducción a los sistemas neumaticos.ppt
 
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO CersaSesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
Sesión 02 TIPOS DE VALORIZACIONES CURSO Cersa
 
CLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civilCLASE - 01 de construcción 1 ingeniería civil
CLASE - 01 de construcción 1 ingeniería civil
 
hitos del desarrollo psicomotor en niños.docx
hitos del desarrollo psicomotor en niños.docxhitos del desarrollo psicomotor en niños.docx
hitos del desarrollo psicomotor en niños.docx
 
clases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdfclases de dinamica ejercicios preuniversitarios.pdf
clases de dinamica ejercicios preuniversitarios.pdf
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
 
Proyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctricaProyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctrica
 
Presentación electricidad y magnetismo.pptx
Presentación electricidad y magnetismo.pptxPresentación electricidad y magnetismo.pptx
Presentación electricidad y magnetismo.pptx
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
 
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdfVALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
 

Tecnicas de presentacion de Cubos de analisis OLAP.pptx

  • 2.  Los cubos de información o cubos OLAP funcionan como los cubos de rompecabezas en los juegos, en el juego se trata de armar los colores y en el data warehouse se trata de organizar los datos por tablas o relaciones los primeros (el juego) tienen 3 dimensiones, los cubos OLAP tienen un número indefinido de dimensiones, razón por la cual también reciben el nombre de hipercubos. Un cubo OLAP contendrá datos de una determinada variable que se desea analizar, proporcionando una vista lógica de los datos provistos por el sistema de información hacia el data warehouse. CUBOS
  • 4.  Dimensiones: Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de análisis de las variables (forman parte de la tabla de dimensiones). Son catálogos de información general complementaria a cada uno de los registros de la tabla de hechos. Eje: producto (diferentes tipos o denominaciones de productos) ,localidades (o provincia, o regiones, o zonas geográficas) , tiempo (medido de diferentes maneras, por horas, por días, por meses, por años, ...) tipo de cliente (casado/soltero, joven/adulto/anciano, ...) . etc  Variables: También llamadas “indicadores de gestión”, son los datos que están siendo analizados. Forman parte de la tabla de hechos. Más formalmente, las variables representan algún aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numéricos para cada instancia del objeto o evento medido. Eje: Beneficios, Gastos, Ventas .etc  Jerarquías: Una jerarquía representa una relación lógica entre dos o más atributos pertenecientes a un cubo multidimensional; siempre y cuando posean su correspondiente relación “padre-hijo”. Formación de Cubos
  • 5.  Relación: Una relación representa la forma en que dos atributos interactúan dentro de una jerarquía. Existen básicamente dos tipos de relaciones:  Explícitas: son las más comunes y se pueden modelar a partir de atributos directos y están en línea continua de una jerarquía, por ejemplo, un país posee una o más provincias y una provincia pertenece solo a un país.  Implícitas: son las que ocurren en la vida real, pero su relación no es de vista directa, por ejemplo, una provincia tiene uno o más ríos, pero un río pertenece a una o más provincias. Como se puede observar, este caso se trata de una relación muchos a muchos.
  • 6. • Granularidad: La granularidad representa el nivel de detalle al que se desea almacenar la información sobre el negocio que se esté analizando. Por ejemplo, los datos referentes a ventas o compras realizadas por una empresa, pueden registrarse día a día, en cambio, los datos pertinentes a pagos de sueldos o cuotas de socios, podrán almacenarse a nivel de mes. Mientras mayor sea el nivel de detalle de los datos, se tendrán mayores posibilidades analíticas, ya que los mismos podrán ser resumidos o sumarizados. Es decir, los datos que posean granularidad fina (nivel de detalle) podrán ser resumidos hasta obtener una granularidad media o gruesa. No sucede lo mismo en sentido contrario, ya que por ejemplo, los datos almacenados con granularidad media podrán resumirse, pero no tendrán la facultad de ser analizados a nivel de detalle.
  • 7.  Estrella: Consiste de una gran tabla central conteniendo información sobre los hechos, y tablas más pequeñas (relacionadas a la tabla de hechos) con información sobre las dimensiones. Kimball propone lineamientos prácticos para construir un esquema estrella pero no presenta una metodología general. Modelos de Implementación de un DWH Taba Hechos Dim 1 Dim 2 Dim 3 Este modelo debe estar totalmente desnormalizado, es decir que no puede presentarse en tercera forma normal (3ra FN), es por ello que por ejemplo, la tabla de dimensión “PRODUCTOS” contiene los campos “Rubro”, “Tipo” y “NombreProducto”
  • 8.  Copo de nieve: Este esquema representa una extensión del modelo en estrella cuando las tablas de dimensiones se organizan en jerarquías de dimensiones. Existe una tabla de hechos central que está relacionada con una o más tablas de dimensiones, quienes a su vez pueden estar relacionadas o no con una o más tablas de dimensiones. Este modelo es más cercano a un modelo de entidad relación, que al modelo en estrella, debido a que sus tablas de dimensiones están normalizadas. Modelos de Implementación de un DWH
  • 9.  Esquema Constelación: Este modelo está compuesto por una serie de esquemas en estrella, está formado por una tabla de hechos principal (“HECHOS_A”) y por una o más tablas de hechos auxiliares (“HECHOS_B”), las cuales pueden ser sumarizaciones de la principal. Dichas tablas yacen en el centro del modelo y están relacionadas con sus respectivas tablas de dimensiones. No es necesario que las diferentes tablas de hechos compartan las mismas tablas de dimensiones, ya que, las tablas de hechos auxiliares pueden vincularse con solo algunas de las tablas de dimensiones asignadas a la tabla de hechos principal, y también pueden hacerlo con nuevas tablas de dimensiones. Modelos de Implementación de un DWH
  • 12.  En el caso de las jerarquías, los atributos que la componen, también deben estructurarse en forma de árbol, teniendo en cuenta su respectiva relación padre-hijo. Se tomará como base para la realización de los ejemplos, el siguiente esquema en estrella: CONSTRUCCION DE CUBO MULTIDIMENSIONAL
  • 13. 1. crear un cubo multidimensional llamado ”Cubo de Ventas”. 2. se crean dos atributos:  De la tabla de dimensión “PRODUCTOS”, se tomará el campo Producto” para la creación del atributo denominado: “PRODUCTOS - Producto”.  De la tabla dimensión “MARCAS”, se tomará el campo “Marca” para la creación del atributo denominado: “MARCAS - Marca” CONSTRUCCION DE CUBO MULTIDIMENSIONAL «PASOS»
  • 14. 1. También se crea un indicador:  De la tabla de hechos “VENTAS”, se sumarizará el hecho “Venta” para crear el indicador denominado: “VENTAS - Venta”. La fórmula utilizada para crear este indicador es la siguiente: “VENTAS - Venta” = SUM(VENTAS.Venta).  Tenemos un cubo multidimensional de dos dimensiones, cuya representación matricial sería la siguiente: Se pueden obtener los siguientes indicadores: Las ventas asociadas al producto “P1” y a la marca “M1” son 40. Las ventas asociadas al producto “P1” y a la marca “M2” son 25. Las ventas asociadas al producto “P1” y a la marca “M3” son 60.
  • 15.  De la tabla de dimensión “CLIENTES”, se tomará el campo “Cliente” para la creación del atributo denominado: “CLIENTES - Cliente”.  De esta manera, ahora tenemos un cubo multidimensional de tres dimensiones, cuya representación matricial sería la siguiente: En este caso los valores del indicador “VENTAS - Venta” están dados de acuerdo a las ventas de cada producto, de cada marca, a cada cliente.
  • 16.  De la tabla de dimensión “TIEMPO”, se tomará el campo “Año” para la creación del atributo denominado: “TIEMPO - Año”.  Entonces, la representación matricial del cubo multidimensional resultante sería la siguiente: Los valores del indicador “VENTAS - Venta” en este momento, estarán condicionados por las ventas de cada producto, de cada marca, a cada cliente, en cada año.
  • 17.  Software especializado en la creación de cubos  Pentaho es la solución BI Open Source líder del mercado y la mejor alternativa a los productos comerciales. Las soluciones que Pentaho pretende ofrecer se componen fundamentalmente de una infraestructura de herramientas de análisis e informes integrados con un motor de workflow de procesos de negocio.  Mondrian es un servidor OLAP que está escrito en Java. Permite interactuar con grandes cantidades de datos almacenados en Bases de Datos relacionales, sin necesidad de utilizar complejas sentencias SQL.  MS-SQL Server OLAP 2014- . Facilita a los usuarios de empresa la elaboración de potentes modelizaciones y análisis utilizando un entorno como Microsoft Office  IBM Business Analytics es el único que permite que la organización aplique la analítica en la toma de decisiones, en cualquier momento y en cualquier lugar .  Oracle OLAP - una opción de Oracle Database 11g Enterprise Edition.  Microsoft SQL Server 2005 Analysis Services: ofrece funciones de procesamiento analítico en línea (OLAP) y minería de datos para aplicaciones de Business Intelligence. Analysis Services admite OLAP y permite diseñar, crear y administrar estructuras multidimensionales que contienen datos agregados desde otros orígenes de datos, como bases de datos relacionales Proveedores
  • 18.  Similaridad y Consultas: La similaridad se trata como una función de distancia entre los objetos de la base de datos, es decir la distancia nos puede dar una idea, de que tanto se parecen y por lo tanto si pueden regresarse como parte de los resultados de una consulta. Estas consultas pueden manejar un rango y/o cardinalidad de la respuesta, es decir obtener los k- vecinos más cercanos. En este tipo de enfoque se destaca la utilización de estructuras indexadas, b-tree, x-tree y r-tree.  un árbol B es una estructura de datos de árbol que mantiene datos ordenados y permite búsquedas, de acceso secuencial, inserciones y deleciones en tiempo logarítmico. El árbol B es una generalización de un árbol binario de búsqueda en que un nodo puede tener más de dos hijos ALGORITMOS Algoritmo para Buscar Similaridad en Objetos
  • 19.  Un árboles de R son estructuras de datos de árboles utilizados para los métodos de acceso espacial, es decir, para la indexación de la información multidimensional como coordenadas geográficas, rectángulos o polígonos.  un árbol de X (para árbol de nodos eXtended) es una estructura de árbol índice basado en el árbol R utilizado para almacenar datos en muchas dimensiones
  • 20.  Se han diseñado otras estructuras para almacenar en memoria secundaria o memoria principal [Ho, 1997] para agilizar ciertas operaciones especiales que se definen sobre rangos en los cubos de datos, y donde se agilizan las búsquedas, al realizar pre-cálculos y organizar los resultados en un orden de tal forma que se pueden realizar mejor las búsquedas, pues de antemano se sabe que se busca y cómo conviene organizarlas. ALGORITMOS
  • 21. Gracias por su atención