UNIVERSIDAD TECNICA PARTICULAR DE LOJA
La Universidad Católica de Loja
Escuela de Ciencias de la Computación
Titulación de Sistemas Informáticos y Computación
Ejercicios sobre almacenes
Base de Datos Avanzada
Alumno: Carlos Francisco Ojeda Ureña
Docentes: Angel Eduardo Encalada Encalada
Fecha: 26/06/2013
Periodo académico
Abril 2013 - Agosto 2013
Cuestiones de Repaso Capitulo 31
Explique que quieren decir los siguientes términos a la hora de describir
las características de los datos contenidos en un almacén de datos:
Clasificados por temas: El almacén de datos se clasifica por los temas de
mayor importancia para la empresa.
Integrados: En el almacén de datos la mescla datos procedentes de
diferentes sistemas.
Variables en el tiempo: Son aquellos datos del almacén de datos que solo
son válidos temporalmente en un intervalo de tiempo determinado.
No volátiles: Son aquellos datos que no se actualizan en tiempo real más
bien se refrescan en forma periódica.
Explique las diferencias entre los sistemas OLTP (Online
TransactionProcessing) y los almacenes de datos.
Las aplicaciones de OLTP están organizadas para ejecutar las transacciones
para los cuales fueron hechos, como por ejemplo: mover dinero entre
cuentas, un cargo o abono, una devolución de inventario. Por otro lado, un
Data Warehouse está organizado en base a conceptos, como por ejemplo:
clientes, facturas, productos, etc.
Explique los beneficios y los problemas principales asociados con los
almacenes de datos.
Beneficios
La ventaja principal de este tipo de bases de datos radica en las estructuras
en las que se almacena la información en modelos de tablas en estrella, en
copo de nieve, cubos relacionales.
Un Datawarehouse es una base de datos corporativa que se caracteriza por
integrar y depurar información de una o más fuentes distintas, para luego
procesarla permitiendo su análisis desde infinidad de perspectivas y con
grandes velocidades de respuesta.
Este tipo de persistencia de la información es homogénea y fiable, y permite
la consulta y el tratamiento jerarquizado de la misma
Problemas
Al tener un almacén de datos en una empresa los costos pueden resultar
muy altos variando de acuerdo a la implementación pero esto no resulta
una perdida para la empresa ya que a lo largo de unos años su inversión se
verá favorecida obteniendo retornos de inversión bastantes satisfactorios.
Privacidad de los datos.
Infravaloración del esfuerzo necesario para su diseño y creación.
Incremento de los requerimientos de los usuarios
Describa las características y funciones principales de los siguientes
componentes de un almacén de datos.
Gestor De Carga:Realiza todas las operaciones relacionadas con la
extracción, propagación, depuración (limpieza), transformacióny carga de
los datos en el almacén de datos.
Gestor Del Almacén De Datos:En algunos casos el gestor del almacén de
datos también genera perfiles de consultas para determinar qué índices y
agregaciones son apropiadas.
Gestor De Consultas: permiten acceder a los datos y sobre ellos se
conectan herramientas más sofisticadas (OLAP, EIS, minería de datos).
Metadatos: Esta área del datawarehouse almacena todas las definiciones
de los meta datos (datos acerca de los datos) usados por todos los procesos
en el datawarehouse. Los meta datos son usados para una variedad de
propósitos.
Herramientas De Acceso Para Usuario Final: es la parte en que los
usuarios utilizan la solución datawarehouse, para esto necesitan
herramientas que les proporcione acceso a la información generada y
proceder a la toma decisiones estratégicas. Por tanto la comunicación entre
el Almacén deDatos y la herramienta será mediante consultas de tipo ad-
hoc.
Cuáles son las tres técnicas principales que los fabricantes de software
utilizan para implementar herramientas de extracción, limpieza, y
transformación de datos.
Generadores de código
Herramientas de replicación de datos
Motores de transformación dinámica.
Explique la importancia de la gestión de los metadatos y qué relación
tiene con la integración del almacén de datos.
Como se explicó en una pregunta anterior los metadatos son datos sobre
datos pero estos tienen o cumples funciones primordiales que los
convierten en datos muy preciados del almacén ya que se utilizan para:
Extraer y cargar información mapeando las fuentes de datos sobre una
vista común de los datos dentro del almacén.
Gestionar el almacén de datos con la finalidad de automatizar la
producción de tablas de resumen.
Gestiona consultas para dirigir una consulta a la fuente de datos más
apropiada.
Explique las tareas principales asociadas con la administración y gestión
de un almacén de datos.
 Monitorizar la carga de datos desde múltiples fuentes
 Comprobar la calidad y la integridad de los datos
 Gestionar y actualizar los metadatos
 Monitorizar el rendimiento de la base de datos para garantizar unos
tiempos de respuesta cortos a las consultas.
 Auditar la utilización del almacén de datos para atribuir los costes de
los distintos usuarios
 Purgar los datos
 Archivar los datos y realizar copias de seguridad
 Implementar mecanismos de recuperación de fallos gestionar
adecuadamente la seguridad
Explique las diferencias entre un mercado de datos y un almacén de
datos e indique las razones principales para implementar un mercado de
datos.
Un mercado de datos se puede definir como un subconjunto de un almacén
de datos y soporta los requisitos de un departamento o área de negocio en
concreto mientras que el almacén de datos comprante todos los
departamentos de la empresa.
Las principales razones que fomentan la creación de mercados de datos se
deben a que:
Los mercados de datos surgen por la complejidad y elevados recursos
asociados a la implementación de los proyectos de almacenes de datos.
Un almacén de datos al intentar integrar toda la información de la
organización requiere tratar con más; fuentes de datos, plataformas,
requisitos de usuarios, presupuesto, tiempo de desarrollo y personal.
Una solución es enfocarse en una unidad de negocios y crear un mercado de
datos que satisfaga sus requisitos de información.
Proponer un ejemplo de diseño multidimensional (esquema estrella)
para un caso que usted conozca
Consultar al menos 3 herramientas para inteligencia de negocios
describir las características principales.
Microstrategy: Es otra de las herramientas más difundidas, cuya característica
fundamental reside en que provee de las soluciones necesarias a los clientes de
cualquier tipo de empresa o sector funcional de las mismas, con el objetivo de
brindar un marco de ayuda que les permitirá acceder a un mayor conocimiento de
la información que está siendo manejada por la empresa.
Business Objects: Ofrece a los usuarios el acceso constante y de manera sencilla y
clara a los datos relevantes, para facilitar el análisis de la información que ha sido
almacenada, y el posterior desarrollo de distintos informes para mejorar los
procesos globales de la empresa.
Cognos: Este brinda un sistema efectivo para llevar a cabo evaluaciones correctas
de la información y una posterior toma de decisiones adecuada. Cabe destacar que
Cognos cuenta además con una herramienta especial, que ha sido desarrollada
para permitir la realización de modelos, pronósticos y simulaciones de negocios,
con el fin de ofrecer la posibilidad de planificar el futuro de las operaciones.

Cuestiones de repaso_cap_31_utpl

  • 1.
    UNIVERSIDAD TECNICA PARTICULARDE LOJA La Universidad Católica de Loja Escuela de Ciencias de la Computación Titulación de Sistemas Informáticos y Computación Ejercicios sobre almacenes Base de Datos Avanzada Alumno: Carlos Francisco Ojeda Ureña Docentes: Angel Eduardo Encalada Encalada Fecha: 26/06/2013 Periodo académico Abril 2013 - Agosto 2013
  • 2.
    Cuestiones de RepasoCapitulo 31 Explique que quieren decir los siguientes términos a la hora de describir las características de los datos contenidos en un almacén de datos: Clasificados por temas: El almacén de datos se clasifica por los temas de mayor importancia para la empresa. Integrados: En el almacén de datos la mescla datos procedentes de diferentes sistemas. Variables en el tiempo: Son aquellos datos del almacén de datos que solo son válidos temporalmente en un intervalo de tiempo determinado. No volátiles: Son aquellos datos que no se actualizan en tiempo real más bien se refrescan en forma periódica. Explique las diferencias entre los sistemas OLTP (Online TransactionProcessing) y los almacenes de datos. Las aplicaciones de OLTP están organizadas para ejecutar las transacciones para los cuales fueron hechos, como por ejemplo: mover dinero entre cuentas, un cargo o abono, una devolución de inventario. Por otro lado, un Data Warehouse está organizado en base a conceptos, como por ejemplo: clientes, facturas, productos, etc. Explique los beneficios y los problemas principales asociados con los almacenes de datos. Beneficios La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la información en modelos de tablas en estrella, en copo de nieve, cubos relacionales. Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego
  • 3.
    procesarla permitiendo suanálisis desde infinidad de perspectivas y con grandes velocidades de respuesta. Este tipo de persistencia de la información es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma Problemas Al tener un almacén de datos en una empresa los costos pueden resultar muy altos variando de acuerdo a la implementación pero esto no resulta una perdida para la empresa ya que a lo largo de unos años su inversión se verá favorecida obteniendo retornos de inversión bastantes satisfactorios. Privacidad de los datos. Infravaloración del esfuerzo necesario para su diseño y creación. Incremento de los requerimientos de los usuarios Describa las características y funciones principales de los siguientes componentes de un almacén de datos. Gestor De Carga:Realiza todas las operaciones relacionadas con la extracción, propagación, depuración (limpieza), transformacióny carga de los datos en el almacén de datos. Gestor Del Almacén De Datos:En algunos casos el gestor del almacén de datos también genera perfiles de consultas para determinar qué índices y agregaciones son apropiadas. Gestor De Consultas: permiten acceder a los datos y sobre ellos se conectan herramientas más sofisticadas (OLAP, EIS, minería de datos). Metadatos: Esta área del datawarehouse almacena todas las definiciones de los meta datos (datos acerca de los datos) usados por todos los procesos en el datawarehouse. Los meta datos son usados para una variedad de propósitos. Herramientas De Acceso Para Usuario Final: es la parte en que los usuarios utilizan la solución datawarehouse, para esto necesitan herramientas que les proporcione acceso a la información generada y proceder a la toma decisiones estratégicas. Por tanto la comunicación entre
  • 4.
    el Almacén deDatosy la herramienta será mediante consultas de tipo ad- hoc. Cuáles son las tres técnicas principales que los fabricantes de software utilizan para implementar herramientas de extracción, limpieza, y transformación de datos. Generadores de código Herramientas de replicación de datos Motores de transformación dinámica. Explique la importancia de la gestión de los metadatos y qué relación tiene con la integración del almacén de datos. Como se explicó en una pregunta anterior los metadatos son datos sobre datos pero estos tienen o cumples funciones primordiales que los convierten en datos muy preciados del almacén ya que se utilizan para: Extraer y cargar información mapeando las fuentes de datos sobre una vista común de los datos dentro del almacén. Gestionar el almacén de datos con la finalidad de automatizar la producción de tablas de resumen. Gestiona consultas para dirigir una consulta a la fuente de datos más apropiada. Explique las tareas principales asociadas con la administración y gestión de un almacén de datos.  Monitorizar la carga de datos desde múltiples fuentes  Comprobar la calidad y la integridad de los datos  Gestionar y actualizar los metadatos  Monitorizar el rendimiento de la base de datos para garantizar unos tiempos de respuesta cortos a las consultas.  Auditar la utilización del almacén de datos para atribuir los costes de los distintos usuarios  Purgar los datos  Archivar los datos y realizar copias de seguridad
  • 5.
     Implementar mecanismosde recuperación de fallos gestionar adecuadamente la seguridad Explique las diferencias entre un mercado de datos y un almacén de datos e indique las razones principales para implementar un mercado de datos. Un mercado de datos se puede definir como un subconjunto de un almacén de datos y soporta los requisitos de un departamento o área de negocio en concreto mientras que el almacén de datos comprante todos los departamentos de la empresa. Las principales razones que fomentan la creación de mercados de datos se deben a que: Los mercados de datos surgen por la complejidad y elevados recursos asociados a la implementación de los proyectos de almacenes de datos. Un almacén de datos al intentar integrar toda la información de la organización requiere tratar con más; fuentes de datos, plataformas, requisitos de usuarios, presupuesto, tiempo de desarrollo y personal. Una solución es enfocarse en una unidad de negocios y crear un mercado de datos que satisfaga sus requisitos de información. Proponer un ejemplo de diseño multidimensional (esquema estrella) para un caso que usted conozca Consultar al menos 3 herramientas para inteligencia de negocios describir las características principales. Microstrategy: Es otra de las herramientas más difundidas, cuya característica fundamental reside en que provee de las soluciones necesarias a los clientes de cualquier tipo de empresa o sector funcional de las mismas, con el objetivo de brindar un marco de ayuda que les permitirá acceder a un mayor conocimiento de la información que está siendo manejada por la empresa.
  • 6.
    Business Objects: Ofrecea los usuarios el acceso constante y de manera sencilla y clara a los datos relevantes, para facilitar el análisis de la información que ha sido almacenada, y el posterior desarrollo de distintos informes para mejorar los procesos globales de la empresa. Cognos: Este brinda un sistema efectivo para llevar a cabo evaluaciones correctas de la información y una posterior toma de decisiones adecuada. Cabe destacar que Cognos cuenta además con una herramienta especial, que ha sido desarrollada para permitir la realización de modelos, pronósticos y simulaciones de negocios, con el fin de ofrecer la posibilidad de planificar el futuro de las operaciones.