El documento describe conceptos clave relacionados con data warehouses, incluyendo su definición, objetivos, comparación con bases de datos operacionales, arquitecturas y aplicaciones. Un data warehouse es un depósito central de datos integrados y estandarizados de varias fuentes que apoya la toma de decisiones. Proporciona beneficios como mayores ingresos y menores gastos a través del análisis empresarial.
4. El data warehouse, término creado por William Inmon en 1990, se refiere a un
depósito de datos
central donde se integran, depuran y estandarizan los datos de bases de datos
operacionales y
otras fuentes para apoyar la toma de decisiones.
DEFINICION
5. Los beneficios tangibles de un data warehouse pueden incluir mayores ingresos y
menores gastos permitidos por el análisis empresarial, que no eran posibles antes
de la utilización de los data warehouse.
Por ejemplo, un data warehouse puede permitir menores pérdidas gracias a la
mejor detección de fraudes, mejor retención de clientes a través del marketing
dirigido y reducción en los costos implícitos de inventario por medio de un mejor
pronóstico de la demanda.
OBJETIVOS
7. COMPARACIÓN CON BD OPERACIONALES
En un Data Warehouse se almacena toda la información de interés para
una organización que luego queramos analizar, mientras que, en una
base de datos operacional se almacenan todas las transacciones de la
organización, tanto datos útiles como no útiles.
8. APLICACIONES
Los proyectos de data warehouse se emprenden generalmente por razones
competitivas: con el fin de lograr una ventaja estratégica o seguir siendo
competitivos.
Es frecuente que se emprenda un proyecto de data warehouse como parte
de una estrategia corporativa para cambiar de un enfoque en el producto a
un enfoque en el cliente. Los data warehouse exitosos han ayudado a
identificar nuevos mercados, concentrar los recursos en clientes rentables,
mejorar la retención de clientes y reducir los costos de inventario.
11. sistema cliente servidor
El enfoque cliente-servidor apoya el uso de recursos de cómputo remoto
para realizar complejos procesos empresariales que consisten de una
diversidad de subtareas. Por ejemplo, la compra electrónica es un proceso
complejo que consiste en la selección del producto, levantamiento del
pedido, gestión de inventarios, procesamiento de pago, embarque y regreso
del producto.
12. Motivación para el procesamiento
de bases de datos paralelas
El procesamiento de bases de datos paralelas puede mejorar el
rendimiento mediante escalamiento y aceleración. El escalamiento
involucra la cantidad de trabajo que puede lograrse mediante el
aumento de la capacidad de cómputo.
El escalamiento mide el aumento en tamaño de una labor que puede
realizarse mientras se mantiene el tiempo constante.
En contraste con el uso del procesamiento cliente-servidor para
distribuir el trabajo complejo entre computadoras en red, el
procesamiento de bases de datos paralelas divide grandes tareas en
muchas tareas más pequeñas y las distribuye entre computadoras
interconectadas. Por ejemplo,
el procesamiento de bases de datos paralelas puede usarse para
realizar una operación de unión en grandes tablas.
13. En los últimos cinco años, la tecnología de bases de datos paralelas ha ganado
aceptación comercial para grandes organizaciones. La mayoría de las empresas
proveedoras de DBMS y algunos DBMSs de código abierto soportan tecnología
de base de datos paralela para satisfacer la demanda del mercado. Las
organizaciones utilizan estos productos para darse cuenta de los beneficios de
la tecnología de base de datos paralela (escalamiento, aceleración y
disponibilidad), mientras administra posibles problemas de interoperabilidad.
Procesamiento de bases de datos paralelas
14. Los datos distribuidos ofrecen algunas ventajas en relación con control de
datos, costos de comunicación y rendimiento.
Distribuir una base de datos permite la ubicación de datos de modo que se
ajuste a la estructura de una organización. Por ejemplo, partes de una tabla de
clientes pueden cargarse cerca de los centros de procesamiento de clientes.
Las decisiones acerca de compartir y mantener los datos pueden
establecerse localmente para proporcionar un control más cercano al uso de
datos.
bases de datos distribuidas
15. razones para el procesamiento cliente-servidor
La tabla resume las ventajas y desventajas del procesamiento cliente-
servidor, del procesamiento de bases de datos paralelas y de los datos
distribuidos como tecnologías separadas.
Para obtener un máximo aprovechamiento, las tecnologías pueden
combinarse. En este momento, el procesamiento distribuido con el
enfoque cliente-servidor es la tecnología más madura y ampliamente
desplegada, aunque el procesamiento de bases de datos paralelas gana
aceptación rápidamente.
16. Arquitecturas comunes para el procesamiento de bases de datos paralelas.
En todas las arquitecturas de bases de datos paralelas, el hecho de
compartir recursos es transparente a las aplicaciones. El código de
aplicación (SQL y enunciados en lenguaje de programación) no
necesitan cambiarse para sacar ventaja del procesamiento de bases de
datos paralelas.
El enfoque SE usualmente está relacionado como una sola
computadora de multiprocesamiento y no como una
arquitectura de base de datos paralela.
17. En la arquitectura SD, cada procesador tiene su memoria privada, pero
los discos se comparten entre todos los procesadores. En la arquitectura
SN, cada procesador tiene su propia memoria y discos. En la arquitectura
SN, los datos se deben particionar entre los procesadores.
Arquitecturas comunes para el procesamiento de bases de datos paralelas.
18. En la arquitectura CD, los procesadores en cada clúster comparten
todos los discos, pero nada se comparte a través de los clústeres.
En la arquitectura CN, los procesadores en cada clúster no
comparten recursos, pero se puede manipular cada clúster para
trabajar en paralelo en la realización de una tarea.
Arquitecturas comunes para el procesamiento de bases de datos paralelas.
19. APLICACIONES
El enfoque cliente-servidor apoya el uso de recursos de cómputo remoto para
realizar complejos procesos empresariales que consisten de una diversidad de
subtareas. Por ejemplo, la compra electrónica es un proceso complejo que consiste
en la selección del producto, levantamiento del pedido, gestión de inventarios,
procesamiento de pago, embarque y regreso del producto. Un cliente es un
programa que hace solicitudes a un servidor. El servidor ejecuta las solicitudes y
comunica los resultados a los clientes. Los clientes y servidores pueden estar
ordenados a través de computadoras en red para dividir el trabajo complejo en
unidades más manejables. El ordenamiento más simple es dividir el trabajo entre
clientes que procesen en computadoras personales y un servidor que procese en
una computadora separada,
20. Examen.
William Inmon
steven hawking
will smith
1.- Quien fue el pionero del termino data warehouse?
No existen
mayores ingresos y menores gastos
Fácil uso de este.
2.- Beneficio del warehouse?
21. • 3.- Que ofrece una base de datos distribuida?
control de datos, costos de comunicación y rendimiento.
Nada.
Perdida en e negocio