1. ADMINISTRACIÓN DE BASE
DE DATOS
TÓPICOS DE BASE DE
DATOS
Trabajo final
Luis Antonio Nieblas
Juárez
330637
2. MENU
1. Tecnología y Administration de data warehouse
• Definición
• Objetivos
• Comparación de bases de datos operacionales y los data warehouse
• Arquitectura
• Aplicaciones
2. Procesamiento cliente servidor, procesamiento de bases de datos
paralelas y bases de datos distribuidas
3. Listar razones para el procesamiento cliente-servidor, procesamiento
de bases de datos paralelas y datos distribuidos
4. Describir arquitecturas comunes para el procesamiento de
bases de datos paralelas
3. Definición: Un Datawarehouse es una base de datos corporativa que se
caracteriza por integrar y depurar información de una o más fuentes
distintas, para luego procesarla permitiendo su análisis desde infinidad de
perspectivas y con grandes velocidades de respuesta La creación de un
datawarehouse representa en la mayoría de las ocasiones el primer paso,
desde el punto de vista técnico, para implantar una solución completa y
fiable de Business Intelligence.
MENU
4. Objetivos :
El data warehouse debe hacer la información de la organización fácilmente
flexible
El datawarehouse debe presentar la información de la organización
consistentemente
El datawarehouse debe ser adaptable y resistente a cambios
El datawarehouse debe servir como base para una toma de desiciones
mejorada
MENU
8. APLICACIONES DEL DATA
WAREHOUSELos proyectos de data warehouse se han emprendido en una gran
variedad de industrias. Unas cuantas aplicaciones clave han llevado a
la adopción de proyectos de data warehouse, como se enlista en la
tabla 16.2. Las industrias altamente competitivas, como la venta al
detalle, seguros, aerolíneas y telecomunicaciones (particularmente de
servicio de larga distancia), han invertido con anticipación en
tecnología y proyectos de data warehouse
MENU
9. PROCESAMIENTO
CLIENTE/SERVIDOR BASE DE
DATOSEl enfoque cliente-servidor apoya el uso de recursos de cómputo
remoto para realizar complejos procesos empresariales que consisten
de una diversidad de subtareas. Por ejemplo, la compra electrónica es
un proceso complejo que consiste en la selección del producto,
levantamiento del pedido, gestión de inventarios, procesamiento de
pago, embarque y regreso del producto. Un cliente es un programa
que hace solicitudes a un servidor. El servidor ejecuta las solicitudes y
comunica los resultados a los clientes. Los clientes y servidores
pueden estar ordenados a través de computadoras en red para dividir
el trabajo complejo en unidades más manejables.
MENU
10. PROCESAMIENTO DE BASES DE
DATOS PARALELAS Y BASES DE
DATOS DISTRIBUIDASBase de datos paralelas: Un DBMS paralelo usa una colección de recursos
(procesadores, discos y memoria) para realizar trabajo en paralelo. Dado un
presupuesto de recursos fijo, el trabajo se divide entre recursos para lograr niveles
deseados de rendimiento (escalamiento y aceleración) y disponibilidad. Un DBMS
paralelo usa los servicios de una red de alta rapidez, sistema operativo y sistema
de almacenamiento para coordinar la división del trabajo entre recursos. Por ende,
comprar un DBMS paralelo involucra una decisión acerca de todos estos
componentes, no sólo del DBMS. El grado de recursos compartidos determina las
arquitecturas para procesamiento de bases de datos paralelas. El estándar de
clasificación de arquitecturas se conoce como todo compartido (SE), discos
compartidos (SD) y nada compartido (SN). En el enfoque SE, memoria y discos se
comparten entre una colección de procesadores. El enfoque SE usualmente está
relacionado como una sola computadora de multiprocesamiento y no como una
arquitectura de base de datos paralela. En la arquitectura SD, cada procesador
tiene su memoria privada, pero los discos se comparten entre todos los
procesadores. En la arquitectura SN, cada procesador tiene su propia memoria y
discos. En la arquitectura SN, los datos se deben particionar entre los
procesadores.
MENU
11. Base de datos distribuidas: Los DBMS distribuidos implican tecnología
diferente a la del procesamiento cliente-servidor y al procesamiento de
bases de datos paralelas. El procesamiento cliente-servidor enfatiza la
distribución de funciones entre computadoras en red con el uso de
middleware para gestión de proceso. Una diferencia fundamental entre el
procesamiento de bases de datos paralelas y distribuidas es la autonomía.
Las bases de datos distribuidas proporcionan autonomía de sitio mientras
que las bases de datos paralelas, no. Por lo tanto, la base de datos
distribuida requiere un conjunto diferente de características y tecnología.
12. LISTAR RAZONES PARA EL PROCESAMIENTO
CLIENTE-SERVIDOR PROCESAMIENTO DE
BASES DE DATOS PARALELAS Y DATOS
DISTRIBUIDOS
Centralización del control
Escalabilidad: se puede aumentar la capacidad
de clientes y servidores por separado
Fácil mantenimiento
mejoran la velocidad de procesamiento y de E/S mediante la
utilización de UCP y discos en paralelo
Los sistemas paralelos de base de datos constan de varios
procesadores y varios discos conectados a través de una red de
interconexión de alta velocidad.
MENU
14. DESCRIBIR ARQUITECTURAS
COMUNES PARA EL
PROCESAMIENTO DE BASES DE
DATOS PARALELASModelos de Arquitectura
Memoria compartida. Todos los procesadores comparten una
memoria común.
Disco compartido. Todos los procesadores comparten un disco
común.
Sin compartimiento. Los procesadores no comparten ni memoria ni
disco.
Jerárquico. Es un híbrido de las anteriores.
MENU
15. En una arquitectura de data warehouse de dos niveles, los datos operativos
se transforman y luego se transfieren a un data warehouse. Puede emplearse
un plano separado de servidores para soportar las complejas actividades del
proceso de transformación. Para asistir con el proceso de transformación, se
crea un modelo de datos empresariales (EDM). El EDM describe la estructura
del data warehouse y contiene los metadatos requeridos para entrar a bases
de datos operacionales y fuentes de datos externas. El EDM también puede
contener detalles acerca de la depuración e integración de las fuentes de
datos. La gerencia usa el data warehouse directamente para recuperar datos
para el apoyo a las decisiones.
MENU