Este documento compara las bases de datos centralizadas y distribuidas. Las bases de datos distribuidas almacenan datos lógicos en múltiples ordenadores conectados en red, lo que ofrece tolerancia a fallos pero también mayor complejidad. Las bases de datos centralizadas almacenan todos los datos en un solo equipo, lo que es más simple pero representa un único punto de fallo. En general, las pequeñas empresas pueden beneficiarse de las bases de datos centralizadas mientras que las grandes empresas requieren de las bases de datos distribuidas para garantizar la disponibilidad de
2. Índice
1. Bases de datos distribuidas…………………………3
2. Bases de datos centralizadas ……………………….6
3. Fragmentación………………………………………7
4. Comparativa…………………………………………8
5. Conclusión……………………………………………8
2
3. Bases de datos distribuidas
Las bases de datos distribuidas almacenan datos lógicos en un único
sistema pero distribuidos (de ahí su nombre) entre varios ordenadores de la red
conectados entre sí por cualquier medio de comunicación de redes.
3
4. El hardware de una base de datos distribuida no es muy distinta a la de los
servidores normales, con que sea rápida es suficiente.
Se necesitan distintos software como el DDBMS, DTM y DBMS.
Sistema manipulador de base de datos distribuidas:
Ofrece un conjunto de programas que trabajan en distintos ordenadores
provenientes de los programas suministrados por el fabricante.
Administrador de transacciones distribuidas:
Se encargan de coordinar y controlar las acciones solicitadas por aquellos
programas de consultas o transacciones.
Sistema manipulador de base de datos:
Procesa una parte de la base de datos, recupera y actualiza datos de los usuarios,
es decir, todo lo relacionado con la manipulación.
Nodo
Los nodos son ordenadores que ejecutan un DTM o DMB, incluso ambos. Los
nodos de transacción ejecutan los DTM y los nodos de base de datos ejecutan los
DBM.
Este tipo de bases de datos ofrecen ventajas e igualmente desventajas, vamos a
analizarlos a continuación:
Ventajas
• Al ser distribuidas, ofrecen cierta tolerancia a fallos.
• Si un nodo de esa red es afectada por un problema, no afecta a los demás
nodos.
• En caso de que un nodo deje de funcionar correctamente, es fácil
reemplazarlo por otro nodo que cumpla las mismas funciones.
• El acceso de los datos suele ser rápido ya que se puede consultar datos en
el nodo más cercano.
• A la hora de procesar datos o manejar un tráfico muy elevado, se reparten
la carga de trabajo.
• Los datos lógicos son independientes del sistema operativo, hardware y
tipo de red.
4
5. • La transparencia del sistema a los usuarios es elevada, los usuarios
desconocen su ubicación y sigue funcionando aunque falle un nodo.
Desventajas
• El control de acceso simultáneo (concurrencia) es bastante más complejo
ya que los usuarios pueden acceder desde distintos lugares.
• Controlar y manipular datos distribuidos es complejo y se requiere de
personal cualificado para administrar una base de datos distribuida.
• Prevenir los fallos hardware y software de muchos nodos es muy difícil e
incluso costoso.
Según algunos factores, una base de datos distribuida puede definirse con
distintos tipos de arquitectura según unos criterios.
1. Distribución: Dependerá de si los componentes del sistema están
localizados en el mismo ordenador o si este está distribuida por distintos
nodos.
2. Heterogeneidad: Si hay componentes que se ejecutan en distintos
sistemas operativos, fuentes, programas, etc.
3. Autonomía: Existen tres niveles diferentes:
1. Autonomía de diseño: es la capacidad de una parte del sistema
para decidir qué hacer con su propio diseño.
2. Autonomía de comunicación: la capacidad de una parte del
sistema para decidir cuándo y cómo comunicarse con otros SGBD.
3. Autonomía de ejecución: la capacidad de una parte del sistema
para ejecutar localmente instrucciones según le convenga.
5
6. Centralizadas
Las bases de datos centralizadas son aquellas que, al contrario de las distribuidas,
los datos son almacenados completamente en un único equipo. Los usuarios que
necesitan realizar una consulta se lo hacen únicamente y exclusivamente a esa
base de datos.
Esta “modalidad” trae una serie de ventajas y desventajas:
Ventajas:
• Los datos están almacenados en un único sitio, lo cual ahorra espacio y
dinero.
• Es fácil implementar medidas de seguridad, solo hay que vigilar un único
sitio físico.
• El rendimiento es una de sus cualidades, así como la integridad de los
datos.
• Dependiendo de cómo se vea, se puede decir que en general es más barato
que una base de datos distribuidas ya que es únicamente un equipo,
aunque para no quedarse corto necesita piezas de hardware muy costosos.
Desventajas:
• Al contrario de las bases de datos distribuidas, cuando una base de datos
centralizada falla, se pierde toda la disponibilidad.
• Si el tráfico es elevado, no se pueden repartir entre otros nodos. Cabe
señalar que son más vulnerables a los ataques de denegación de servicio
que las bases de datos distribuidas.
6
7. Fragmentación
La fragmentación es un modelo de distribución de los datos en la que solo
existe una copia de cada elemento de la base de datos y distribuida por los nodos.
Cada nodo almacena uno o más fragmentos de la base de datos. Al no duplicarse
estos fragmentos, esto ahorra una gran cantidad de almacenamiento a cambio de
sacrificar la disponibilidad e integridad de los datos ya que en caso de perderse
uno de los nodos, sus datos quedarían perdidos.
La fragmentación se puede realizar de tres formas distintas:
• Horizontal: es fragmentan los datos en tuplas (objetos con información,
como por ejemplo (persona, edad:22) y dividiendo la relación en
subdivisiones que contienen datos sobre las tuplas.
• Vertical: al fragmentarse una relación, se producen subdivisiones de esta
en las que cada uno si un subconjunto de los atributos de la relación así
como la clave primaria de esa relación.
7
8. • Mixta: combina ambos métodos para satisfacer una necesidad en la que
requiera una combinación de ambas técnicas de fragmentación.
Comparativa
Distribución
Seguridad
Disponibilidad
Coste
Integridad
Carga de trabajo
Centralizada
+
+
+
-
Distribuida
+
+
+ es mejor, - es peor
Conclusión
Se puede decir que ambas ofrecen ciertos aspectos atractivos según las
necesidades, una compañía pequeña podría optar por una base de datos
centralizada al ser más económico y situarla en sus oficinas. Una compañía
grande seguramente tenga los recursos para pagar una base de datos distribuida
para garantizar la disponibilidad de los datos.
8