1. • Dificultades de la integración
La integración completa de sistemas
heterogéneos en una base de datos
distribuida homogénea suele resultar difícil o
imposible:
• Dificultades técnicas.
La inversión en los programas de aplicaciones
basados en los sistemas de bases de datos ya
existentes puede ser enorme, y el coste de
transformar esas aplicaciones puede resultar
prohibitivo.
• Dificultades organizativas.
Aunque la integración resulte técnicamente
posible, puede que no lo sea políticamente,
porque los sistemas de bases de datos ya
existentes pertenezcan a diferentes
empresas u organizaciones. En ese caso es
importante que el sistema de varias bases de
datos permita que los sistemas de bases de
datos locales conserven un elevado grado de
autonomía para la base de datos local y para
las transacciones que se ejecuten con esos
datos.
Vista unificada de los datos
• Cada sistema local de administración de bases
de datos puede utilizar un modelo de datos
diferente.
• Por ejemplo, puede que algunos empleen el
modelo relacional, mientras que otros pueden
emplear modelos de datos más antiguos, como
el modelo de red
• Dado que se supone que los sistemas con varias
bases de datos ofrecen la ilusión de un solo
sistema de bases de datos integrado, hay que
utilizar un modelo de datos común.
• Una opción adoptada con frecuencia es el
modelo relacional, con SQL como lenguaje
común de consulta.
• En realidad hoy en día hay varios sistemas
disponibles que permiten realizar consultas SQL
en sistemas de administración de bases de
datos no relacionales.
Bases de datos distribuidas heterogéneas
El tratamiento de la información ubicada en bases de datos distribuidas heterogéneas
exige una capa de software adicional por encima de los sistemas de bases de datos
existentes. Esta capa de software se denomina sistema de varias bases de datos.
2. Los sistemas mediadores son sistemas que integran varios orígenes de datos
heterogéneos, proporcionan una vista global integrada de los datos y ofrecen
facilidades de consulta en el sistema global. A diferencia de los sistemas de varias bases
de datos completos, los sistemas mediadores no se ocupan del procesamiento de las
transacciones. (Los términos mediador y de varias bases de datos suelen utilizarse de
manera indistinta, y puede que los sistemas denominados mediadores soporten formas
limitadas de las transacciones.)
Dada una consulta en un
esquema global, puede que haya
que traducir la consulta a
consultas en los esquemas
locales de cada uno de los sitios
en que hay que ejecutar la
consulta. Hay que volver a
traducir los resultados de las
consultas al esquema global.
Puede que los orígenes de datos
sólo ofrezcan posibilidades de
consulta limitadas; por ejemplo,
puede que soporten las selecciones
pero no las reuniones. Puede incluso
que restrinjan la forma de las
selecciones, permitiéndolas sólo
para determinados campos; los
orígenes de datos Web con
interfaces de formulario son un
ejemplo de estos orígenes de datos.
Por tanto, puede que haya que
dividir las consultas para que se
lleven a cabo en parte en el origen
de datos y en parte en el sitio que
formula la consulta.
Procesamiento de las consultas
El procesamiento de las consultas en las bases de datos
heterogéneas puede resultar complicado. Algunos de los
problemas son:
En general, puede que haya que
tener acceso a más de un sitio
para responder a una consulta
dada. Puede que haya que
procesar las consultas obtenidas
de los diferentes sitios para
eliminar los valores duplicados.
La optimización global de las
consultas en bases de datos
heterogéneas resulta difícil, ya
que puede que el sistema de
ejecución de consultas conozca
los costes de los planes de
consulta alternativos en sitios
diferentes. La solución habitual
es confiar sólo en la optimización
a nivel local y utilizar únicamente
la heurística a nivel