SlideShare una empresa de Scribd logo
1 de 8
Descargar para leer sin conexión
Colección de Tesis Digitales
Universidad de las Américas Puebla
Alvarez Carrión, Guillermo
3.1 Conflictos de Esquema
Para que el usuario de un MDBMS pueda accesar de manera transparente
y uniforme la información almacenada en diferentes componentes de
bases de datos, se necesita resolver los conflictos de heterogeneidad
semántica y de datos. La idea de resolver los conflictos es lograr una
integración de esquemas, que permita a los usuarios de MDBMS formular
solo una consulta para n Bases de Datos en lugar de n consultas, una para
cada Base de Datos.
El presente capítulo presenta la clasificación de los conflictos de esquema
y de datos; además describe de manera detallada, como es que se
presentan los conflictos al integrar las Bases de Datos Componentes
(BDC´s). Se revisa y discute la metodología propuesta para lograr la
integración de esquemas. La metodología de integración se describe,
considerando los conflictos y casos particulares para el integrador de
esquemas propuesto en este trabajo de investigación.
Debido a que las BDC´s operan independientemente (sin un control
centralizado o coordinador distribuido), éstas pueden presentar
discrepancia estructural y de representación. Estas diferencias permiten
identificar y clasificar los conflictos de esquema manejados durante el
proceso de integración. El conjunto de conflictos identificados por [Kim y
Seo, 1991] para la integración de esquemas se describen en los párrafos
siguientes.
3.1.1 Conflictos en tablas
Conflictos de nombrado de tablas
Nombres diferentes para tablas equivalentes.- Ocurre cuando se
asignan nombres diferentes a tablas semánticamente equivalentes
(sinónimos).
a.
Nombres iguales para tablas no equivalentes.- Cuando se asigna el
mismo nombre a tablas semánticamente diferentes (homónimos).
b.
1
3.2 Conflictos de datos
Conflictos en la estructura de las tablas
Atributos faltantes.- La conceptualización del diseño de un
esquema de BD puede llevar a la omisión de atributos que no se
consideren representativos.
a.
Atributos implícitos.- En ocasiones los atributos existentes pueden
ser suficientes para deducir algún otro atributo requerido para la
integración.
b.
Conflictos en restricciones de integridad.- En esta categoría se incluyen
las deferencias que pueden surgir con respecto a la selección de llaves
primarias, secundarias, extranjeras y conflictos en medida de la integridad
referencial.
Conflictos en la organización de la información.- El número de tablas
requeridas para modelar la BD en cada componente puede diferir de
acuerdo a la conceptualización de solución de cada diseñador.
3.1.2 Conflictos en atributos
Conflictos de nombrado de atributos.- El concepto de sinónimo y
homonimia aplicado a los conflictos de nombrado de tablas son
aplicables a éstos tipos de conflictos.
Conflictos en valores por ausencia.- La definición implícita de algunos
valores por ausencia asignados por DBMS, podría llevar a contradicciones
en la semántica de los datos.
Conflictos por restricciones de asignación de valores a los atributos
Conflictos en los tipos de datos.- Los tipos de datos pueden diferir
en cuanto al criterio de diseño de cada aplicación.
a.
Conflictos en restricciones de dominio .- Reglas impuestas para a
asignación de valores o consideración en los criterios de unicidad.
b.
Conflictos por la cardinalidad y grado de atomicidad.- El grado de detalle
de cada atributo puede ser distinto en cada aplicación. Además, cada
modelo de información establece restricciones y posibilidades de
estructuración muy diferentes.
Conflictos en la representación de la información.- Puede presentarse el
caso de que el mismo concepto se presente como una entidad en una
aplicación y en otra como un solo atributo.
2
3.3 Modelado de datos en los esquemas locales y
federados
Aún a pesar de tener esquemas de BDC´s equivalentes en cuanto a la
estructura de sus tablas y atributos, es posible presentar otra serie de
problemas identificados como conflictos de datos, dichos conflictos
presentados por [Kim y Seo 1990], se describen a continuación:
Conflictos entre los valores.- Cuando se espera que instancias
equivalentes tengan los mismos valores, pero muestran inconsistencia
debido a que los datos son capturados incorrectamente o los datos son
obsoletos.
Diferencias en la representación.- Situaciones de contexto y cultura
organizacional, entre otros factores pueden llevar a que cada BDC
seleccione una representación distinta en la información. Dichas
inconsistencias pueden presentarse por:
Notaciones diferentes.- Cuando existen diferentes
formas para representar un mismo dato. (p.e.
calificaciones numéricas o con escalas de letras)
a.
Unidades distintas.- La diversidad de unidades, sobre
todo para valores numéricos, trae consigo problemas
de interpretación. (p.e. la diferencia en el sistema de
medición ingles y el internacional)
b.
Diferencias en las representaciones.- Cuando existen
diferentes formas para representar un valor de un
atributo. (p.e. para el atributo Estado se puede tener:
Tlaxcala, Tlax., Tx, etc.)
c.
El modelado de datos es el proceso de crear una representación
consistente de los datos del usuarios. Existen diferentes propuestas de
modelado, tales como el de red, jerárquico, relacional y orientado a
objetos, cada uno con características particulares de diseño y
representación.
Para la propuesta de integración de este proyecto se considera
exclusivamente el modelo relacional, como requerimiento tanto para los
esquemas locales como para los esquemas globales generados. La
justificación de la utilización de este modelo, es que sigue siendo uno de
los estándares de modelado más utilizado en la industria de las Bases de
Datos.
El modelo relacional, basado en la teoría de conjuntos usa como primitiva
básica de construcción la relación. Una relación es una tabla
3
3.4 Metodología de integración de esquemas
bidimensional. Cada hilera de la tabla contiene datos que pertenecen a
alguna cosa o porción de una cosa. Cada columna de la tabla contiene
datos sobre atributos. Las hileras son también llamadas tuplas y las
columnas atributos
Para que una tabla sea una relación, esta debe cumplir ciertas
restricciones. Primero, los atributos deben ser atómicos. Todos los valores
en algún atributo deben ser de la misma clase. Cada columna debe tener
un nombre único y el orden de las columnas en la tabla es insignificante.
Finalmente, dos tuplas en la tabla no pueden se idénticas.
Es importante tomar en cuenta estas consideraciones para la selección
apropiada de las BDC´s y para garantizar una consistencia con la
metodología de integración propuesta.
La necesidad de integrar diversas BDC´s trae consigo la necesidad de
utilización de metodologías formales que permitan un proceso de
integración confiable y seguro.
Una metodología descompone la integración de esquemas en un número
de tareas que pueden ligarse en un proceso interactivo que ofrezca como
resultado un esquema global para DBMS federados fuertemente acoplado.
Con la idea de mantener un balance entre simplicidad y rentabilidad se
describe la metodología de integración propuesta por [Batini y Lenzerini
1986], la cual consiste de cuatro fases: preintegración, comparación de
esquemas, adecuación de esquemas y unión de esquemas.
Figura 3.1 Entradas y salidas en la integración de esquemas
3.5.2 Compartición de información
4
3.5 Preintegración
3.6 Comparación de esquemas
Otro aspecto importante de esta fase es definir qué información se
compartirá y con qué restricciones de acceso. Este proceso podría
entenderse como un análogo a la definición de vistas en el modelo
relacional. En el contexto de Bases de Datos Federadas, esto puede verse
como la determinación de las entidades que cada Base de Datos
Componente compartirá con la Federación y su definición en un esquema
de componentes.
Figura 3.2 Estrategias para el proceso de integración
Figura 3.3 Estrategia binaria de escalera para el proceso de integración.
En este ejemplo existe la descripción del mismo número de objetos en
cada base de datos local, pero a diferente nivel de detalle por lo que es
posible establecer la relación lógica a través de un atributo común y
ofrecer un acceso global a la información sin redundancias. Ambos tipos
de integración consideran información espacial (modelo basado en
fragmentos) e información descriptiva.
5
3.7 Adecuación de esquemas
La operación inversa, partiendo de la cadena UBICACION 1
, puede ser, en
algunos casos más difícil. Esto es debido a que en ocasiones es casi
imposible proponer los criterios para decidir qué parte de la cadena
original corresponde a cada uno de los atributos propuestos para la otra
representación. Esto, sin embargo, puede llevar a conflictos con el orden
que se usa para cada representación. Debe considerarse , que lo anterior
es posible si el sistema soporta solamente consultas, ya que para las
operaciones de modificaciones y alta de información, dada la ubicación
como un solo atributo, plantea la necesidad de decidir que parte
pertenece a cada atributo de la segunda representación.
3.7.4 Claves primarias
El uso de llaves primarias en el modelo relacional permite, en la
integración heterogénea establecer la operación de join para integrar los
componentes locales. Entonces, será de suma importancia definir cuales
son los atributos considerados como claves primarias de cada BDC.
3.7.5 Nivel de precisión
El modelado de datos espaciales a través de la técnica de Quadtree (Ver
Apéndice A para detalle de esta técnica) permite representar objetos
espaciales a diferentes niveles de precisión. A mayor nivel de precisión,
mayor el detalle de representación obtenido del objeto.
Las BDC´s que representan información espacial, pueden manejar niveles
6
3.8 Unión y reestructuración
de precisión diferentes, lo que implicaría una manipulación a nivel de
implementación para homogeneizar la representación de los objetos
espaciales a un mismo nivel de resolución.
Al considerar el nivel de precisión como un conflicto es posible lograr
dicha homogeneización a nivel de integración de esquemas.
Una vez solucionados los conflictos en la fase anterior, es posible la
integración de los esquemas. Después de la integración sigue una fase de
reestructuración interactiva hasta que se llegue al esquema global
deseado. La evaluación de esquema final, es a través de los siguientes
criterios:
Completitud y Validez. El esquema integrado debe contener todos los
conceptos presentes en los esquemas componentes. El esquema
integrado debe ser una representación de la unión de los dominios de las
aplicaciones asociadas a los esquemas [Batini y Col 1986].
Representación mínima.- Si el mismo concepto se encuentra en más de
un concepto componente, este se debe representar sólo una vez en el
esquema integrado.
Comprensibilidad.- El esquema global final debe ser fácil de entender
tanto por el diseñador como por el usuario final.
La comprensión detallada de los conflictos de esquema y de datos que se
7
presentan en este capítulo, permitirá plantear una mecanismo de
solución que ofrezca un acceso transparente a las Bases de Datos
Componentes. Los conceptos de equivalencia y tipo de integración
requieren de atención especial para garantizar una selección apropiada de
los componentes a integrar.
La metodología de integración que se discute, establece un patrón de
referencia para llevar a cabo la integración de manera semiautomática
con la propuesta que se plantea en los capítulos siguientes.
Alvarez Carrión, G. 1999. Integración de esquemas en bases de datos
heterogéneas fuertemente acopladas. Tesis Maestría. Ciencias con
Especialidad en Ingeniería en Sistemas Computacionales. Departamento
de Ingeniería en Sistemas Computacionales, Escuela de Ingeniería,
Universidad de las Américas Puebla. Mayo. Derechos Reservados © 1999.
8

Más contenido relacionado

La actualidad más candente

Técnicas y procedimientos para modelar datos
Técnicas y procedimientos para modelar datosTécnicas y procedimientos para modelar datos
Técnicas y procedimientos para modelar datoshenrryaraque
 
Contenido UNIDAD II. COMO SON LAS BASES DE DATOS.
Contenido UNIDAD II.  COMO SON LAS BASES DE DATOS.Contenido UNIDAD II.  COMO SON LAS BASES DE DATOS.
Contenido UNIDAD II. COMO SON LAS BASES DE DATOS.spgutierrez86
 
Modelos de datos
Modelos de datosModelos de datos
Modelos de datosJeff Jesús
 
Base de datos (diseño conceptual,logico y fisico)
Base de datos (diseño conceptual,logico y fisico)Base de datos (diseño conceptual,logico y fisico)
Base de datos (diseño conceptual,logico y fisico)claudiachiri
 

La actualidad más candente (9)

Técnicas y procedimientos para modelar datos
Técnicas y procedimientos para modelar datosTécnicas y procedimientos para modelar datos
Técnicas y procedimientos para modelar datos
 
Contenido UNIDAD II. COMO SON LAS BASES DE DATOS.
Contenido UNIDAD II.  COMO SON LAS BASES DE DATOS.Contenido UNIDAD II.  COMO SON LAS BASES DE DATOS.
Contenido UNIDAD II. COMO SON LAS BASES DE DATOS.
 
Modelos de datos
Modelos de datosModelos de datos
Modelos de datos
 
Guia de Base de Datos Unidad 2. Lissette T
Guia de Base de Datos Unidad 2. Lissette TGuia de Base de Datos Unidad 2. Lissette T
Guia de Base de Datos Unidad 2. Lissette T
 
Normalizacion bd d
Normalizacion bd dNormalizacion bd d
Normalizacion bd d
 
Modelo bd
Modelo bdModelo bd
Modelo bd
 
Modelo Conceptual
Modelo ConceptualModelo Conceptual
Modelo Conceptual
 
Base de datos (diseño conceptual,logico y fisico)
Base de datos (diseño conceptual,logico y fisico)Base de datos (diseño conceptual,logico y fisico)
Base de datos (diseño conceptual,logico y fisico)
 
3 diseño de-BD
3 diseño de-BD3 diseño de-BD
3 diseño de-BD
 

Similar a Integración de esquemas para resolver conflictos semánticos y de datos

Base de datos 22222
Base de datos 22222Base de datos 22222
Base de datos 22222krentiista
 
El modelo de datos relacional (Base de Datos)
El modelo de datos relacional (Base de Datos)El modelo de datos relacional (Base de Datos)
El modelo de datos relacional (Base de Datos)Jose Carlos Guerra
 
Modelo de bases de datos (william mata 26550902)
Modelo de bases de datos (william mata 26550902)Modelo de bases de datos (william mata 26550902)
Modelo de bases de datos (william mata 26550902)WilliamMata7
 
Modelos de-datos
Modelos de-datosModelos de-datos
Modelos de-datoslelyydrogo
 
Modelos de datos
Modelos de datosModelos de datos
Modelos de datosgberz
 
Ut3 apuntes diseno_de_bbdd_parte_ii_el_modelo_relacional
Ut3 apuntes diseno_de_bbdd_parte_ii_el_modelo_relacionalUt3 apuntes diseno_de_bbdd_parte_ii_el_modelo_relacional
Ut3 apuntes diseno_de_bbdd_parte_ii_el_modelo_relacionalCarlos Villarroel González
 
Base de datos
Base de datosBase de datos
Base de datosVictor
 
Modelos de bdd y modelos de datos Rafael Olivares
Modelos de bdd y modelos de datos Rafael OlivaresModelos de bdd y modelos de datos Rafael Olivares
Modelos de bdd y modelos de datos Rafael OlivaresRafaelOlivares22
 
Creación de base de datos
Creación de base de datosCreación de base de datos
Creación de base de datosUTN
 
Modelos de bases de datos
Modelos de bases de datosModelos de bases de datos
Modelos de bases de datosJperez98
 
EL MODELO BASE DE DATOS Y TIPOS.pptx
EL MODELO BASE DE DATOS Y TIPOS.pptxEL MODELO BASE DE DATOS Y TIPOS.pptx
EL MODELO BASE DE DATOS Y TIPOS.pptxjowibohi2013
 

Similar a Integración de esquemas para resolver conflictos semánticos y de datos (20)

Base de datos 22222
Base de datos 22222Base de datos 22222
Base de datos 22222
 
Modelo de datos
Modelo de datosModelo de datos
Modelo de datos
 
Modelo de datos
Modelo de datosModelo de datos
Modelo de datos
 
Base datos f02
Base datos f02Base datos f02
Base datos f02
 
74 221-1-pb
74 221-1-pb74 221-1-pb
74 221-1-pb
 
Modelado de datos
Modelado de datosModelado de datos
Modelado de datos
 
Base de datos
Base de datosBase de datos
Base de datos
 
Bdd2.1
Bdd2.1Bdd2.1
Bdd2.1
 
El modelo de datos relacional (Base de Datos)
El modelo de datos relacional (Base de Datos)El modelo de datos relacional (Base de Datos)
El modelo de datos relacional (Base de Datos)
 
Módulo de Herramientas case
Módulo de Herramientas caseMódulo de Herramientas case
Módulo de Herramientas case
 
Modelo de bases de datos (william mata 26550902)
Modelo de bases de datos (william mata 26550902)Modelo de bases de datos (william mata 26550902)
Modelo de bases de datos (william mata 26550902)
 
Modelos de-datos
Modelos de-datosModelos de-datos
Modelos de-datos
 
Informatica
InformaticaInformatica
Informatica
 
Modelos de datos
Modelos de datosModelos de datos
Modelos de datos
 
Ut3 apuntes diseno_de_bbdd_parte_ii_el_modelo_relacional
Ut3 apuntes diseno_de_bbdd_parte_ii_el_modelo_relacionalUt3 apuntes diseno_de_bbdd_parte_ii_el_modelo_relacional
Ut3 apuntes diseno_de_bbdd_parte_ii_el_modelo_relacional
 
Base de datos
Base de datosBase de datos
Base de datos
 
Modelos de bdd y modelos de datos Rafael Olivares
Modelos de bdd y modelos de datos Rafael OlivaresModelos de bdd y modelos de datos Rafael Olivares
Modelos de bdd y modelos de datos Rafael Olivares
 
Creación de base de datos
Creación de base de datosCreación de base de datos
Creación de base de datos
 
Modelos de bases de datos
Modelos de bases de datosModelos de bases de datos
Modelos de bases de datos
 
EL MODELO BASE DE DATOS Y TIPOS.pptx
EL MODELO BASE DE DATOS Y TIPOS.pptxEL MODELO BASE DE DATOS Y TIPOS.pptx
EL MODELO BASE DE DATOS Y TIPOS.pptx
 

Más de javierluciohuancahua

2017_maquina-publicidad_978-84-7993-322-7.pdf
2017_maquina-publicidad_978-84-7993-322-7.pdf2017_maquina-publicidad_978-84-7993-322-7.pdf
2017_maquina-publicidad_978-84-7993-322-7.pdfjavierluciohuancahua
 
Aclaraciones historicas sobre la Guerra del Pacifico - Roberto Querejazu Calv...
Aclaraciones historicas sobre la Guerra del Pacifico - Roberto Querejazu Calv...Aclaraciones historicas sobre la Guerra del Pacifico - Roberto Querejazu Calv...
Aclaraciones historicas sobre la Guerra del Pacifico - Roberto Querejazu Calv...javierluciohuancahua
 
Historia Secreta de las SS ( PDFDrive ).pdf
Historia Secreta de las SS ( PDFDrive ).pdfHistoria Secreta de las SS ( PDFDrive ).pdf
Historia Secreta de las SS ( PDFDrive ).pdfjavierluciohuancahua
 
Contabilidad-y-finanzas-para-dummies-Oriol-Amat-_3_.pdf
Contabilidad-y-finanzas-para-dummies-Oriol-Amat-_3_.pdfContabilidad-y-finanzas-para-dummies-Oriol-Amat-_3_.pdf
Contabilidad-y-finanzas-para-dummies-Oriol-Amat-_3_.pdfjavierluciohuancahua
 
La-historia-militar-hoy-Investigaciones-y-tendencias.pdf
La-historia-militar-hoy-Investigaciones-y-tendencias.pdfLa-historia-militar-hoy-Investigaciones-y-tendencias.pdf
La-historia-militar-hoy-Investigaciones-y-tendencias.pdfjavierluciohuancahua
 
Historia de la guerra ( PDFDrive ).pdf
Historia de la guerra ( PDFDrive ).pdfHistoria de la guerra ( PDFDrive ).pdf
Historia de la guerra ( PDFDrive ).pdfjavierluciohuancahua
 
Metodología de la investigación ( PDFDrive ).pdf
Metodología de la investigación ( PDFDrive ).pdfMetodología de la investigación ( PDFDrive ).pdf
Metodología de la investigación ( PDFDrive ).pdfjavierluciohuancahua
 
REGLAMENTO DE ORDEN CERRADO ARC 3RA.pdf
REGLAMENTO DE ORDEN CERRADO ARC 3RA.pdfREGLAMENTO DE ORDEN CERRADO ARC 3RA.pdf
REGLAMENTO DE ORDEN CERRADO ARC 3RA.pdfjavierluciohuancahua
 
422975592-Manual-Del-Uso-de-La-Espada.pdf
422975592-Manual-Del-Uso-de-La-Espada.pdf422975592-Manual-Del-Uso-de-La-Espada.pdf
422975592-Manual-Del-Uso-de-La-Espada.pdfjavierluciohuancahua
 

Más de javierluciohuancahua (19)

Andrajos Armando Montenegro.pdf
Andrajos Armando Montenegro.pdfAndrajos Armando Montenegro.pdf
Andrajos Armando Montenegro.pdf
 
andres de santa cruz 1829.pdf
andres de santa cruz  1829.pdfandres de santa cruz  1829.pdf
andres de santa cruz 1829.pdf
 
2017_maquina-publicidad_978-84-7993-322-7.pdf
2017_maquina-publicidad_978-84-7993-322-7.pdf2017_maquina-publicidad_978-84-7993-322-7.pdf
2017_maquina-publicidad_978-84-7993-322-7.pdf
 
Aclaraciones historicas sobre la Guerra del Pacifico - Roberto Querejazu Calv...
Aclaraciones historicas sobre la Guerra del Pacifico - Roberto Querejazu Calv...Aclaraciones historicas sobre la Guerra del Pacifico - Roberto Querejazu Calv...
Aclaraciones historicas sobre la Guerra del Pacifico - Roberto Querejazu Calv...
 
ley348.pdf
ley348.pdfley348.pdf
ley348.pdf
 
BOL90299.pdf
BOL90299.pdfBOL90299.pdf
BOL90299.pdf
 
Historia Secreta de las SS ( PDFDrive ).pdf
Historia Secreta de las SS ( PDFDrive ).pdfHistoria Secreta de las SS ( PDFDrive ).pdf
Historia Secreta de las SS ( PDFDrive ).pdf
 
Contabilidad-y-finanzas-para-dummies-Oriol-Amat-_3_.pdf
Contabilidad-y-finanzas-para-dummies-Oriol-Amat-_3_.pdfContabilidad-y-finanzas-para-dummies-Oriol-Amat-_3_.pdf
Contabilidad-y-finanzas-para-dummies-Oriol-Amat-_3_.pdf
 
La-historia-militar-hoy-Investigaciones-y-tendencias.pdf
La-historia-militar-hoy-Investigaciones-y-tendencias.pdfLa-historia-militar-hoy-Investigaciones-y-tendencias.pdf
La-historia-militar-hoy-Investigaciones-y-tendencias.pdf
 
Historia de la guerra ( PDFDrive ).pdf
Historia de la guerra ( PDFDrive ).pdfHistoria de la guerra ( PDFDrive ).pdf
Historia de la guerra ( PDFDrive ).pdf
 
Guia-Normas-APA-7ma-edicion.pdf
Guia-Normas-APA-7ma-edicion.pdfGuia-Normas-APA-7ma-edicion.pdf
Guia-Normas-APA-7ma-edicion.pdf
 
Metodología de la investigación ( PDFDrive ).pdf
Metodología de la investigación ( PDFDrive ).pdfMetodología de la investigación ( PDFDrive ).pdf
Metodología de la investigación ( PDFDrive ).pdf
 
REGLAMENTO DE ORDEN CERRADO ARC 3RA.pdf
REGLAMENTO DE ORDEN CERRADO ARC 3RA.pdfREGLAMENTO DE ORDEN CERRADO ARC 3RA.pdf
REGLAMENTO DE ORDEN CERRADO ARC 3RA.pdf
 
422975592-Manual-Del-Uso-de-La-Espada.pdf
422975592-Manual-Del-Uso-de-La-Espada.pdf422975592-Manual-Del-Uso-de-La-Espada.pdf
422975592-Manual-Del-Uso-de-La-Espada.pdf
 
Constitucion bolivia
Constitucion boliviaConstitucion bolivia
Constitucion bolivia
 
Ti cs y-proyecto-aula
Ti cs y-proyecto-aulaTi cs y-proyecto-aula
Ti cs y-proyecto-aula
 
Negrito
NegritoNegrito
Negrito
 
Docrda
DocrdaDocrda
Docrda
 
Mapa mental actual cropped
Mapa mental actual croppedMapa mental actual cropped
Mapa mental actual cropped
 

Último

SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxlclcarmen
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIAAbelardoVelaAlbrecht1
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALEDUCCUniversidadCatl
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptxJunkotantik
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...JAVIER SOLIS NOYOLA
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfsamyarrocha1
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxdanalikcruz2000
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfDannyTola1
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docxAgustinaNuez21
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para eventoDiegoMtsS
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxJUANSIMONPACHIN
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 

Último (20)

SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIATRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
TRIPTICO-SISTEMA-MUSCULAR. PARA NIÑOS DE PRIMARIA
 
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMALVOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
VOLUMEN 1 COLECCION PRODUCCION BOVINA . SERIE SANIDAD ANIMAL
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptx
 
VISITA À PROTEÇÃO CIVIL _
VISITA À PROTEÇÃO CIVIL                  _VISITA À PROTEÇÃO CIVIL                  _
VISITA À PROTEÇÃO CIVIL _
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdf
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
TEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdfTEST DE RAVEN es un test conocido para la personalidad.pdf
TEST DE RAVEN es un test conocido para la personalidad.pdf
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docx
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para evento
 
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
Repaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia GeneralRepaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia General
 

Integración de esquemas para resolver conflictos semánticos y de datos

  • 1. Colección de Tesis Digitales Universidad de las Américas Puebla Alvarez Carrión, Guillermo 3.1 Conflictos de Esquema Para que el usuario de un MDBMS pueda accesar de manera transparente y uniforme la información almacenada en diferentes componentes de bases de datos, se necesita resolver los conflictos de heterogeneidad semántica y de datos. La idea de resolver los conflictos es lograr una integración de esquemas, que permita a los usuarios de MDBMS formular solo una consulta para n Bases de Datos en lugar de n consultas, una para cada Base de Datos. El presente capítulo presenta la clasificación de los conflictos de esquema y de datos; además describe de manera detallada, como es que se presentan los conflictos al integrar las Bases de Datos Componentes (BDC´s). Se revisa y discute la metodología propuesta para lograr la integración de esquemas. La metodología de integración se describe, considerando los conflictos y casos particulares para el integrador de esquemas propuesto en este trabajo de investigación. Debido a que las BDC´s operan independientemente (sin un control centralizado o coordinador distribuido), éstas pueden presentar discrepancia estructural y de representación. Estas diferencias permiten identificar y clasificar los conflictos de esquema manejados durante el proceso de integración. El conjunto de conflictos identificados por [Kim y Seo, 1991] para la integración de esquemas se describen en los párrafos siguientes. 3.1.1 Conflictos en tablas Conflictos de nombrado de tablas Nombres diferentes para tablas equivalentes.- Ocurre cuando se asignan nombres diferentes a tablas semánticamente equivalentes (sinónimos). a. Nombres iguales para tablas no equivalentes.- Cuando se asigna el mismo nombre a tablas semánticamente diferentes (homónimos). b. 1
  • 2. 3.2 Conflictos de datos Conflictos en la estructura de las tablas Atributos faltantes.- La conceptualización del diseño de un esquema de BD puede llevar a la omisión de atributos que no se consideren representativos. a. Atributos implícitos.- En ocasiones los atributos existentes pueden ser suficientes para deducir algún otro atributo requerido para la integración. b. Conflictos en restricciones de integridad.- En esta categoría se incluyen las deferencias que pueden surgir con respecto a la selección de llaves primarias, secundarias, extranjeras y conflictos en medida de la integridad referencial. Conflictos en la organización de la información.- El número de tablas requeridas para modelar la BD en cada componente puede diferir de acuerdo a la conceptualización de solución de cada diseñador. 3.1.2 Conflictos en atributos Conflictos de nombrado de atributos.- El concepto de sinónimo y homonimia aplicado a los conflictos de nombrado de tablas son aplicables a éstos tipos de conflictos. Conflictos en valores por ausencia.- La definición implícita de algunos valores por ausencia asignados por DBMS, podría llevar a contradicciones en la semántica de los datos. Conflictos por restricciones de asignación de valores a los atributos Conflictos en los tipos de datos.- Los tipos de datos pueden diferir en cuanto al criterio de diseño de cada aplicación. a. Conflictos en restricciones de dominio .- Reglas impuestas para a asignación de valores o consideración en los criterios de unicidad. b. Conflictos por la cardinalidad y grado de atomicidad.- El grado de detalle de cada atributo puede ser distinto en cada aplicación. Además, cada modelo de información establece restricciones y posibilidades de estructuración muy diferentes. Conflictos en la representación de la información.- Puede presentarse el caso de que el mismo concepto se presente como una entidad en una aplicación y en otra como un solo atributo. 2
  • 3. 3.3 Modelado de datos en los esquemas locales y federados Aún a pesar de tener esquemas de BDC´s equivalentes en cuanto a la estructura de sus tablas y atributos, es posible presentar otra serie de problemas identificados como conflictos de datos, dichos conflictos presentados por [Kim y Seo 1990], se describen a continuación: Conflictos entre los valores.- Cuando se espera que instancias equivalentes tengan los mismos valores, pero muestran inconsistencia debido a que los datos son capturados incorrectamente o los datos son obsoletos. Diferencias en la representación.- Situaciones de contexto y cultura organizacional, entre otros factores pueden llevar a que cada BDC seleccione una representación distinta en la información. Dichas inconsistencias pueden presentarse por: Notaciones diferentes.- Cuando existen diferentes formas para representar un mismo dato. (p.e. calificaciones numéricas o con escalas de letras) a. Unidades distintas.- La diversidad de unidades, sobre todo para valores numéricos, trae consigo problemas de interpretación. (p.e. la diferencia en el sistema de medición ingles y el internacional) b. Diferencias en las representaciones.- Cuando existen diferentes formas para representar un valor de un atributo. (p.e. para el atributo Estado se puede tener: Tlaxcala, Tlax., Tx, etc.) c. El modelado de datos es el proceso de crear una representación consistente de los datos del usuarios. Existen diferentes propuestas de modelado, tales como el de red, jerárquico, relacional y orientado a objetos, cada uno con características particulares de diseño y representación. Para la propuesta de integración de este proyecto se considera exclusivamente el modelo relacional, como requerimiento tanto para los esquemas locales como para los esquemas globales generados. La justificación de la utilización de este modelo, es que sigue siendo uno de los estándares de modelado más utilizado en la industria de las Bases de Datos. El modelo relacional, basado en la teoría de conjuntos usa como primitiva básica de construcción la relación. Una relación es una tabla 3
  • 4. 3.4 Metodología de integración de esquemas bidimensional. Cada hilera de la tabla contiene datos que pertenecen a alguna cosa o porción de una cosa. Cada columna de la tabla contiene datos sobre atributos. Las hileras son también llamadas tuplas y las columnas atributos Para que una tabla sea una relación, esta debe cumplir ciertas restricciones. Primero, los atributos deben ser atómicos. Todos los valores en algún atributo deben ser de la misma clase. Cada columna debe tener un nombre único y el orden de las columnas en la tabla es insignificante. Finalmente, dos tuplas en la tabla no pueden se idénticas. Es importante tomar en cuenta estas consideraciones para la selección apropiada de las BDC´s y para garantizar una consistencia con la metodología de integración propuesta. La necesidad de integrar diversas BDC´s trae consigo la necesidad de utilización de metodologías formales que permitan un proceso de integración confiable y seguro. Una metodología descompone la integración de esquemas en un número de tareas que pueden ligarse en un proceso interactivo que ofrezca como resultado un esquema global para DBMS federados fuertemente acoplado. Con la idea de mantener un balance entre simplicidad y rentabilidad se describe la metodología de integración propuesta por [Batini y Lenzerini 1986], la cual consiste de cuatro fases: preintegración, comparación de esquemas, adecuación de esquemas y unión de esquemas. Figura 3.1 Entradas y salidas en la integración de esquemas 3.5.2 Compartición de información 4
  • 5. 3.5 Preintegración 3.6 Comparación de esquemas Otro aspecto importante de esta fase es definir qué información se compartirá y con qué restricciones de acceso. Este proceso podría entenderse como un análogo a la definición de vistas en el modelo relacional. En el contexto de Bases de Datos Federadas, esto puede verse como la determinación de las entidades que cada Base de Datos Componente compartirá con la Federación y su definición en un esquema de componentes. Figura 3.2 Estrategias para el proceso de integración Figura 3.3 Estrategia binaria de escalera para el proceso de integración. En este ejemplo existe la descripción del mismo número de objetos en cada base de datos local, pero a diferente nivel de detalle por lo que es posible establecer la relación lógica a través de un atributo común y ofrecer un acceso global a la información sin redundancias. Ambos tipos de integración consideran información espacial (modelo basado en fragmentos) e información descriptiva. 5
  • 6. 3.7 Adecuación de esquemas La operación inversa, partiendo de la cadena UBICACION 1 , puede ser, en algunos casos más difícil. Esto es debido a que en ocasiones es casi imposible proponer los criterios para decidir qué parte de la cadena original corresponde a cada uno de los atributos propuestos para la otra representación. Esto, sin embargo, puede llevar a conflictos con el orden que se usa para cada representación. Debe considerarse , que lo anterior es posible si el sistema soporta solamente consultas, ya que para las operaciones de modificaciones y alta de información, dada la ubicación como un solo atributo, plantea la necesidad de decidir que parte pertenece a cada atributo de la segunda representación. 3.7.4 Claves primarias El uso de llaves primarias en el modelo relacional permite, en la integración heterogénea establecer la operación de join para integrar los componentes locales. Entonces, será de suma importancia definir cuales son los atributos considerados como claves primarias de cada BDC. 3.7.5 Nivel de precisión El modelado de datos espaciales a través de la técnica de Quadtree (Ver Apéndice A para detalle de esta técnica) permite representar objetos espaciales a diferentes niveles de precisión. A mayor nivel de precisión, mayor el detalle de representación obtenido del objeto. Las BDC´s que representan información espacial, pueden manejar niveles 6
  • 7. 3.8 Unión y reestructuración de precisión diferentes, lo que implicaría una manipulación a nivel de implementación para homogeneizar la representación de los objetos espaciales a un mismo nivel de resolución. Al considerar el nivel de precisión como un conflicto es posible lograr dicha homogeneización a nivel de integración de esquemas. Una vez solucionados los conflictos en la fase anterior, es posible la integración de los esquemas. Después de la integración sigue una fase de reestructuración interactiva hasta que se llegue al esquema global deseado. La evaluación de esquema final, es a través de los siguientes criterios: Completitud y Validez. El esquema integrado debe contener todos los conceptos presentes en los esquemas componentes. El esquema integrado debe ser una representación de la unión de los dominios de las aplicaciones asociadas a los esquemas [Batini y Col 1986]. Representación mínima.- Si el mismo concepto se encuentra en más de un concepto componente, este se debe representar sólo una vez en el esquema integrado. Comprensibilidad.- El esquema global final debe ser fácil de entender tanto por el diseñador como por el usuario final. La comprensión detallada de los conflictos de esquema y de datos que se 7
  • 8. presentan en este capítulo, permitirá plantear una mecanismo de solución que ofrezca un acceso transparente a las Bases de Datos Componentes. Los conceptos de equivalencia y tipo de integración requieren de atención especial para garantizar una selección apropiada de los componentes a integrar. La metodología de integración que se discute, establece un patrón de referencia para llevar a cabo la integración de manera semiautomática con la propuesta que se plantea en los capítulos siguientes. Alvarez Carrión, G. 1999. Integración de esquemas en bases de datos heterogéneas fuertemente acopladas. Tesis Maestría. Ciencias con Especialidad en Ingeniería en Sistemas Computacionales. Departamento de Ingeniería en Sistemas Computacionales, Escuela de Ingeniería, Universidad de las Américas Puebla. Mayo. Derechos Reservados © 1999. 8