Este documento presenta una breve introducción a las bases de datos semánticas. Explica el origen de los modelos semánticos en la década de 1970 y su motivación de representar mejor el mundo real. Describe el manejo conceptual de las bases de datos semánticas, separando la información del nivel lógico para brindar mayor comprensión al usuario. Finalmente, discute consideraciones importantes como la ambigüedad del lenguaje natural y cómo afecta a la integridad semántica.
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Bases de Datos Semánticas panorama breve
1. Un breve panorama sobre las Bases de Datos
Sem´ nticas
a
Pedro Shiguihara Ju´ rez
a
Escuela de Inform´ tica
a
Universidad Nacional de Trujillo
Trujillo, Per´
u
Abstract— El presente documento trata de dar una vista Base de Datos Relacional, adem´ s agregaba componentes tales
a
general a las Bases de Datos Sem´ nticas, tratando de identificar
a como Knowledge Base 2 —podr´a traducirse como base del
ı
sus or´genes y la motivaci´ n que ha provocado en los investi-
ı o conocimiento—.
gadores, su modelamiento de datos, arquitectura del sistema y la
integridad sem´ ntica. Explica adem´ s sus beneficios y aspectos
a a En este documento se presenta la secci´ n del problema la
o
a tomarse en consideraci´ n debido a los problemas que se
o ´
cual motiva el surgimiento e implementacion de la Base
deber´ afrontar al momento de modelamiento sem´ ntico de los
a a de Datos Sem´ ntica, en la secci´ n 3 se explica el manejo
a o
datos. conceptual donde act´ a el Modelamiento de Datos Sem´ ntica,
u a
seguidamente en la secci´ n 4 las ventajas del modelamiento
o
PALABRAS CLAVES
sem´ ntico, en la secci´ n 5 las consideraciones de un modelado
a o
Knowledge base de datos sem´ ntico que puede da˜ ar la integridad sem´ ntica
a n a
I. ´
I NTRODUCCI ON [7][8][9] y finalmente la secci´ n 6 de conslusiones acerca de
o
esto.
´
[1] En 1970, el Modelo Relacional revoluciono el campo
´
de las Bases de Datos, debido al logro de la separacion de la II. P ROBLEMA : A SMILAR EL MUNDO REAL
representaci´ n l´ gica del dato de la implementaci´ n f´sicia,
o o o ı Hammer[2] ejemplifica la iteracci´ n con la base de datos,
o
lo que produjo en adelante el desarrollo de lenguajes de ´
y asevera que esta es m´ s que una colecci´ n de valores, tiene
a o
consultas. transiciones en cada punto de la l´nea del tiempo, por ello
ı
La historia del modelamiento sem´ ntica, tambi´ n data hacia
a e experimenta cambios en su contenido. En esta ejemplificacion ´
esas fechas. Los modelos sem´ nticos fueron introducidos co-
a cada punto puede verse como una instant´ nea que representa
a
mo herramientas de dise˜ o de esquemas 1 . El motivo principal
n el estado del sistema de aplicaci´ n de la Base de Datos.
o
de su uso radicaba en la exactitud del modelo de datos, Por tanto esto refleja una secuencia de eventos a trav´ s del
e
como muchos autores aseveran, el modelado sem´ ntico, no
a ´
tiempo, ocurrentes en el ambiente de aplicacion. Los autores
es mas, que una representaci´ n del mundo real [3][4][2][1],
o relacionados a este tema definen el Modelado Sem´ ntico de
a
estas propiedades no las ten´an las aplicaciones de bases de
ı una Base de Datos como el Modelo del Sistema del Mundo
datos t´picas.
ı Real, es decir un espejo de la estructura del sistema que
[1] El primer modelo sem´ ntico publicado apareci´ en 1974, el
a o modelo —una empresa por ejemplo—.
´
area madur´ con el desarrollo de muchos modelos importantes
o
—como Semantic Data Model [2], General Semantic Data III. M ANEJO C ONCEPTUAL
Model [2][9], Iris Data Model, Sem-Object Data Model [3][4], ´
Todo esto enfoca la necesidad de establecer una interaccion
IFO [6]—. Hoy en d´a se ha tratado de estandarizar ello,
ı con el usuario de una manera m´ s f´ cil, tratando de algu-
a a
con la llegada del est´ ndar SQL3 —a˜ o 1999—, que no
a n na manera brindar la propiedad de transparencia al usuario
es mas que una extensi´ n del modelo relacional. [2][6] En
o ´
mediante un modelo conceptual en vez de logico, ya que le
´
d´ cadas anteriores entre 1970 y 1980 se planteaba una division
e resultar´a al usuario m´ s familiar.
ı a
entre el modelo conceptual —modelado sem´ ntico— y el
a Un esquema l´ gico est´ expresado de una particular clase de
o a
modelo l´ gico —modelado relacional—, para 1990 Rishe
o estructura de datos llamado Modelo de Datos. Los modelos de
[3][4] planteaba un modelo que suger´a colocar el nombre
ı estos datos son de bajo nivel y orientado a la m´ quina, todo
a
de Semantic-SQL, que pueda ser una est´ ndar en lenguajes
a ´ o
ello requiere que se expresa a nivel de representacion l´ gica
de consultas sem´ nticas y planteaba una arquitectura del
a que en t´ rminos de significancia. En el modelo relacional la
e
sistema —ver figura en ap´ ndice— donde el modelo relacional
e informaci´ n sem´ ntica est´ impl´cita —tanto as´ que no se
o a a ı ı
actuaba de forma independiente al modelo sem´ ntico, este
a podr´a extraer en casi todos los casos— y se pierden en el
ı
´
ultimo actuaba de manera directa con el usuario y traduc´a ı modelo [3]. Por ello Hammer explica que la sem´ ntica deber´a
a ı
la consulta a un modelo l´ gico entendible por el Sistema de
o estar separada, Rishe tambi´ n lo plantea, y aplicada por el
e
1 Un esquema pod´a ser dise˜ ado en un alto nivel de modelado sem´ ntico
ı n a 2 KB tambi´ n est´ presente en los fundamentos de la Web Sem´ ntica,
e a a
´
y traducido en un medio tradicional para la implementacion expl´citamente en Resource Description Framework (RDF)
ı
2. usuario directamente. IV-C. Abstracci´ n de datos
o
El modelo en el nivel conceptual se trata de no perder la Esto permnite proveer de datos derivados —Knowledge
significancia de la informaci´ n que provean las relaciones,
o base—, que est´ n relacionados m´ s a la noci´ n que tiene el
a a o
entre entidades y brinde la facilidad para hacer consultas sobre usuario acerca de las Bases de Datos. Estos datos no est´ n
a
ello [4]. incorporados al esquema, es decir es un nuevo tipo de dato
´
—puede tomarse como una entidad nueva en una relacion ISA
por ejemplo—.
V. ´
C ONSIDERACIONES DE UN MODELADO SEM ANTICO
En esta secci´ n explicamos dos consideracione importantes,
o
la primera es la forma en que ser´ implementada una Base
a
de Datos Sem´ ntica y la segunda est´ relacionada con la
a a
integridad sem´ ntica y la ambig¨ edad.
a u
V-A. Implementaci´ n y representaci´ n f´sica
o o ı
Hammer [2] explica que si bien hay beneficio por la
facilidad de comprensi´ n y manejo de la Base de Datos,
o
tambi´ n existen grandes consideraciones de, ¿C´ mo ser´ la
e o a
Fig. 1. Interacci´ n directa entre BD Sem´ ntica y usuario
o a implementaci´ n? y ¿C´ mo ser´ la representaci´ n f´sica?, esto
o o a o ı
trae consigo por supuesto una complejidad superior a la de una
Base de Datos con el Modelo Relacional. Esto se puede ver
IV. ´
V ENTAJAS DEL MODELADO SEM ANTICO en Sistema de arquitectura de la figura en el ap´ ndice.
e
En esta secci´ n se tratar´ tres ventajas, las m´ s resaltantes
o a a V-B. Ambig¨ edad del lenguaje natural e Integridad sem´ nti-
u a
acerca de la implementaci´ n de una Base de Datos Sem´ ntica.
o a ca
Las bases de datos sem´ ntica se tratan de expresar como
a
IV-A. Separaci´ n de componentes conceptuales y l´ gicos
o o
un lenguaje natural —a nivel conceptual— para las consultas
Los usuarios cuando realizan una consulta en una Base realizadas por el usuario.Esto como se menciona en [7] libera
de Datos Relacional, navegan a trav´ s de ella por medio de
e al usuario de una tarea de comprensi´ n de la base de datos
o
un esquema con tablas de registros, logran obtener los datos —como explicamos en las ventajas—. Pero resalta un nuevo
requeridos mediante operaciones asociadas como juntura y problema, la previsi´ n de capacidades de actualizaci´ n.
o o
proyecci´ n que son las m´ s comunes. Ac´ se presenta un
o a a Por el mismo hecho de usarse un lenguaje casi natural,
ejemplo extra˜ ido de [1], donde se plante el caso: Mary es un
n tiende a la ambig¨ edad, este nuevo problema no se ve en
u
agente de viajes, y se desea conocer la ciudad del empleador las consultas tradicionales. Esto es, debido a que el usuario
de Mary.. Para obtener esto en un lenguaje SQL se tendr´a ı est´ fraseando sus peticiones con respecto a su punto de vista
a
que tener expl´citamente el conocimiento de las tablas donde
ı de la Base de Datos, lo cual puede ser una simplificacion o ´
se encuentra la informaci´ n del negocio y lugar donde vive el
o una transformaci´ n de la estructura acutal de la base de datos,
o
empleador. La sentencia SQL queda como sigue: entendi´ ndose que el usuario no est´ ´ntimamente ligado
e a ı
con la estructura interna de la base de datos como ser´a su ı
SELECT city
dise˜ ador.
n
FROM BUSINESS
Las solicitudes de actualizaci´ n —insertar, eliminar,
o
WHERE BNAME in
modificar—, podr´a resultar en diferentes efectos, no
ı
SELECT EMPLOYER
esperados por el usuario. Incluso el usuario podr´a hacer
ı
FROM BUSTRAV
peticiones que sean imposibles —el problema de devolucion ´
WHERE PNAME=’Mary’
null—. El trato que se da a la ambig¨ edad es seleccionar
u
Es decir obtiene primero el nombre del empleador de Mary entre todos los estados posibles, el que involucra menos
por selecci´ n y luego la ciudad de donde pertenece el negocio
o modificaciones a lo largo de la base de datos, para ello se
donde trabaja el empleador. siguen ciertas consideraciones que se explican en docuemtnso
asociados a esta bibliograf´a [9][7][8][5]. Shin [5] plantea
ı
IV-B. Sobrecarga sem´ ntica
a una clasificaci´ n de posibles caminos que puede tomar una
o
consulta y en la bibliograf´a [10] se plantea el est´ ndar SQL3
ı a
Una relaci´ n es usada normalemente en el Modelo Rela-
o
que trata el problema. Para Shin toma el siguiente camino:
´
cional, muchos tipos diferentes de informacion, la existencia
de entidades impl´citas, propiedades, estructura y asociaciones
ı CC: Lingu´sticamente Completo;
ı
entre ellos. El Modelo Sem´ ntico de Datos provee una sepa-
a Datos sem´nticamente Completos
a
raci´ n de esta informaci´ n, mediante la abstracci´ n de datos.
o o o IC: Lingu´sticamente Incompleto;
ı
3. Datos sem´nticamente Completos
a
CI: Lingu´sticamente Completo;
ı
Datos sem´nticamente Incompletos
a
II: Lingu´sticamente Incompleto;
ı
Datos sem´nticamente Incompletos
a
Fig. 2. taxonom´a dada por Shin [5]
ı Fig. 3. Ejemplos extra´dos de [10]
ı
Los IC tienen que ver con errores de tipograf´a, gram´ tical-
ı a
mente incorrecta, referencias indefinidas. CI tiene que ver R EFERENCES
con t´ rminos desconocidos o ambig¨ os, t´ rminos vagos o
e u e [1] HULL, RICHARD y ROGER KING, Semantic Database Modeling: Sur-
vey, Applications, and Research Issues, Computer Science Department,
informaci´ n faltante, par´ metros inconsistentes y sem´ ntica-
o a a University of Southern California, ACM Press, September 1987.
mente sin sentido; estos son los errores m´ s comunes que
a [2] HAMMER, MICHAEL y DENNIS MCLEOD, The Semantics Data Mod-
puede llevarse a cabo. Los II son errores sint´ cticamente y
a el: A Modelling Mechanism for Data Base Applications, MIT Laboratory
for Computer Science, Cambridge, ACM Press, 1978.
sem´ nticamente sin sentido. En la bibliograf´a [5] se explica
a ı [3] RISHE NAPHTALI D., Semantic SQL: A Semantic Wrapper for Re-
de manera detallada el problema, aqu´ se presenta la taxonom´a
ı ı lational Databases, School of Computer Science, Florida International
dada por Shin. University, Miami, 2003.
[4] RISHE N., SHU-CHING C., ALEXANDER V., JUN Y., XIAOL-
ING L., ARTYOM S., RUKSHAM A., XIAOBIN M., DMIT-
VI. C ONCLUSIONES RY V., Semantic Access for Querying Databases, School of
Computer Science, Floritda International University, Miami. URL:
El modelado sem´ ntico resume la complejidad l´ gica
a o http://www.cs.fiu.edu/˜ hens/PDF/VLD800.pdf
c
representativa de la Base de Datos, esto permite mayor [5] SHIN, D. G., Semantics Modeling Issues for Processing Natural Lan-
guage Database Queries, Computer Science and Engineering Department,
usabilidad por parte de m´ s usuarios, se extiende el
a University of Connecticut, ACM Press, January 1990.
amplio dominio para la redes de comunicaciones donde [6] ABITEBAW, SERGE Y RICHARD HULL, IFO: A Format Semantic
´
los usuarios no son conscientes de la estructura logica de Database Model, Institut National de Recherche en Informatique et en
Automatique, ACM Press, November 1987.
una base de datos remota. [7] DAVIDSON, JAMES y JERROLD KAPLAN, Natural Language Access
La abstracci´ n de datos y la separaci´ n de componente
o o to Data Bases: Interpreting Update Requests, Computer Science Depart-
l´ gicos y conceptuales son propiedades importantes en
o ment, Stanford University, California, ACM Press. April 1983.
[8] CHEN A. y RICHARD HULL, An Execution Model for Limited Ambi-
las Bases de Datos Sem´ ntica por tanto permiten la
a guity Rules and Its Application to Derived Data Update, ACM Press,
representaci´ n de la realidad a modo de espejo.
o December 1995.
Tambi´ n trae consigo mayor complejidad l´ gica y prob-
e o [9] HAMMER, M. y DENNIS MCLEOD, A Framework for Data Base
Semantic Integrity, MIT Laboratories for Computer Science, ACM Press,
lemas de interpretaci´ n de las consultas, debido a su
o 1976.
¨
acercamiento al lenguaje natural, produce ambiguedades. ¨
[10] TURKER, CAN y MICHAEL GERTZ, Semantic integrity support
La base de datos Sem´ ntica permite la adaptaci´ n de
a o in SQL:1999 and commercial (object-)relational database management
systems, Swiss Federal Institute of Technology, Zurich, Switzerland, ACM
datos derivados, no existentes en la base de datos pero Press, 2001.
que para el usuario es obvia su existencia.
El nuevo est´ ndar trata de minimizar el problema de
a
ambig¨ edad en la base de datos.
u
4. VII. ´
A P E NDICE
Fig. 4. Arquitectura de una Base de Datos Sem´ ntica [4]
a