SlideShare una empresa de Scribd logo
1 de 4
Descargar para leer sin conexión
Un breve panorama sobre las Bases de Datos
                         Sem´ nticas
                             a
                                                            Pedro Shiguihara Ju´ rez
                                                                               a
                                                            Escuela de Inform´ tica
                                                                                a
                                                        Universidad Nacional de Trujillo
                                                                 Trujillo, Per´
                                                                              u


   Abstract— El presente documento trata de dar una vista                     Base de Datos Relacional, adem´ s agregaba componentes tales
                                                                                                                  a
general a las Bases de Datos Sem´ nticas, tratando de identificar
                                 a                                            como Knowledge Base 2 —podr´a traducirse como base del
                                                                                                                    ı
sus or´genes y la motivaci´ n que ha provocado en los investi-
       ı                   o                                                  conocimiento—.
gadores, su modelamiento de datos, arquitectura del sistema y la
integridad sem´ ntica. Explica adem´ s sus beneficios y aspectos
               a                    a                                         En este documento se presenta la secci´ n del problema la
                                                                                                                           o
a tomarse en consideraci´ n debido a los problemas que se
                          o                                                                                                    ´
                                                                              cual motiva el surgimiento e implementacion de la Base
deber´ afrontar al momento de modelamiento sem´ ntico de los
      a                                            a                          de Datos Sem´ ntica, en la secci´ n 3 se explica el manejo
                                                                                              a                      o
datos.                                                                        conceptual donde act´ a el Modelamiento de Datos Sem´ ntica,
                                                                                                    u                                  a
                                                                              seguidamente en la secci´ n 4 las ventajas del modelamiento
                                                                                                          o
                         PALABRAS CLAVES
                                                                              sem´ ntico, en la secci´ n 5 las consideraciones de un modelado
                                                                                  a                  o
  Knowledge base                                                              de datos sem´ ntico que puede da˜ ar la integridad sem´ ntica
                                                                                            a                         n                 a
                         I.               ´
                              I NTRODUCCI ON                                  [7][8][9] y finalmente la secci´ n 6 de conslusiones acerca de
                                                                                                                o
                                                                              esto.
                                                    ´
    [1] En 1970, el Modelo Relacional revoluciono el campo
                                                        ´
de las Bases de Datos, debido al logro de la separacion de la                         II.   P ROBLEMA : A SMILAR EL MUNDO REAL
representaci´ n l´ gica del dato de la implementaci´ n f´sicia,
             o o                                      o ı                        Hammer[2] ejemplifica la iteracci´ n con la base de datos,
                                                                                                                    o
lo que produjo en adelante el desarrollo de lenguajes de                                     ´
                                                                              y asevera que esta es m´ s que una colecci´ n de valores, tiene
                                                                                                     a                  o
consultas.                                                                    transiciones en cada punto de la l´nea del tiempo, por ello
                                                                                                                  ı
La historia del modelamiento sem´ ntica, tambi´ n data hacia
                                    a             e                           experimenta cambios en su contenido. En esta ejemplificacion  ´
esas fechas. Los modelos sem´ nticos fueron introducidos co-
                                  a                                           cada punto puede verse como una instant´ nea que representa
                                                                                                                       a
mo herramientas de dise˜ o de esquemas 1 . El motivo principal
                          n                                                   el estado del sistema de aplicaci´ n de la Base de Datos.
                                                                                                                 o
de su uso radicaba en la exactitud del modelo de datos,                       Por tanto esto refleja una secuencia de eventos a trav´ s del
                                                                                                                                      e
como muchos autores aseveran, el modelado sem´ ntico, no
                                                      a                                                                      ´
                                                                              tiempo, ocurrentes en el ambiente de aplicacion. Los autores
es mas, que una representaci´ n del mundo real [3][4][2][1],
                                 o                                            relacionados a este tema definen el Modelado Sem´ ntico de
                                                                                                                                   a
estas propiedades no las ten´an las aplicaciones de bases de
                               ı                                              una Base de Datos como el Modelo del Sistema del Mundo
datos t´picas.
        ı                                                                     Real, es decir un espejo de la estructura del sistema que
[1] El primer modelo sem´ ntico publicado apareci´ en 1974, el
                            a                      o                          modelo —una empresa por ejemplo—.
´
area madur´ con el desarrollo de muchos modelos importantes
            o
—como Semantic Data Model [2], General Semantic Data                                           III.   M ANEJO C ONCEPTUAL
Model [2][9], Iris Data Model, Sem-Object Data Model [3][4],                                                                              ´
                                                                                 Todo esto enfoca la necesidad de establecer una interaccion
IFO [6]—. Hoy en d´a se ha tratado de estandarizar ello,
                        ı                                                     con el usuario de una manera m´ s f´ cil, tratando de algu-
                                                                                                                    a a
con la llegada del est´ ndar SQL3 —a˜ o 1999—, que no
                          a                n                                  na manera brindar la propiedad de transparencia al usuario
es mas que una extensi´ n del modelo relacional. [2][6] En
                           o                                                                                               ´
                                                                              mediante un modelo conceptual en vez de logico, ya que le
                                                             ´
d´ cadas anteriores entre 1970 y 1980 se planteaba una division
  e                                                                           resultar´a al usuario m´ s familiar.
                                                                                      ı               a
entre el modelo conceptual —modelado sem´ ntico— y el
                                                 a                            Un esquema l´ gico est´ expresado de una particular clase de
                                                                                             o        a
modelo l´ gico —modelado relacional—, para 1990 Rishe
          o                                                                   estructura de datos llamado Modelo de Datos. Los modelos de
[3][4] planteaba un modelo que suger´a colocar el nombre
                                         ı                                    estos datos son de bajo nivel y orientado a la m´ quina, todo
                                                                                                                                a
de Semantic-SQL, que pueda ser una est´ ndar en lenguajes
                                             a                                                                                     ´ o
                                                                              ello requiere que se expresa a nivel de representacion l´ gica
de consultas sem´ nticas y planteaba una arquitectura del
                    a                                                         que en t´ rminos de significancia. En el modelo relacional la
                                                                                        e
sistema —ver figura en ap´ ndice— donde el modelo relacional
                            e                                                 informaci´ n sem´ ntica est´ impl´cita —tanto as´ que no se
                                                                                         o      a          a      ı             ı
actuaba de forma independiente al modelo sem´ ntico, este
                                                    a                         podr´a extraer en casi todos los casos— y se pierden en el
                                                                                   ı
´
ultimo actuaba de manera directa con el usuario y traduc´a    ı               modelo [3]. Por ello Hammer explica que la sem´ ntica deber´a
                                                                                                                              a            ı
la consulta a un modelo l´ gico entendible por el Sistema de
                             o                                                estar separada, Rishe tambi´ n lo plantea, y aplicada por el
                                                                                                             e
   1 Un esquema pod´a ser dise˜ ado en un alto nivel de modelado sem´ ntico
                   ı          n                                     a           2 KB tambi´ n est´ presente en los fundamentos de la Web Sem´ ntica,
                                                                                           e     a                                          a
                                                         ´
y traducido en un medio tradicional para la implementacion                    expl´citamente en Resource Description Framework (RDF)
                                                                                  ı
usuario directamente.                                                IV-C. Abstracci´ n de datos
                                                                                    o
El modelo en el nivel conceptual se trata de no perder la               Esto permnite proveer de datos derivados —Knowledge
significancia de la informaci´ n que provean las relaciones,
                               o                                     base—, que est´ n relacionados m´ s a la noci´ n que tiene el
                                                                                    a                a            o
entre entidades y brinde la facilidad para hacer consultas sobre     usuario acerca de las Bases de Datos. Estos datos no est´ n
                                                                                                                               a
ello [4].                                                            incorporados al esquema, es decir es un nuevo tipo de dato
                                                                                                                           ´
                                                                     —puede tomarse como una entidad nueva en una relacion ISA
                                                                     por ejemplo—.

                                                                      V.                                        ´
                                                                            C ONSIDERACIONES DE UN MODELADO SEM ANTICO
                                                                        En esta secci´ n explicamos dos consideracione importantes,
                                                                                     o
                                                                     la primera es la forma en que ser´ implementada una Base
                                                                                                         a
                                                                     de Datos Sem´ ntica y la segunda est´ relacionada con la
                                                                                     a                        a
                                                                     integridad sem´ ntica y la ambig¨ edad.
                                                                                    a                 u

                                                                     V-A.   Implementaci´ n y representaci´ n f´sica
                                                                                        o                 o ı
                                                                        Hammer [2] explica que si bien hay beneficio por la
                                                                     facilidad de comprensi´ n y manejo de la Base de Datos,
                                                                                             o
                                                                     tambi´ n existen grandes consideraciones de, ¿C´ mo ser´ la
                                                                           e                                          o         a
        Fig. 1. Interacci´ n directa entre BD Sem´ ntica y usuario
                         o                       a                   implementaci´ n? y ¿C´ mo ser´ la representaci´ n f´sica?, esto
                                                                                   o       o       a               o ı
                                                                     trae consigo por supuesto una complejidad superior a la de una
                                                                     Base de Datos con el Modelo Relacional. Esto se puede ver
        IV.                              ´
              V ENTAJAS DEL MODELADO SEM ANTICO                      en Sistema de arquitectura de la figura en el ap´ ndice.
                                                                                                                     e
  En esta secci´ n se tratar´ tres ventajas, las m´ s resaltantes
                o            a                    a                  V-B.   Ambig¨ edad del lenguaje natural e Integridad sem´ nti-
                                                                                 u                                           a
acerca de la implementaci´ n de una Base de Datos Sem´ ntica.
                           o                              a          ca
                                                                        Las bases de datos sem´ ntica se tratan de expresar como
                                                                                                  a
IV-A.   Separaci´ n de componentes conceptuales y l´ gicos
                o                                  o
                                                                     un lenguaje natural —a nivel conceptual— para las consultas
   Los usuarios cuando realizan una consulta en una Base             realizadas por el usuario.Esto como se menciona en [7] libera
de Datos Relacional, navegan a trav´ s de ella por medio de
                                      e                              al usuario de una tarea de comprensi´ n de la base de datos
                                                                                                             o
un esquema con tablas de registros, logran obtener los datos         —como explicamos en las ventajas—. Pero resalta un nuevo
requeridos mediante operaciones asociadas como juntura y             problema, la previsi´ n de capacidades de actualizaci´ n.
                                                                                           o                                        o
proyecci´ n que son las m´ s comunes. Ac´ se presenta un
        o                   a                a                       Por el mismo hecho de usarse un lenguaje casi natural,
ejemplo extra˜ ido de [1], donde se plante el caso: Mary es un
              n                                                      tiende a la ambig¨ edad, este nuevo problema no se ve en
                                                                                        u
agente de viajes, y se desea conocer la ciudad del empleador         las consultas tradicionales. Esto es, debido a que el usuario
de Mary.. Para obtener esto en un lenguaje SQL se tendr´a    ı       est´ fraseando sus peticiones con respecto a su punto de vista
                                                                        a
que tener expl´citamente el conocimiento de las tablas donde
               ı                                                     de la Base de Datos, lo cual puede ser una simplificacion o   ´
se encuentra la informaci´ n del negocio y lugar donde vive el
                          o                                          una transformaci´ n de la estructura acutal de la base de datos,
                                                                                      o
empleador. La sentencia SQL queda como sigue:                        entendi´ ndose que el usuario no est´ ´ntimamente ligado
                                                                             e                                a ı
                                                                     con la estructura interna de la base de datos como ser´a su ı
 SELECT city
                                                                     dise˜ ador.
                                                                          n
  FROM BUSINESS
                                                                     Las solicitudes de actualizaci´ n —insertar, eliminar,
                                                                                                         o
  WHERE BNAME in
                                                                     modificar—, podr´a resultar en diferentes efectos, no
                                                                                         ı
    SELECT EMPLOYER
                                                                     esperados por el usuario. Incluso el usuario podr´a hacer
                                                                                                                             ı
    FROM BUSTRAV
                                                                     peticiones que sean imposibles —el problema de devolucion       ´
    WHERE PNAME=’Mary’
                                                                     null—. El trato que se da a la ambig¨ edad es seleccionar
                                                                                                               u
Es decir obtiene primero el nombre del empleador de Mary             entre todos los estados posibles, el que involucra menos
por selecci´ n y luego la ciudad de donde pertenece el negocio
           o                                                         modificaciones a lo largo de la base de datos, para ello se
donde trabaja el empleador.                                          siguen ciertas consideraciones que se explican en docuemtnso
                                                                     asociados a esta bibliograf´a [9][7][8][5]. Shin [5] plantea
                                                                                                    ı
IV-B.   Sobrecarga sem´ ntica
                      a                                              una clasificaci´ n de posibles caminos que puede tomar una
                                                                                    o
                                                                     consulta y en la bibliograf´a [10] se plantea el est´ ndar SQL3
                                                                                                ı                        a
   Una relaci´ n es usada normalemente en el Modelo Rela-
              o
                                                                     que trata el problema. Para Shin toma el siguiente camino:
                                               ´
cional, muchos tipos diferentes de informacion, la existencia
de entidades impl´citas, propiedades, estructura y asociaciones
                   ı                                                    CC: Lingu´sticamente Completo;
                                                                                 ı
entre ellos. El Modelo Sem´ ntico de Datos provee una sepa-
                              a                                             Datos sem´nticamente Completos
                                                                                     a
raci´ n de esta informaci´ n, mediante la abstracci´ n de datos.
    o                    o                         o                    IC: Lingu´sticamente Incompleto;
                                                                                 ı
Datos sem´nticamente Completos
                a
   CI: Lingu´sticamente Completo;
            ı
       Datos sem´nticamente Incompletos
                a
   II: Lingu´sticamente Incompleto;
            ı
       Datos sem´nticamente Incompletos
                a




                Fig. 2. taxonom´a dada por Shin [5]
                               ı                                                       Fig. 3. Ejemplos extra´dos de [10]
                                                                                                             ı


   Los IC tienen que ver con errores de tipograf´a, gram´ tical-
                                                 ı       a
mente incorrecta, referencias indefinidas. CI tiene que ver                                      R EFERENCES
con t´ rminos desconocidos o ambig¨ os, t´ rminos vagos o
      e                                u     e                     [1] HULL, RICHARD y ROGER KING, Semantic Database Modeling: Sur-
                                                                       vey, Applications, and Research Issues, Computer Science Department,
informaci´ n faltante, par´ metros inconsistentes y sem´ ntica-
          o               a                              a             University of Southern California, ACM Press, September 1987.
mente sin sentido; estos son los errores m´ s comunes que
                                              a                    [2] HAMMER, MICHAEL y DENNIS MCLEOD, The Semantics Data Mod-
puede llevarse a cabo. Los II son errores sint´ cticamente y
                                                 a                     el: A Modelling Mechanism for Data Base Applications, MIT Laboratory
                                                                       for Computer Science, Cambridge, ACM Press, 1978.
sem´ nticamente sin sentido. En la bibliograf´a [5] se explica
    a                                         ı                    [3] RISHE NAPHTALI D., Semantic SQL: A Semantic Wrapper for Re-
de manera detallada el problema, aqu´ se presenta la taxonom´a
                                     ı                        ı        lational Databases, School of Computer Science, Florida International
dada por Shin.                                                         University, Miami, 2003.
                                                                   [4] RISHE N., SHU-CHING C., ALEXANDER V., JUN Y., XIAOL-
                                                                       ING L., ARTYOM S., RUKSHAM A., XIAOBIN M., DMIT-
                    VI.    C ONCLUSIONES                               RY V., Semantic Access for Querying Databases, School of
                                                                       Computer Science, Floritda International University, Miami. URL:
     El modelado sem´ ntico resume la complejidad l´ gica
                        a                                 o            http://www.cs.fiu.edu/˜ hens/PDF/VLD800.pdf
                                                                                            c
     representativa de la Base de Datos, esto permite mayor        [5] SHIN, D. G., Semantics Modeling Issues for Processing Natural Lan-
                                                                       guage Database Queries, Computer Science and Engineering Department,
     usabilidad por parte de m´ s usuarios, se extiende el
                                   a                                   University of Connecticut, ACM Press, January 1990.
     amplio dominio para la redes de comunicaciones donde          [6] ABITEBAW, SERGE Y RICHARD HULL, IFO: A Format Semantic
                                                       ´
     los usuarios no son conscientes de la estructura logica de        Database Model, Institut National de Recherche en Informatique et en
                                                                       Automatique, ACM Press, November 1987.
     una base de datos remota.                                     [7] DAVIDSON, JAMES y JERROLD KAPLAN, Natural Language Access
     La abstracci´ n de datos y la separaci´ n de componente
                  o                         o                          to Data Bases: Interpreting Update Requests, Computer Science Depart-
     l´ gicos y conceptuales son propiedades importantes en
      o                                                                ment, Stanford University, California, ACM Press. April 1983.
                                                                   [8] CHEN A. y RICHARD HULL, An Execution Model for Limited Ambi-
     las Bases de Datos Sem´ ntica por tanto permiten la
                                 a                                     guity Rules and Its Application to Derived Data Update, ACM Press,
     representaci´ n de la realidad a modo de espejo.
                 o                                                     December 1995.
     Tambi´ n trae consigo mayor complejidad l´ gica y prob-
            e                                    o                 [9] HAMMER, M. y DENNIS MCLEOD, A Framework for Data Base
                                                                       Semantic Integrity, MIT Laboratories for Computer Science, ACM Press,
     lemas de interpretaci´ n de las consultas, debido a su
                            o                                          1976.
                                                       ¨
     acercamiento al lenguaje natural, produce ambiguedades.               ¨
                                                                   [10] TURKER, CAN y MICHAEL GERTZ, Semantic integrity support
     La base de datos Sem´ ntica permite la adaptaci´ n de
                              a                          o             in SQL:1999 and commercial (object-)relational database management
                                                                       systems, Swiss Federal Institute of Technology, Zurich, Switzerland, ACM
     datos derivados, no existentes en la base de datos pero           Press, 2001.
     que para el usuario es obvia su existencia.
     El nuevo est´ ndar trata de minimizar el problema de
                   a
     ambig¨ edad en la base de datos.
            u
VII.        ´
                         A P E NDICE




Fig. 4. Arquitectura de una Base de Datos Sem´ ntica [4]
                                             a

Más contenido relacionado

Destacado

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Destacado (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Bases de Datos Semánticas panorama breve

  • 1. Un breve panorama sobre las Bases de Datos Sem´ nticas a Pedro Shiguihara Ju´ rez a Escuela de Inform´ tica a Universidad Nacional de Trujillo Trujillo, Per´ u Abstract— El presente documento trata de dar una vista Base de Datos Relacional, adem´ s agregaba componentes tales a general a las Bases de Datos Sem´ nticas, tratando de identificar a como Knowledge Base 2 —podr´a traducirse como base del ı sus or´genes y la motivaci´ n que ha provocado en los investi- ı o conocimiento—. gadores, su modelamiento de datos, arquitectura del sistema y la integridad sem´ ntica. Explica adem´ s sus beneficios y aspectos a a En este documento se presenta la secci´ n del problema la o a tomarse en consideraci´ n debido a los problemas que se o ´ cual motiva el surgimiento e implementacion de la Base deber´ afrontar al momento de modelamiento sem´ ntico de los a a de Datos Sem´ ntica, en la secci´ n 3 se explica el manejo a o datos. conceptual donde act´ a el Modelamiento de Datos Sem´ ntica, u a seguidamente en la secci´ n 4 las ventajas del modelamiento o PALABRAS CLAVES sem´ ntico, en la secci´ n 5 las consideraciones de un modelado a o Knowledge base de datos sem´ ntico que puede da˜ ar la integridad sem´ ntica a n a I. ´ I NTRODUCCI ON [7][8][9] y finalmente la secci´ n 6 de conslusiones acerca de o esto. ´ [1] En 1970, el Modelo Relacional revoluciono el campo ´ de las Bases de Datos, debido al logro de la separacion de la II. P ROBLEMA : A SMILAR EL MUNDO REAL representaci´ n l´ gica del dato de la implementaci´ n f´sicia, o o o ı Hammer[2] ejemplifica la iteracci´ n con la base de datos, o lo que produjo en adelante el desarrollo de lenguajes de ´ y asevera que esta es m´ s que una colecci´ n de valores, tiene a o consultas. transiciones en cada punto de la l´nea del tiempo, por ello ı La historia del modelamiento sem´ ntica, tambi´ n data hacia a e experimenta cambios en su contenido. En esta ejemplificacion ´ esas fechas. Los modelos sem´ nticos fueron introducidos co- a cada punto puede verse como una instant´ nea que representa a mo herramientas de dise˜ o de esquemas 1 . El motivo principal n el estado del sistema de aplicaci´ n de la Base de Datos. o de su uso radicaba en la exactitud del modelo de datos, Por tanto esto refleja una secuencia de eventos a trav´ s del e como muchos autores aseveran, el modelado sem´ ntico, no a ´ tiempo, ocurrentes en el ambiente de aplicacion. Los autores es mas, que una representaci´ n del mundo real [3][4][2][1], o relacionados a este tema definen el Modelado Sem´ ntico de a estas propiedades no las ten´an las aplicaciones de bases de ı una Base de Datos como el Modelo del Sistema del Mundo datos t´picas. ı Real, es decir un espejo de la estructura del sistema que [1] El primer modelo sem´ ntico publicado apareci´ en 1974, el a o modelo —una empresa por ejemplo—. ´ area madur´ con el desarrollo de muchos modelos importantes o —como Semantic Data Model [2], General Semantic Data III. M ANEJO C ONCEPTUAL Model [2][9], Iris Data Model, Sem-Object Data Model [3][4], ´ Todo esto enfoca la necesidad de establecer una interaccion IFO [6]—. Hoy en d´a se ha tratado de estandarizar ello, ı con el usuario de una manera m´ s f´ cil, tratando de algu- a a con la llegada del est´ ndar SQL3 —a˜ o 1999—, que no a n na manera brindar la propiedad de transparencia al usuario es mas que una extensi´ n del modelo relacional. [2][6] En o ´ mediante un modelo conceptual en vez de logico, ya que le ´ d´ cadas anteriores entre 1970 y 1980 se planteaba una division e resultar´a al usuario m´ s familiar. ı a entre el modelo conceptual —modelado sem´ ntico— y el a Un esquema l´ gico est´ expresado de una particular clase de o a modelo l´ gico —modelado relacional—, para 1990 Rishe o estructura de datos llamado Modelo de Datos. Los modelos de [3][4] planteaba un modelo que suger´a colocar el nombre ı estos datos son de bajo nivel y orientado a la m´ quina, todo a de Semantic-SQL, que pueda ser una est´ ndar en lenguajes a ´ o ello requiere que se expresa a nivel de representacion l´ gica de consultas sem´ nticas y planteaba una arquitectura del a que en t´ rminos de significancia. En el modelo relacional la e sistema —ver figura en ap´ ndice— donde el modelo relacional e informaci´ n sem´ ntica est´ impl´cita —tanto as´ que no se o a a ı ı actuaba de forma independiente al modelo sem´ ntico, este a podr´a extraer en casi todos los casos— y se pierden en el ı ´ ultimo actuaba de manera directa con el usuario y traduc´a ı modelo [3]. Por ello Hammer explica que la sem´ ntica deber´a a ı la consulta a un modelo l´ gico entendible por el Sistema de o estar separada, Rishe tambi´ n lo plantea, y aplicada por el e 1 Un esquema pod´a ser dise˜ ado en un alto nivel de modelado sem´ ntico ı n a 2 KB tambi´ n est´ presente en los fundamentos de la Web Sem´ ntica, e a a ´ y traducido en un medio tradicional para la implementacion expl´citamente en Resource Description Framework (RDF) ı
  • 2. usuario directamente. IV-C. Abstracci´ n de datos o El modelo en el nivel conceptual se trata de no perder la Esto permnite proveer de datos derivados —Knowledge significancia de la informaci´ n que provean las relaciones, o base—, que est´ n relacionados m´ s a la noci´ n que tiene el a a o entre entidades y brinde la facilidad para hacer consultas sobre usuario acerca de las Bases de Datos. Estos datos no est´ n a ello [4]. incorporados al esquema, es decir es un nuevo tipo de dato ´ —puede tomarse como una entidad nueva en una relacion ISA por ejemplo—. V. ´ C ONSIDERACIONES DE UN MODELADO SEM ANTICO En esta secci´ n explicamos dos consideracione importantes, o la primera es la forma en que ser´ implementada una Base a de Datos Sem´ ntica y la segunda est´ relacionada con la a a integridad sem´ ntica y la ambig¨ edad. a u V-A. Implementaci´ n y representaci´ n f´sica o o ı Hammer [2] explica que si bien hay beneficio por la facilidad de comprensi´ n y manejo de la Base de Datos, o tambi´ n existen grandes consideraciones de, ¿C´ mo ser´ la e o a Fig. 1. Interacci´ n directa entre BD Sem´ ntica y usuario o a implementaci´ n? y ¿C´ mo ser´ la representaci´ n f´sica?, esto o o a o ı trae consigo por supuesto una complejidad superior a la de una Base de Datos con el Modelo Relacional. Esto se puede ver IV. ´ V ENTAJAS DEL MODELADO SEM ANTICO en Sistema de arquitectura de la figura en el ap´ ndice. e En esta secci´ n se tratar´ tres ventajas, las m´ s resaltantes o a a V-B. Ambig¨ edad del lenguaje natural e Integridad sem´ nti- u a acerca de la implementaci´ n de una Base de Datos Sem´ ntica. o a ca Las bases de datos sem´ ntica se tratan de expresar como a IV-A. Separaci´ n de componentes conceptuales y l´ gicos o o un lenguaje natural —a nivel conceptual— para las consultas Los usuarios cuando realizan una consulta en una Base realizadas por el usuario.Esto como se menciona en [7] libera de Datos Relacional, navegan a trav´ s de ella por medio de e al usuario de una tarea de comprensi´ n de la base de datos o un esquema con tablas de registros, logran obtener los datos —como explicamos en las ventajas—. Pero resalta un nuevo requeridos mediante operaciones asociadas como juntura y problema, la previsi´ n de capacidades de actualizaci´ n. o o proyecci´ n que son las m´ s comunes. Ac´ se presenta un o a a Por el mismo hecho de usarse un lenguaje casi natural, ejemplo extra˜ ido de [1], donde se plante el caso: Mary es un n tiende a la ambig¨ edad, este nuevo problema no se ve en u agente de viajes, y se desea conocer la ciudad del empleador las consultas tradicionales. Esto es, debido a que el usuario de Mary.. Para obtener esto en un lenguaje SQL se tendr´a ı est´ fraseando sus peticiones con respecto a su punto de vista a que tener expl´citamente el conocimiento de las tablas donde ı de la Base de Datos, lo cual puede ser una simplificacion o ´ se encuentra la informaci´ n del negocio y lugar donde vive el o una transformaci´ n de la estructura acutal de la base de datos, o empleador. La sentencia SQL queda como sigue: entendi´ ndose que el usuario no est´ ´ntimamente ligado e a ı con la estructura interna de la base de datos como ser´a su ı SELECT city dise˜ ador. n FROM BUSINESS Las solicitudes de actualizaci´ n —insertar, eliminar, o WHERE BNAME in modificar—, podr´a resultar en diferentes efectos, no ı SELECT EMPLOYER esperados por el usuario. Incluso el usuario podr´a hacer ı FROM BUSTRAV peticiones que sean imposibles —el problema de devolucion ´ WHERE PNAME=’Mary’ null—. El trato que se da a la ambig¨ edad es seleccionar u Es decir obtiene primero el nombre del empleador de Mary entre todos los estados posibles, el que involucra menos por selecci´ n y luego la ciudad de donde pertenece el negocio o modificaciones a lo largo de la base de datos, para ello se donde trabaja el empleador. siguen ciertas consideraciones que se explican en docuemtnso asociados a esta bibliograf´a [9][7][8][5]. Shin [5] plantea ı IV-B. Sobrecarga sem´ ntica a una clasificaci´ n de posibles caminos que puede tomar una o consulta y en la bibliograf´a [10] se plantea el est´ ndar SQL3 ı a Una relaci´ n es usada normalemente en el Modelo Rela- o que trata el problema. Para Shin toma el siguiente camino: ´ cional, muchos tipos diferentes de informacion, la existencia de entidades impl´citas, propiedades, estructura y asociaciones ı CC: Lingu´sticamente Completo; ı entre ellos. El Modelo Sem´ ntico de Datos provee una sepa- a Datos sem´nticamente Completos a raci´ n de esta informaci´ n, mediante la abstracci´ n de datos. o o o IC: Lingu´sticamente Incompleto; ı
  • 3. Datos sem´nticamente Completos a CI: Lingu´sticamente Completo; ı Datos sem´nticamente Incompletos a II: Lingu´sticamente Incompleto; ı Datos sem´nticamente Incompletos a Fig. 2. taxonom´a dada por Shin [5] ı Fig. 3. Ejemplos extra´dos de [10] ı Los IC tienen que ver con errores de tipograf´a, gram´ tical- ı a mente incorrecta, referencias indefinidas. CI tiene que ver R EFERENCES con t´ rminos desconocidos o ambig¨ os, t´ rminos vagos o e u e [1] HULL, RICHARD y ROGER KING, Semantic Database Modeling: Sur- vey, Applications, and Research Issues, Computer Science Department, informaci´ n faltante, par´ metros inconsistentes y sem´ ntica- o a a University of Southern California, ACM Press, September 1987. mente sin sentido; estos son los errores m´ s comunes que a [2] HAMMER, MICHAEL y DENNIS MCLEOD, The Semantics Data Mod- puede llevarse a cabo. Los II son errores sint´ cticamente y a el: A Modelling Mechanism for Data Base Applications, MIT Laboratory for Computer Science, Cambridge, ACM Press, 1978. sem´ nticamente sin sentido. En la bibliograf´a [5] se explica a ı [3] RISHE NAPHTALI D., Semantic SQL: A Semantic Wrapper for Re- de manera detallada el problema, aqu´ se presenta la taxonom´a ı ı lational Databases, School of Computer Science, Florida International dada por Shin. University, Miami, 2003. [4] RISHE N., SHU-CHING C., ALEXANDER V., JUN Y., XIAOL- ING L., ARTYOM S., RUKSHAM A., XIAOBIN M., DMIT- VI. C ONCLUSIONES RY V., Semantic Access for Querying Databases, School of Computer Science, Floritda International University, Miami. URL: El modelado sem´ ntico resume la complejidad l´ gica a o http://www.cs.fiu.edu/˜ hens/PDF/VLD800.pdf c representativa de la Base de Datos, esto permite mayor [5] SHIN, D. G., Semantics Modeling Issues for Processing Natural Lan- guage Database Queries, Computer Science and Engineering Department, usabilidad por parte de m´ s usuarios, se extiende el a University of Connecticut, ACM Press, January 1990. amplio dominio para la redes de comunicaciones donde [6] ABITEBAW, SERGE Y RICHARD HULL, IFO: A Format Semantic ´ los usuarios no son conscientes de la estructura logica de Database Model, Institut National de Recherche en Informatique et en Automatique, ACM Press, November 1987. una base de datos remota. [7] DAVIDSON, JAMES y JERROLD KAPLAN, Natural Language Access La abstracci´ n de datos y la separaci´ n de componente o o to Data Bases: Interpreting Update Requests, Computer Science Depart- l´ gicos y conceptuales son propiedades importantes en o ment, Stanford University, California, ACM Press. April 1983. [8] CHEN A. y RICHARD HULL, An Execution Model for Limited Ambi- las Bases de Datos Sem´ ntica por tanto permiten la a guity Rules and Its Application to Derived Data Update, ACM Press, representaci´ n de la realidad a modo de espejo. o December 1995. Tambi´ n trae consigo mayor complejidad l´ gica y prob- e o [9] HAMMER, M. y DENNIS MCLEOD, A Framework for Data Base Semantic Integrity, MIT Laboratories for Computer Science, ACM Press, lemas de interpretaci´ n de las consultas, debido a su o 1976. ¨ acercamiento al lenguaje natural, produce ambiguedades. ¨ [10] TURKER, CAN y MICHAEL GERTZ, Semantic integrity support La base de datos Sem´ ntica permite la adaptaci´ n de a o in SQL:1999 and commercial (object-)relational database management systems, Swiss Federal Institute of Technology, Zurich, Switzerland, ACM datos derivados, no existentes en la base de datos pero Press, 2001. que para el usuario es obvia su existencia. El nuevo est´ ndar trata de minimizar el problema de a ambig¨ edad en la base de datos. u
  • 4. VII. ´ A P E NDICE Fig. 4. Arquitectura de una Base de Datos Sem´ ntica [4] a