Este documento describe los principios y estándares de la Web Semántica. Explica que la Web Semántica proporciona significado a la información en Internet para que las máquinas y personas puedan trabajar juntos de manera más efectiva. También describe la arquitectura de múltiples niveles propuesta por Tim Berners-Lee para la Web Semántica y los estándares clave como RDF, OWL y XML que permiten añadir metadatos semánticos a los contenidos en la web. Finalmente, discute el estado actual de la Web Semá
1. ´
WEB SEMANTICA: Principios y Est´ndares
a
Samanta Patricia Cueva
Abril del 2008
Resumen “La Web Sem´ntica es una extensi´n de la ac-
a o
tual web en la cual la informaci´n se da mediante
o
Actualmente en Internet se tiene acceso a de- un significado bien definido, lo que facilita que los
masiada informaci´n la cual no se encuentra clasifi-
o ordenadores y la gente trabajen en cooperaci´n”.[6]
o
cada correctamente lo que influye en los resultados
de b´squedas que los usuarios requieren a trav´s
u e La Web Sem´ntica aspira a mejorar sustancial-
a
de los motores de b´squedas y que no siempre se
u mente la interacci´n entre los sistemas inform´ticos
o a
ajustan a lo que se requiere, es por eso que des- y los seres humanos, dotando a los primeros de una
de 1999 se est´ hablado de la Web Sem´ntica, la
a a mayor inteligencia y autonom´ y a los segundos
ıa,
cual va a permitir proporcionar al usuario respues- de un nuevo infouniverso conceptual ergonomiza-
tas espec´
ıficas que concuerden con los requerimien- do intelectivamente que satisfaga la necesidad de
tos de los mismos. Pero no solo los motores de de convertir la informaci´n en conocimiento. [3]
o
b´squeda deben estar listos para enfrentar a esta
u
nueva web, sino que tambi´n los portales y sitios
e
En palabras de Berners-Lee, ”no se est´ hablan-
a
web deben empezar a migrar de la web sint´ctica a
a
do de una inteligencia artificial m´gica que permi-
a
la web sem´ntica, ya que esto influir´ en el ranking
a a
ta a los ordenadores entender las palabras de los
y posicionamiento web que obtengan dichos sitios.
usuarios, sino unicamente de la habilidad de una
´
En este art´ıculo se revisan conceptos, arquitec-
m´quina para resolver problemas bien definidos, a
a
tura, est´ndares que est´n inmersos en la web
a a
trav´s de operaciones bien definidas que se llevar´n
e a
sem´ntica y los pasos que se deber´ seguir para
a ıan
a cabo sobre datos bien definidos”. (W3C, 1999).
migrar los sitios web a la web sem´ntica.
a
Palabras Clave: Web Sem´ntica, W3C, RDF,
a
En la actualidad la mayor parte de la informaci´n
o
OWL, Accesibilidad
que se encuentra en la web, carece de sem´ntica ya
a
que est´n basados en HTML y por ende cuando se
a
1. ´
INTRODUCCION realizan b´squedas los resultados no son los sufi-
u
cientemente concretos para ajustarse a las necesi-
El concepto de web sem´ntica fue creado por Tim
a dades de los usuarios.
Berners-Lee creador de la WWW, quien la define
as´
ı: En conclusi´n la Web Sem´ntica es a˜adir
o a n
“El primer paso es colocar los datos en la Web metadatos sem´nticos a los contenidos que existen
a
de un modo en que las m´quinas puedan entender-
a en la web, estos metadatos deben ser entendibles
los naturalmente o convertirlos a esa forma. Esto tanto por los humanos como por las m´quinas.
a
crea lo que yo llamo una Web Sem´ntica: una red
a
de datos que pueden ser procesados directamente o La web sem´ntica permitir´ el uso de agentes
a a
indirectamente por m´quinas.”[1]
a personales encargados de extraer informaci´n de
o
“The Web of data with meaning in the sense that m´ltiples fuentes, proporcion´ndole al usuario re-
u a
a computer program can learn enough about what spuestas espec´ıficas que se ajusten a los requerim-
the data means to process it.”[2] ientos de los mismos.
1
2. 2. XMLS (XML Schema): Se pueden fijar an-
ticipadamente las estructuras que se van a uti-
lizar, as´ como manejar tipos de datos primi-
ı
tivos y derivados.4
Tercer Nivel: En este nivel se realiza la descrip-
ci´n de Recursos utilizando b´sicamente RDF que
o a
es un est´ndar recomendado por la W3C para la
a
definici´n y uso de descripciones de metadatos
o
1. RDF (Resource Description Frame-
work)5 : Es un lenguaje para la definici´n de
o
ontolog´ y metadatos en la web, siendo el
ıas
Figura 1: Arquitectura de Web Sem´tica presenta-
a est´ndar m´s extendido en la comunidad de
a a
da por Tim Berners-Lee web sem´ntica.
a
1
2. RDF Schema: Es una extensi´n sem´ntica
o a
de RDF6
2. ARQUITECTURA DE LA
Cuarto Nivel: Es el nivel de las Ontolog´ en la
ıas,
´
WEB SEMANTICA que se fundamenta principalmente la propuesta de
Berner-Lee.
En el a˜o 2000 Tim Berners defini´ la arquitec-
n o
tura de la web sem´ntica en diferentes niveles, los
a 1. Ontolog´ ıa: Define los t´rminos utiliza-
e
cuales se encuentran representados en la Figura 1: dos para describir y representar ´reas de
a
En el gr´fico anterior, se pueden observar difer-
a conocimiento, se utiliza en aplicaciones que
entes niveles, los que se proceden a explicar breve- necesitan compartir informaci´n de un deter-
o
mente, basados en el art´ ıculo ”The Semantic Web minado tema que se lo conoce como dominio.
Revisited”:[5]
Una ontolog´ es una definici´n formal expl´
ıa o ıcita,
Primer Nivel: En este nivel se realiza la iden-
y estructurada en taxonom´ ıas, de un cuerpo de
tificaci´n de recursos web, para lo cual se basa en:
o
conocimiento. [4]
1. UNICODE: Es un est´ndar que proporciona
a El proyecto DAML7 para el desarrollo de on-
el medio por el cual un texto en cualquier for- tolog´ ofrece un directorio de las mismas que
ıas
ma e idioma pueda ser codificado para el uso pueden ser utilizadas en definici´n de ontolog´
o ıas.
inform´tico.
a OWL Web Ontology Language es el lenguaje
est´ndar de la Web sem´ntica para expresar y cod-
a a
2. URI: (Uniform Resource Identifier): ificar ontolog´ De acuerdo con el W3C:
ıas.
Sirve para identificar un recurso web.2 OWL est´ concebido para ser utilizado cuando
a
la informaci´n contenida en los documentos necesi-
o
Segundo Nivel: Es el nivel sint´ctico, soluciona ta ser procesada por aplicaciones inform´ticas, en
a a
el problema de definici´n de distintos lenguajes de oposici´n a las situaciones donde el contenido sola-
o o
etiquetados para lo cual a˜ade contenido sem´ntico mente debe ser presentado a seres humanos. OWL
n a
a las p´ginas.
a puede ser utilizado para representar expl´
ıcitamente
1. XML (Extensible Markup Languaje): el significado de t´rminos en vocabularios y las rela-
e
8
Permite estructurar datos y documentos en ciones [sem´nticas] entre esos t´rminos.
a e
forma de ´rboles de etiquetas con atributos.3
a 4 http://www.w3.org/XML/Schema
5 http://www.w3.org/RDF/
Se lo ha dise˜ado para reemplazar el est´ndar
n a
6 http://www.w3.org/TR/rdf-schema/
HTML. 7 http://www.daml.org/ontologies/
2 http://www.w3.org/Addressing/ 8 http://www.w3.org/TR/2004/REC-owl-features-
3 http://www.w3.org/XML/ 20040210/
2
3. Quinto Nivel: Es el nivel de la L´gica en la cual
o han apostado a realizar investigaci´n en esta
o
se pretende dar flexibilidad a la arquitectura para a
´rea.
realizar consultas e inferir conocimiento a partir de
las ontolog´ıas. Por otro lado la creaci´n de nuevos est´ndares
o a
Sexto Nivel: Es el nivel de prueba en el cual que ya se est´n utilizando actualmente como el
a
se considera que un ordenador alcanza la m´xima
a lenguaje XML y la creaci´n de una nueva gen-
o
fiabilidad en sus razonamientos cuando es capaz de eraci´n de navegadores, buscadores y editores
o
realizar demostraciones o cuando es capaz de justi- de p´ginas web.
a
ficar el motivo por el cual tom´ una decisi´n.
o o
S´ptimo Nivel: Es el nivel de confianza en el
e Sin embargo los avances de la web sem´ntica son
a
cual est´ permitido asignar grados de confianza y
a demasiado lentos debido a que involucra una com-
seguridad a los diferentes recursos web, a trav´s e binaci´n de t´cnicas de inteligencia artificial que
o e
de la utilizaci´n de firmas digitales y t´cnicas de
o e simulen la capacidad humana de realizar tareas ex-
autenticaci´n de red. En estos niveles todav´ no
o ıa tremadamente complejas para un ordenador. Las
hay recomendaciones por parte del W3C, sin em- primeras aproximaciones de estas combinaciones
bargo existe un Grupo de Trabajo de Contexto de t´cnicas son Mechanical Turk de Amazon 10 y
e
Web Seguro que el 3 de Abril del 2008 public´ uno Google Image Labeler 11 .
borrador sobre Contexto Web Seguro; experiencia, Por otro lado Yahoo ha lanzado Yahoo! Search
indicadores y confianza9 . En el cual se tratan re- Open Platform 12 la cual est´ soportando est´ndares
a a
comendaciones sobre c´mo los agentes de usuario
o RDF y microformatos; Google ha sacado una nueva
web han de presentar informaci´n sobre su identi-
o API que hace uso de est´ndares XFN y FOAF con
a
dad y la forma de actuar ante errores en protoco- lo cual Google va a afrontar las b´squedas sociales
u
los de seguridad, de tal forma que se minimice el y se llama Social Graph API.13
n´mero de decisiones de seguridad que deben tomar
u Como ejemplos de Web Sem´ntica tambi´n se
a e
los usuarios. pueden citar a:
Actualmente solo los tres primeros niveles dispo-
nen de desarrollo, los otros niveles tienen una gran RSS: Es un formato sencillo de datos que se
cantidad de literatura t´cnica pero para efectos
e utiliza para distribuir contenidos a suscriptores
pr´cticos todav´ est´ en sus inicios. Por lo tan-
a ıa a de un sitio web; se conoce como redifusi´n web
o
to los pilares m´s importantes hasta el momento
a o sindicaci´n web.
o
del proyecto de web sem´ntica son XML, RDF y
a
OWL. FOAF (Friend of A Friend)14 : Es un
proyecto dentro de la Web sem´ntica para de-
a
scribir relaciones mediante RDF que puedan
3. ´
LA WEB SEMANTICA ser procesadas f´cilmente por m´quinas.
a a
EN LA ACTUALIDAD DOAP15 : Es un proyecto para crear vocab-
ulario de XML/RDF para describir proyectos
La Web sem´ntica a´n no es una realidad, de
a u de software.
acuerdo con las estimaciones del W3C, el despliegue
total de la Web sem´ntica puede prolongarse m´s
a a SIMILE16 : Desarrolla herramientas de fuente
all´ del a˜o 2010. Sin embargo, la Web sem´ntica
a n a abierta que permiten que usuarios puedan ten-
ya est´ entre nosotros de diversas formas:
a er acceso, manejar, visualizar y reutilizar ac-
tivos digitales.
A trav´s de una idea que ha sido capaz de
e
10 http://www.mturk.com/mturk/welcome
agrupar a varias personas y empresas, las mis- 11 http://images.google.com/imagelabeler/
mas que trabajan para hacer realidad la web 12 http://www.ysearchblog.com/archives/000527.html
sem´ntica. Es as´ que empresas importantes
a ı 13 http://code.google.com/apis/socialgraph/
14
del mundo como Microsoft, IBM, SUN, Adobe; http://www.foaf-project.org/
15 http://trac.usefulinc.com/doap
9 http://www.w3.org/TR/2008/WD-wsc-xit-20080403/ 16 http://simile.mit.edu/
3
4. En los centros de investigaci´n la web sem´ntica
o a Referencias
se ha convertido en una de las ´reas de investigaci´n
a o
prioritaria entre los grupos de investigaci´n m´s
o a [1] Berners-Lee. Weaving the web.
destacados se puede mencionar el Instituto Tec-
[2] Berners-Lee. Weaving the web: Glossary.
nol´gico de Massachusetts, la Universidad de Stan-
o
ford, La Universidad de Maryland, la Universidad [3] Rovira Crist`fol Codina Llu´ La web seman-
o ıs.
de Innsbruck, la Universidad de Karlsruhe, la Uni- tica. Technical report, E-prints in Library and
versidad de Manchester, en el Reino Unido la Open Information Science.
University, la Universidad Aut´noma de Madrid,
o
Universidad Polit´cnica de Madrid17 en donde se
e [4] T. R. Gruber. A translation approach to
est´n llevando proyectos en esta ´rea. Los resulta-
a a portable ontology specifications. Technical re-
dos de estas investigaciones se refleja en un gran port, 1993.
congreso internacional anual llamado el Interna-
[5] Nigel Shadbolt, Tim Berners-Lee, and Wendy
cional Semantic Web Conference18 , revistas como
Hall. The semantic web revisited. IEEE Intel-
el Journal of Web Semantics19 , The Semantic Web
ligent Systems, 21(3):96–101, 2006.
de Electronic Transactions on Artificial Intelligence
(ETAI)20 y sobre todo hay que destacar el impor- [6] James Hendler Tim Berners-Lee and Ora Las-
tante trabajo que est´ realizando la W3C21 en el
a sila. The semantic web. Technical report, Sci-
liderazgo de grupos de trabajo de estandarizaci´n o entific American, Mayo 2001.
de lenguajes y tecnolog´ para la web sem´ntica.
ıas a
En cuanto a est´ndares XML es el elemento de la
a
web sem´ntica al cual se le est´ dando mayor uso
a a
debido a que es un meta lenguaje de marcado que
permite codificar p´ginas de un modo directo con
a
etiquetas ad-hoc y por otro lado se pueden definir
esquemas y tipos de documentos que pueden ser
validados de forma autom´tica por programas.
a
4. PASOS PARA MI-
´
GRACION A WEB
´
SEMANTICA
Seg´n Llu´ Codina y Crist`fol Rovira para re-
u ıs o
alizar migraci´n de sitios web sint´cticos a sitios
o a
web sem´nticos se deber´ tener:
a ıa
1. Calidad del c´digo fuente: Es decir el c´di-
o o
go fuente de las p´ginas web debe ser consistente y
a
sin errores.
2. Uso de metadatos: Las p´ginas web deben
a
estar descritas mediante metadatos en suficiente
cantidad y calidad.
3. Uso de RDF: La codificaci´n de los o
metadatos se la puede hacer mediante RDF.
17 http://www.redwebsemantica.es/SemWeb/sewView/frames.jsp
18 http://iswc.semanticweb.org/
19 http://www.elsevier.com/wps/find/journaldescription.cws home/671322/description#description
20 http://www.etaij.org/seweb/
21 http://www.w3.org/2001/sw/
4