1. - LA WEB SEMÁNTICA
- LENGUAJES DE MARCADO
- ONTOLOGÍAS, TESAUROS
- ESPECIFICACIÓN RDF (RESOURCE DESCRIPTION FRAMEWORK)
- LENGUAJE DE REPRESENTACIÓN DE CONOCIMIENTO OWL (WEB
ONTOLOGY LANGUAJE)
Natividad Arias Cortazar
Email: cortari_09@Hotmail.com
2. ¿QUE ES LA WEB SEMÁNTICA?
Es una extensión de la Web actual en la que se proporciona la información con un significado bien definido y se mejora la forma en
que las máquinas y las personas trabajan en cooperación.
La web semántica ayuda a resolver la sobrecarga de información y heterogeneidad de fuentes de información, permitiendo a los
usuarios delegar tareas de software. Gracias a la Web Semántica, el software es capaz de procesar su contenido, razonar con este,
combinarlo y realizar deducciones lógicas para resolver problemas cotidianos automáticamente.
¿Cómo funciona? La web semántica, posee la capacidad de construir una base de conocimiento sobre las preferencias de los
usuarios y que, a través de una combinación entre su capacidad de conocimiento y la información disponible en internet, esta es
capaz de atender de forma exacta las demandas de información por parte de los usuarios en relación.
4. PRINCIPIOS BÁSICOS
- UNICODE: El Alfabeto
Se trata de una codificación del texto que permite utilizar símbolos de diferentes idiomas sin que aparezcan caracteres extraños. De
esta forma, se puede expresar información en la Web Semántica en cualquier idioma.
5. PRINCIPIOS BÁSICOS
- URI: las Referencias
Se trata de una codificación del texto que permite utilizar símbolos de diferentes idiomas sin que aparezcan caracteres extraños. De
esta forma, se puede expresar información en la Web Semántica en cualquier idioma.
Es el acrónimo de un “Universal Resource Identifier” o Identificador Universal de Recursos, que es un identificador único que
permite la localización de un recurso que puede ser accedido vía internet. Se trata del URL (descripción de la ubicación).
¿Cómo llamamos a lo que llamamos en la Web?
…. Por medio de URI (Universal Resource Identifier)
- Similar a una URL
- HTTP URIs identifica funcionalmente un recurso en la Web
- Una URI identifica solo una cosa
Todo se identifica con una URI
*URIs
- Mi pagina: http://arias.cl
- Yo: http://nato.arias.cl
*URIs también son para predicados
Ejemplo: la galleta sabe a chocolate
*CURIE: http://example.org/abc se puede escribir como
PREFIX ex: http://example.org/
6. PRINCIPIOS BÁSICOS
- XL + NS + xmlschema
En esta capa se agrupan las diferentes tecnologías que hacen posible que los agentes puedan entenderse entre ellos. XML ofrece un
formato común para intercambio de documentos, NS (namespaces) sirve para cualificar elementos y atributos de nombres usados
en XML asociándolos con los espacios de nombres identificados por referencias URI, y XML Schema ofrece una plantilla para
elaborar documentos estándar.
7. PRINCIPIOS BÁSICOS
- RDF + rdfschema
Es un lenguaje siempre mediante el cual definimos sentencias en el formato de una 3-upla o triple (sujeto: el recurso al que nos
referimos; predicado: el recurso que indica que es lo que estamos definiendo; y objeto: puede ser el recurso o un literal que podría
considerarse el valor de lo que acabamos de definir).
¿Cómo describir información sobre cosas en la Web?
¿Y como hacer que las computadoras puedan entenderlo?
…… Usando RDF (Resource Description Framework)
Ejemplo:
Natividad’s homepage is http://graves.cl
Sujeto Predicado Objeto
8. PRINCIPIOS BÁSICOS
- Lenguajes de Ontologías
Ontología: Modelo formal de una parte del mundo
La distinción es cuan expresivo es el modelo
El uso de ontologías permite describir objetos y sus relaciones con otros objetos, ya que una ontología en es la especificación formal
de una conceptualización de un dominio concreto del conocimiento. Esta capa permite extender la funcionalidad de la Web
Semántica, agregando nuevas clases y propiedades para describir los recursos.
Vocabularios comunes
- FOAF (redes sociales)
- SIOC (comunidades online)
- Dublin Core (Metadatos en general)
- OWL (Metaontología)
Dominio y rango
- Similar a las funciones matemáticas
- Dominio: de que clase sale esta propiedad
- Rango: A que clase llega esta propiedad
OWL (Web Ontology Languaje)
- Provee restricciones lógicas
- Sirve para expresar cosas como:
una persona tiene exactamente una madre y exactamente un padre
Predicado: “ex:madreDe” es inverso de “ex:tieneMadre”
9. PRINCIPIOS BÁSICOS
- Lógica
En esta capa se establecen reglas de inferencia, es decir, una ontología puede expresar la regla por ejemplo: “si un código de ciudad
está asociado a un código de estado, y si una dirección es el código de ciudad, entonces esa dirección tiene el código de estado
asociado”.
10. PRINCIPIOS BÁSICOS
- Pruebas
Es el intercambio de “pruebas” escritas en lenguaje unificador
- Confianza
La Web semántica comprueba de forma exhaustiva las fuentes de información
- Firma digital
Se utiliza XML Signature WG: httpp://www.w3.org/Signature/
11. Mapa conceptual de la Web Semántica.
Fuente: Keilyn Rodríguez Perojo y Rodrigo Ronda León
12. LENGUAJES DE MARCADO
Un lenguaje de marcas es un lenguaje que anota el texto de modo que el ordenador puede manipularlo. La mayoría de los lenguajes
de marcas son legibles debido a que las anotaciones están escritas de forma tal que se puedan distinguir de los textos. Por ejemplo,
con HTML, XML y XHTML, las etiquetas de formato son ‹ y ›. El texto que aparece dentro de uno de esos delimitadores se considera
parte del lenguaje de marcado y no parte del texto anotado.
Por ejemplo: ‹ p › este es un párrafo de texto escrito en HTML ‹ /p ›
Al dar formato al texto que se desea imprimir (o visualizar en un ordenador o TV), es necesario distinguir entre el texto en sí y las
instrucciones para imprimir el texto. Las marcas son las instrucciones para mostrar o imprimir el texto.
El marcado se convierte en un lenguaje cuando las reglas están codificadas en torno a cómo escribir y usar el marcado. La mayoría
de los lenguajes de marcas se definen por una autoridad externa para permitir su uso por muchas personas diferentes.
13. LENGUAJES DE MARCADO
- HTML (HyperText Markup Language)
HTML (HyperText Markup Language) es el lenguaje estándar utilizado en la Web para representar la información intercambiada por
sus usuarios en forma de documentos de hipertexto.
HTML es el lenguaje de la web. Casi todas las páginas web están escritas en HTML. HTML define la forma en que las imágenes,
multimedia y texto se muestran en los navegadores web. Incluye elementos para conectar los documentos (hipertexto) y hacer que
los documentos web sean interactivos.
Está basado en el metalenguaje SGML, un estándar para la descripción de documentos. La gramática HTML está escrita en SGML, en
un documento denominado DTD (Document Type Definition).
Es un lenguaje orientado a la definición de la estructura y la semántica del documento más que a su representación física concreta.
HTML es un lenguaje de marcado definido como estándar. Es un lenguaje que utiliza etiquetas para definir la estructura de un texto.
Elementos y etiquetas son definidas por los caracteres ‹ y ›.
Por tanto, el código HTML sólo contiene información sobre la estructura de los contenidos, y como estos contenidos están
estructurados de manera lógica, pueden ser representados de acuerdo con esa estructura por cualquier navegador.
14. LENGUAJES DE MARCADO
- XML-eXtensible Markup Language
El eXtensible Markup Language es el lenguaje en que se basan otras versiones de HTML. Al igual que HTML, XML está fuera de
SGML. Es menos estricto que SGML y más estricto que el HTML plano, y proporciona la capacidad de ampliación para crear varios
lenguajes diferentes.
- XHTML-eXtended HyperText Markup Language
XHTML 1.0 es HTML 4.0 redefinido para cumplir con el estándar XML.
- SGML, Standard Generalized Markup Language
SGML, "Standard Generalized Markup Language o Lenguaje de Marcación Generalizado, consiste en un sistema para la organización
y etiquetado de documentos.
El lenguaje SGML sirve para especificar las reglas de etiquetado de documentos y no impone en sí ningún conjunto de etiquetas en
especial
SGML fue diseñado para permitir el intercambio de información entre distintas plataformas, soportes físicos, lógicos y diferentes
sistemas de almacenamiento y presentación, independientemente de su grado de complejidad.
15. ONTOLOGÍAS
Una ontología es un sistema de representación del conocimiento que resulta de seleccionar un dominio o ámbito del conocimiento,
y aplicar sobre él un método con el fin de obtener una representación formal de los conceptos que contiene y de las relaciones que
existen entre dichos conceptos. Las ontologías introducen un mayor nivel de profundización semántica y proporcionan
una descripción lógica y formal que puede ser interpretada tanto por las personas, como por las máquinas.
Las ontologías incluyen definiciones de conceptos básicos del dominio, y las relaciones entre ellos, que son útiles para los
ordenadores [...]. Codifican el conocimiento de un dominio y también el conocimiento que extiende los dominios. En este sentido,
hacen el conocimiento reutilizable.
Un lenguaje de marcado, es una forma de codificar un documento que, junto con el texto, incorpora etiquetas o marcas que
contienen información adicional acerca de la estructura del texto o su presentación. El más conocido es HTML, pero hay otras
importantes variantes, como es el caso de OWL (Web Ontology Language).
16. ONTOLOGÍAS
Las ontologías se componen de:
- Conceptos: son las ideas básicas que se intentan formalizar. Los conceptos pueden ser clases de objetos, métodos, planes,
estrategias, procesos de razonamiento, etc.
- Relaciones: representan la interacción y enlace entre los conceptos de un dominio. Suelen formar la taxonomía del dominio. Por
ejemplo: subclase-de, parte-de, parte-exhaustiva-de, conectado-a, etc.
- Funciones: son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera
varios elementos de la ontología. Por ejemplo, pueden aparecer funciones como: asignar-fecha, categorizar-clase, etc.
- Instancias: se utilizan para representar objetos determinados de un concepto.
- Reglas de restricción o axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología.
Por ejemplo: "Si A y B son de la clase C, entonces A no es subclase de B", "Para todo A que cumpla la condición B1, A es C", etc. Los
axiomas, junto con la herencia de conceptos, permiten inferir conocimiento que no esté indicado explícitamente en la taxonomía de
conceptos.
17. ONTOLOGÍAS
Aplicaciones y usos de las ontologías:
- Repositorios para la organización del conocimiento
- Servir de herramienta para la adquisición de información
- Servir de herramientas de referencia en la construcción de sistemas de bases de conocimiento que aporten consistencia, fiabilidad
y falta de ambigüedad a la hora de recuperar información
- Normalizar los atributos de los metadatos aplicables a los documentos
- Crear una red de relaciones que aporte especificación y fiabilidad
- Permitir compartir conocimiento
- Posibilitar el trabajo cooperativo al funcionar como soporte común de conocimiento entre organizaciones, comunidades
científicas, etc.
- Permitir la integración de diferentes perspectivas de usuarios
- Permitir el tratamiento ponderado del conocimiento para recuperar información de forma automatizada
- Permitir la construcción automatizada de mapas conceptuales y mapas temáticos
- Permitir la reutilización del conocimiento existente en nuevos sistemas
- Permitir la interoperatividad entre sistemas distintos
- Establecer modelos normativos que permitan la creación de la semántica de un sistema y un modelo para poder extenderlo y
transformarlo entre diferentes contextos
- Servir de base para la construcción de lenguajes de representación del conocimiento
18. TESAUROS
Un tesauro es un vocabulario controlado y estructurado formalmente, formado por términos que guardan entre sí relaciones
semánticas y genéricas: de equivalencia, jerárquicas y asociativas. Se trata de un instrumento de control terminológico que permite
convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que representa, de manera unívoca, el contenido de
estos, con el fin de servir tanto para la indización, como para la recuperación de los documentos
Los términos contenidos en un tesauro responden al análisis del texto o materia. Un tesauro recoge todos los conceptos y no sólo
los que corresponden al título o el texto. Un único tema (aquello de lo que trata el documento) suele desarrollarse mediante una
serie de ideas o conceptos que se pueden describir por medio de una serie de términos o descriptores. El tesauro incorporará todos
esos términos en una base de datos y cada uno de ellos se convertirá en un punto de acceso para la recuperación del documento. La
potencia de un tesauro radica además, en la posibilidad de combinar todos esos términos o descriptores, lo que le convierte en un
lenguaje combinatorio mucho más rico que los tradicionales encabezamientos de materias. Un tesauro es pues, una herramienta de
control terminológico muy útil para el análisis, descripción y recuperación automatizados.
Atendiendo a diferentes aspectos, los tesauros pueden ser de diferentes tipos, entre los que cabe destacar los siguientes:
- Tesauro facetado: se trata de un tesauro que combina una clasificación facetada sistemática, con un tesauro alfabético que
reemplaza al índice de la clasificación.
- Tesauro monolingüe: es el que contiene descriptores en una única lengua.
- Tesauro multilingüe: contiene descriptores en más de una lengua.
- Macrotesauro: se trata de un tesauro que incluye algunos descriptores básicos comunes y los propios de su campo o especialidad.
19. TESAUROS
En cuanto a su estructura, se pueden establecer 3 tipos de tesauros:
- Tesauro lineal: presenta los descriptores de forma simple, sin conexiones.
- Tesauro en forma de árbol: se construye siguiendo una jerarquía en forma de árbol. Cada descriptor posee un descriptor genérico
y varios descriptores con los que se relaciona de forma ascendente o descendente.
- Tesauro reticular: tesauro construido en forma de red en el cual los descriptores se entrecruzan. Cada descriptor puede tener
varios descriptores genéricos y varios descriptores específicos
En cuando a su presentación, un tesauro puede ser:
- Alfabético: los descriptores y no descriptores se agrupan en una única secuencia alfabética junto con sus relaciones.
- Sistemático: estructurado en 2 partes. La primera de ellas o parte principal, contiene las categorías o jerarquías, y la segunda
parte o parte auxiliar, consta de un índice alfabético que conduce a los usuarios a la sección semántica correspondiente a la que
pertenece el término.
- Gráfico: los términos se presentan en forma de figura gráfica donde se asocian los términos relacionados. Esta representación
gráfica suele representarse en forma de árbol, o utilizar flechas.
20. ESPECIFICACIÓN RDF (RESOURCE DESCRIPTION FRAMEWORK)
Al igual que con XML, con RDF también podemos utilizar esquemas (schemas). Como se mencionó, XML es un modelo para
etiquetar datos con una interpretación eminentemente sintáctica, mientras que RDF sirve para etiquetar metadatos y la
interpretación de este lenguaje es semántica. El modelo de datos XML es un árbol etiquetado orientado a marcas de texto y es
mucho menos flexible para expresar metadatos. Por el contrario, el modelo RDF consta de arcos etiquetados y cualquier conjunto de
declaraciones RDF forma un grafo que puede serializarse en XML. Además, los recursos utilizados en RDF son distintos a los usados
en XML. Mientras que los nodos a los que se refiere un esquema XML son nodos dentro de un documento XML situados en un lugar
específico de la estructura del documento, los nodos a los que se refiere RDF no son necesariamente nodos dentro del documento
mismo, sino que pueden ser nodos situados fuera del documento pues un nodo en RDF puede ser cualquier recurso que tenga un
URI.
En el caso de RDF es fundamental utilizar palabras que transmitan un significado inequívoco con el fin de que las aplicaciones
entiendan el enunciado para un procesamiento correcto. En RDF, este significado se expresa a través de un esquema. Podemos
pensar en un esquema como una especie de diccionario que define los términos que se utilizarán en una declaración o sentencia
RDF para otorgarle significados específicos. Con RDF se pueden utilizar una gran variedad de formas de esquema, incluyendo la
definida en RDFSchema que posee unas características especiales para automatizar tareas utilizando RDF, pero también otras
muchas formas.
RDFS permite definir los términos que se usarán en las declaraciones RDF y les otorgará significados específicos. Para evitar
definiciones conflictivas del mismo término, RDF utiliza los namespaces de XML. RDFS permite modelar metadatos con una
representación explícita de su semántica y permite especificar restricciones de tipos de datos para los sujetos y objetos de las
tripletas de RDF, introduciendo unas primitivas de modelado orientado a objetos: rdfs:Class, rdfs:Property, rdfs:subClassOf.
21. ESPECIFICACIÓN RDF (RESOURCE DESCRIPTION FRAMEWORK)
RDF Schemas ofrece un entramado en el cual las comunidades independientes pueden desarrollar vocabularios que se adapten a
sus necesidades específicas. Para compartir vocabularios, el significado de los términos debe describirse con detalle. A las
descripciones de estos conjuntos de vocabularios se les llaman RDF Schemas. Un schema define el significado, características y
relaciones de un conjunto de propiedades. El lenguaje RDF permite que cada documento que contiene metadatos, sea clarificado
con el vocabulario empleado asignando a cada vocabulario una dirección web.
RDF utiliza los namespaces o espacios de nombre como una forma de asociar el uso específico de una palabra en el contexto de un
diccionario (o esquema) en que se puede encontrar una definición determinada. En RDF, cada predicado utilizado en una
declaración debe ser identificado con un solo namespace o esquema, aunque un elemento Description puede contener
declaraciones con predicados de varios esquemas.
Los recursos siguientes son las clases principales que se definen como parte del vocabulario del esquema RDF. Cada modelo RDF
que se traza sobre el namespace del esquema RDF los incluye implícitamente:
• rdfs:Resource: todas las cosas que se describan por expresiones RDF se denominan recursos (resources), y se consideran como
instances (objetos específicos de la categoría) de la clase rdfs:Resource. La clase RDF rdfs:Resource representa el conjunto
denominado 'Resources' en el modelo formal para RDF.
• rdf:Property: representa el subconjunto de recursos RDF que son propiedades, es decir, todos los elementos del conjunto
presentados como 'Propiedades'.
• rdfs:Class: corresponde con el concepto genérico de un tipo (Type) o categoría (Category), semejante a la noción de Clase en los
lenguajes de programación orientados a objetos tales como Java. Cuando un esquema define una nueva clase, el recurso que
representa esa clase debe tener una propiedad rdf:type cuyo valor es el recurso rdfs:Class. Las clases RDF pueden definirse para
representar cualquier cosa, como páginas web, personas, tipos de documentos, bases de datos o conceptos abstractos.
22. LENGUAJE DE REPRESENTACIÓN DE CONOCIMIENTO OWL (WEB ONTOLOGY LANGUAJE)
El OWL (Web Ontology Language) o Lenguaje de Ontologías para la Web, está diseñado para usarse cuando la información
contenida en los documentos necesita ser procesada por programas o aplicaciones, en oposición a situaciones donde el contenido
solamente necesita ser presentado a los seres humanos. OWL puede usarse para representar explícitamente el significado de
términos en vocabularios y las relaciones entre aquellos términos. Esta representación de los términos y sus relaciones se denomina
una ontología. En realidad, OWL es una extensión del lenguaje RDF y emplea las tripletas de RDF, aunque es un lenguaje con más
poder expresivo que éste
OWL posee más funcionalidades para expresar el significado y semántica que XML, RDF, y RDFS, pero OWL va más allá que estos
lenguajes pues ofrece la posibilidad de representar contenido de la Web interpretable por máquina. OWL es una revisión del
lenguaje de ontologías web DAML+OIL que incorpora lecciones aprendidas desde el diseño y aplicaciones de DAML+OIL.
El lenguaje OWL tiene 3 sub-lenguajes que incrementan su expresión: OWL Lite, OWL DL, y OWL Full.
El Web Ontology Language OWL es, en realidad, un lenguaje de etiquetado semántico para publicar y compartir ontologías en la
World Wide Web. OWL se ha desarrollado como una extensión del vocabulario de RDF (Resource Description Framework) y deriva
del lenguaje DAML+OIL Web Ontology.
23. LENGUAJE DE REPRESENTACIÓN DE CONOCIMIENTO OWL (WEB ONTOLOGY LANGUAJE)
El motivo del desarrollo de este lenguaje ha sido la puesta en marcha de la Web Semántica, en realidad, una visión para el futuro de
la Web en la cual el significado de la información será dado de forma explícita haciendo que las máquinas automaticen de forma
más fácil los procesos e integren la información disponible en la Web. La Web Semántica se construirá sobre la sintaxis del lenguaje
XML que se mejorará mediante el uso de esquemas RDF para representar el contenido de los datos. El primer nivel sobre RDF
requerido para la Web Semántica es un lenguaje de ontologías que pueda describir formalmente el significado de la terminología
usada en los documentos web. Si las máquinas son capaces de realizar tareas de razonamiento sobre los documentos en los que se
utilice una semántica que vaya más lejos que la semántica básica de RDF Schema, la Web Semántica irá por buen camino.
OWL ha sido diseñado para conocer las necesidades para un lenguaje de ontología de la Web y es, pues, parte de las
recomendaciones del W3C relacionadas con la Web Semántica. OWL añade más vocabulario para describir propiedades y clases:
entre otras, relaciones entre clases (ejemplo, inconexas), cardinalidad (ejemplo "exactamente uno"), igualdad, más ricos tipos de
propiedades, características de las propiedades (por ejemplo, simetría), y clases enumeradas.
24. LENGUAJE DE REPRESENTACIÓN DE CONOCIMIENTO OWL (WEB ONTOLOGY LANGUAJE)
Sublenguajes de OWL
OWL ofrece tres sub-lenguajes de expresión incremental diseñados para ser usados por comunidades específicas de desarrolladores
y usuarios según el nivel de expresividad que precisen éstos.
- OWL Lite da soporte a aquellos usuarios que primordialmente necesitan una clasificación jerárquica y restricciones simples. Por
ejemplo, soporta restricciones cardinales, pero solamente permite valores cardinales de 0 ó 1. Así pues, es más simple proveer
herramientas de soporte para OWL Lite. OWL Lite ofrece una rápida ruta de migración para tesauros y otras taxonomías. En
resumen, OWL Lite tiene una más baja complejidad formal que OWL DL.
- OWL DL da soporte a aquellos usuarios que quieren la máxima expresividad mientras conservan completamente
la computacionalidad (todas las conclusiones son garantizadas para ser computables) y resolubilidad (todas las computaciones
terminarán en tiempo finito). OWL DL incluye todos los constructos del lenguaje OWL, pero pueden usarse solamente bajo ciertas
restricciones (por ejemplo, mientras una clase puede usarse por una subclase de muchas clases, una clase no puede ser una
instancia de otra clase). OWL DL se denomina así debido a su correspondencia con las descripciones lógicas (DL), un campo de
investigación que han estudiado los lógicos para la fundación formal de OWL.
- OWL Full da soporte a usuarios que requieren el máximo de expresividad y la libertad sintáctica de RDF sin garantías
computacionales. Por ejemplo, en OWL Full una clase puede ser tratada simultáneamente como una colección de individuos y
como un individuo por derecho propio. OWL Full permite a una ontología aumentar el significado del vocabulario predefinido (RDF ó
OWL). Es poco probable que algún software racional pueda soportar por completo el razonamiento para cada característica de OWL
Full.
25. REFERENCIAS ELECTRÓNICAS
Bazarnalla Menéndez, Rafael, “Que son lenguajes marcado html”, [artículo en línea], Universidad de Murcia. España, 2012.
http://www.um.es/docencia/barzana/DIVULGACION/INFORMATICA/Que-son-lenguajes-marcado.html
Echenique Salas, Pablo, “Web Semántica y Ontología”, [artículo en línea], Universidad Central de Venezuela. Venezuela, 2011.
http://www.w3.org/standards/semanticweb/
Gómez López, Alberto, “Recuperación de la Información OWL”, [artículo en línea], Universidad Rey Juan Carlos. España, 2007.
https://aic.ai.wu.ac.at/~polleres/teaching/ri2007/alberto.pdf
Lamarca Lapuente, María Jesús, “Hipertexto: El nuevo concepto de documento en la cultura de la imagen”, [artículo en línea],
Universidad Complutense de Madrid. España, 2013. http://www.hipertexto.info/index.htm