SlideShare una empresa de Scribd logo
1 de 116
Descargar para leer sin conexión
cenidet
       Centro Nacional de Investigación y Desarrollo Tecnológico
                    Departamento de Ciencias Computacionales



         TESIS DE MAESTRÍA EN CIENCIAS

Personalización de contenidos Web del dominio de e-
           gobierno mediante ontologías

                                presentada por

                          Jenifer Torres Tapia
          Ing. en Sistemas Computacionales por el I. T. de Cuautla

             como requisito para la obtención del grado de:
         Maestría en Ciencias en Ciencias de la Computación

                             Director de tesis:
                       Dr. Juan Gabriel González Serna

                           Co-Director de tesis:
                        Dr. Guillermo Rodríguez Ortiz

                                   Jurado:
                   Dr. Hugo Estrada Esquivel – Presidente
                Dr. Juan Gabriel González Serna – Secretario
                     Dra. Alicia Martínez Rebollar – Vocal


 Cuernavaca, Morelos, México.                             24 de Febrero de 2011
DEDICATORIA
                                                                                  A mi Hijo:

    Ian Galindo Torres es lo mejor que me ha pasado, ha venido a este mundo para ser mi
fuente de inspiración para el término del trabajo de investigación, es sin duda mi referente
                                                                para el presente y el futuro.

                                                                               A mi esposo:

             Juan Antonio Galindo García por su confianza, empeño, comprensión y amor.

                                                                              A mis padres:

Ignacio Germán Torres Martínez y Andrea Tapia Núñez por su comprensión, paciencia y su
 ayuda en todos los momentos de la vida, me han dado todo lo que soy como persona, mis
                                                     valores, principios y perseverancia.

                                                                           A mis hermanos:

        Ignacio Germán y Andrés Torres Tapia por su comprensión y apoyo incondicional.

                                                                                    A mi tío:

                                        Zacarías Torres Martínez por su confianza y apoyo.
AGRADECIMIENTOS

       A CONACYT por su apoyo económico otorgado para la realización de este trabajo
de investigación.

        A DGEST por su apoyo económico para la finalización de este trabajo de
investigación.

       Al CENIDET por brindarme la oportunidad para seguir en esta formación continua.

         A mi director de tesis, el Dr. Juan Gabriel González Serna por brindarme su consejo,
confianza, comprensión y paciencia para terminar este trabajo de tesis. A mi codirector de
tesis, el Dr. Guillermo Rodríguez Ortiz por sus comentarios.

      A los revisores de este trabajo de investigación, la Dra. Alicia Martínez Rebollar y el
Dr. Hugo Estrada Esquivel, por su tiempo dedicado, observaciones, y comentarios para
mejorar este trabajo de investigación.

       A mis compañeros del CENIDET: Elizabeth, Lizeth, Marino, Carlos, Cesar, Hugo y
Adair por su tiempo, confianza y amistad. En especial a Cesar y Hugo porque siempre
estuvieron ahí para apoyarme.

       A todos, mil gracias.


                                                                        Jenifer Torres Tapia
RESUMEN
La World Wide Web se ha convertido en un instrumento de uso cotidiano en nuestra sociedad,
comparable a otros medios tan importantes como la radio, la televisión o el teléfono, su aplicación
se ha extendido a diversos dominios como la educación , el gobierno y el comercio electrónico en
los que actualmente se advierte una sobrecarga de información que dificulta la navegación y uso
de los mismos, por este motivo los usuarios deben explorar espacios excesivamente densos,
convirtiendo la selección de información que les interesa en una tarea tediosa. Un mecanismo
para suplir esta tarea son los sistemas de recomendación los cuales seleccionan de forma
automática y personalizada los contenidos que mejor se adapten a las preferencias o necesidades
de cada usuario. En la literatura se han propuesto diversas estrategias de personalización que los
investigadores han adoptado de forma generalizada en sus trabajos.

En los últimos años ha surgido una prometedora línea de investigación bajo el nombre de Web
Semántica. Esta iniciativa propone describir los recursos Web mediante metadatos procesables
por las máquinas, para que éstas puedan razonar sobre su semántica e inferir relaciones entre
ellos, es decir, descubrir nuevo conocimiento a partir del ya conocido. Los procesos de
razonamiento semántico requieren que las colecciones de datos a los que acceden las máquinas
estén definidas y estructuradas de una forma adecuada como las ontologías, que son una
formalización consensuada y reutilizable en la que se identifican los conceptos y relaciones típicas
en un dominio de aplicación.

En este trabajo de investigación se presenta un sistema de personalización de contenidos Web
que hace uso de una mecanismo de razonamiento semántico a través de reglas de inferencia que
asocian a un tipo de usuario, extrayendo sus atributos de una ontología de perfiles, para
relacionarlos con los conceptos de una ontología de dominio, de tal manera que obtengan una
recomendación de contenidos de su interés.
ABSTRACT
The World Wide Web has become an everyday tool in our society, comparable to other major
media such as radio, television or telephone, its application has been extended to various fields
such as education, government and e-commerce where currently the information overload makes
it difficult to navigate and use them, is because of this that users should explore areas too dense,
making the selection of information they are interested in a tedious task. A mechanism to meet
this task are recommendation systems which automatically select and customize the content that
best suit the preferences and needs of each user. In the literature have proposed different
personalization strategies that researchers have widely adopted in their work.

In recent years there has been a promising line of research under the name of the Semantic Web.
This initiative aims to describe Web resources with machine-processable metadata, so that they
can reason about the semantics and infer relationships among them, that is, discovering new
knowledge from already known. Semantic reasoning processes require that data collections being
accessed by machines are defined and structured in an appropriate manner such as ontologies,
which are consensual and reusable formalization which identifies the concepts and relationships in
a domain of application.

In this research we present a system for customizing Web content that uses a semantic reasoning
mechanism through inference rules associated with a type of user, extracting attributes of
ontology of profiles, to relate the concepts in domain ontology, so they get a recommendation of
content of interest.
CONTENIDO

Capítulo 1 : INTRODUCCIÓN................................................................................................................ 1
           1.1           INTRODUCCIÓN ........................................................................................................... 2
           1.2           DESCRIPCIÓN DEL PROBLEMA ......................................................................................... 2
           1.3           OBJETIVO ................................................................................................................... 3
           1.4           JUSTIFICACIÓN ............................................................................................................. 3
           1.5           ALCANCES Y LIMITACIONES ............................................................................................ 4
           1.6           ORGANIZACIÓN DEL DOCUMENTO................................................................................... 4
Capítulo 2 : MARCO TEÓRICO ............................................................................................................. 5
           2.1           WEB SEMÁNTICA ......................................................................................................... 6
           2.2           ONTOLOGÍAS .............................................................................................................. 6
           2.3           OWL ......................................................................................................................... 7
           2.4           PERSONALIZACIÓN WEB................................................................................................ 8
                      2.4.1 PERSONALIZACIÓN WEB SEMÁNTICA ........................................................................ 9
Capítulo 3 : ESTADO DEL ARTE .......................................................................................................... 13
           3.1           INTRODUCCIÓN ......................................................................................................... 14
           3.2           PERSONALIZACIÓN SEMÁNTICA DE CONTENIDOS DE PORTALES WEB.................................... 14
           3.3           SISTEMA DE PERSONALIZACIÓN WEB (SEWEP) .............................................................. 15
           3.4           CREACIÓN DE ONTOLOGÍAS BASADAS EN PERFILES DE USUARIO .......................................... 16
           3.5      PERSONALIZACIÓN DE NAVEGACIÓN WEB CON PERFILES PERSONALES ENRIQUECIDOS
           SEMÁNTICAMENTE .................................................................................................................... 17

           3.6     RECUPERACIÓN DEL CONTENIDO DEL CONTEXTO PERSONALIZADO UTILIZANDO CONTENIDO
           ONTOLÓGICO............................................................................................................................ 17

           3.7           RAZONAMIENTO SEMÁNTICO: UNA RUTA DE NUEVAS POSIBILIDADES DE PERSONALIZACIÓN .... 18
           3.8           UN ENFOQUE DE LA WEB SEMÁNTICA PARA LA PERSONALIZACIÓN DEL CONTENIDO ............... 18
           3.9           MODELADO MANEJADO POR ONTOLOGÍAS PARA LA PERSONALIZACIÓN DE CONTENIDO WEB .. 19
           3.10          COMPARATIVA .......................................................................................................... 19
Capítulo 4 : METODOLOGÍA PARA LA PERSONALIZACIÓN DE CONTENIDOS WEB............................ 23
           4.1           INTRODUCCIÓN ......................................................................................................... 24
           4.2           FASE 1: DESARROLLO DE ONTOLOGÍA DE E-GOBIERNO ...................................................... 25
                                                                                                            i|Página
4.2.1 PROCESO 1: SELECCIÓN DE PORTALES GUBERNAMENTALES......................................... 25
                       4.2.2 PROCESO 2: EVALUACIÓN DE PORTALES GUBERNAMENTALES...................................... 28
                       4.2.3 PROCESO 3: CREACIÓN DE ONTOLOGÍA DE GOBIERNO ............................................... 31
                         4.2.3.1 METODOLOGÍA PARA LA CREACIÓN DE ONTOLOGÍA DE E-GOBIERNO....................... 32
           4.3           FASE 2: SELECCIÓN DE ATRIBUTOS DE ONTOLOGÍA DE USUARIO ......................................... 41
           4.4           FASE 3: CATÁLOGO DE REGLAS DE INFERENCIA (SWRL).................................................... 43
                       4.4.1 REGLAS PARA EL PERFIL DE ADULTOS....................................................................... 44
                       4.4.2 REGLAS PARA EL PERFIL DE ADULTOS MAYORES......................................................... 45
                       4.4.3 REGLAS PARA EL PERFIL DE PERSONAS CON DISCAPACIDAD .......................................... 47
                       4.4.4 REGLAS PARA EL PERFIL DE JÓVENES ....................................................................... 48
                       4.4.5 REGLAS PARA EL PERFIL DE MUJERES ....................................................................... 50
                       4.4.6 REGLAS PARA EL PERFIL DE NIÑOS........................................................................... 51
                       4.4.7 REGLAS GENERALES ............................................................................................. 52
                       4.4.8 REGLAS EN LENGUAJE SWRL .................................................................................. 53
           4.5           FASE 4: DESARROLLO DEL SISTEMA DE PERSONALIZACIÓN WEB ......................................... 62
Capítulo 5 : ANÁLISIS, DISEÑO E IMPLEMENTACIÓN ........................................................................ 63
           5.1           ARQUITECTURA DEL SISTEMA DE PERSONALIZACIÓN DE CONTENIDOS WEB........................... 64
           5.2           ANÁLISIS .................................................................................................................. 66
                       5.2.1 DIAGRAMAS DE CASOS DE USO ............................................................................. 66
           5.3           DISEÑO .................................................................................................................... 70
                       5.3.1 DIAGRAMA DE CLASES ......................................................................................... 70
           5.4           CARACTERÍSTICAS DE IMPLEMENTACIÓN ........................................................................ 72
           5.5           IMPLEMENTACIÓN...................................................................................................... 72
Capítulo 6 : PRUEBAS ........................................................................................................................ 78
           6.1           INTRODUCCIÓN ......................................................................................................... 79
           6.2           RESULTADOS ............................................................................................................. 80
                       6.2.1 CASO DE ESTUDIO CE-SRC-A01 ............................................................................ 80
                       6.2.2 CASO DE ESTUDIO CE-SRC-A02 ............................................................................ 83
                       6.2.3 CASO DE ESTUDIO CE-SRC-AM01 ........................................................................ 85
                       6.2.4 CASO DE ESTUDIO CE-SRC-J01 ............................................................................. 87
                       6.2.5 CASO DE ESTUDIO CE-SRC-J02 ............................................................................. 89

                                                                                                                                 ii | P á g i n a
6.2.6 CASO DE ESTUDIO CE-SRC-M01 ........................................................................... 90
                        6.2.7 CASO DE ESTUDIO CE-SRC-M02 ........................................................................... 92
                        6.2.8 CASO DE ESTUDIO CE-SRC-N01............................................................................ 95
                        6.2.9 CASO DE ESTUDIO CE-SRC-N02............................................................................ 96
                        6.2.10 CASO DE ESTUDIO CE-SRC-D01 .......................................................................... 97
                        6.2.11 RESULTADO ...................................................................................................... 98
Capítulo 7 : CONCLUSIONES ............................................................................................................ 100
            7.1           CONCLUSIONES........................................................................................................ 101
            7.2           APORTACIONES ....................................................................................................... 101
            7.3           TRABAJOS FUTUROS ................................................................................................. 102
REFERENCIAS ................................................................................................................................... 103
ANEXO A .......................................................................................................................................... 105
            A1: Herramientas para el análisis de datos. ....................................................................... 105
            A2: Clases de ontología de e-gobierno con propiedad tipo dato....................................... 106
            A3: Grafo jerárquico de ontología de e-gobierno. ............................................................. 107
            A4: Relaciones no taxonómicas de ontología de e-gobierno. ............................................ 108




                                                                                                                               iii | P á g i n a
Capítulo 1 :
INTRODUCCIÓN




           1|Página
«INTRODUCCIÓN


En este capítulo se presenta una introducción, el problema que dio origen a la tesis, sus alcances y
limitaciones. Finalmente se describe la organización del documento.

1.1 INTRODUCCIÓN

Uno de los servicios que más éxito ha tenido el Internet, es la World Wide Web (WWW, o "la
Web”), que se ha convertido en un instrumento cotidiano de comunicación en nuestra sociedad.
La información está representada en forma de páginas Web que los usuarios pueden acceder y
explorar, y la forma de hacerlo depende en gran medida de lo que estén buscando. Debido a la
cantidad de información contenida en la Web la ha llevado a evolucionar de ser una Web basada
en documentos a una Web basada en aplicaciones y servicios (Web 2.0) en donde los usuarios
participan y deciden los contenidos actuales de la Web. Actualmente la nueva visión de la Web se
define como “Web semántica” *Berners-Lee 2001], la cual propone describir los recursos de la
Web con representaciones procesables (es decir, entendibles) no sólo por personas, sino por
programas, donde es más fácil localizar, compartir e integrar información y servicios para sacar un
mayor partido de los recursos disponibles en la Web. El punto clave de la Web semántica son las
ontologías que permiten crear, interpretar y comparar el contenido semántico de un recurso Web.
Esto ha generado la necesidad, por parte de los proveedores de sitios Web, de hacer sitios más
intuitivos y accesibles para los usuarios.

Hoy en día los sitios Web definen grupos de usuarios, de tal manera que un usuario se identifique
con algún grupo y obtenga información pertinente del sitio Web de acuerdo a las características
del grupo elegido, tal es el caso de los sitios Web existentes para e-gobierno en donde definen
grupos de usuarios para canalizar la diversidad de información que manejan los sitios en ese
dominio, sin embargo la información suele ser general y no tener relaciones con otros grupos de
información.

Una solución a esta problemática es la personalización de contenidos Web, que pretende
equilibrar la sobrecarga de la información contenida en los sitios Web mediante la selección de
información que sea pertinente y de interés para el usuario. Esto permite dar recomendaciones a
los usuarios, ya sea por simples páginas, o por la construcción de nuevos mapas de contenidos de
sitio Web para los grupos de usuarios. Con la ayuda de las ontologías que nos permiten tener una
mejor representación y organización de la información que facilite el mejor filtrado de contenido
para las recomendaciones de los usuarios.

El objetivo de este proyecto de investigación es personalizar los contenidos Web en el dominio de
e-gobierno de acuerdo a grupos de usuarios. La estrategia es desarrollar una ontología que
represente lo contenidos de sitios Web de gobierno y una ontología que represente los intereses y
preferencias de los usuarios, con el fin de perfilar al usuario en un grupo y ofrecerle
recomendaciones de acuerdo a su perfil.

1.2 DESCRIPCIÓN DEL PROBLEMA

La llamada Sociedad de la Información [Masuda 1968] es una consecuencia natural del rápido
crecimiento de Internet desde su nacimiento. Este contexto genera nuevos retos para los usuarios
de integrarse de acuerdo a sus exigencias (tecnologías). En la lucha por alcanzar tales desafíos

                                                                                     2|Página
«INTRODUCCIÓN


tropiezan con la gran cantidad de información que se ha extendido a diversos dominios, en este
escenario los usuarios deben explorar espacios densos de información para seleccionar lo que
están buscando lo que resulta ser una tarea tediosa. Un mecanismo para suplir esta tarea son los
sistemas de recomendación los cuales seleccionan de forma automática y personalizada los
contenidos que mejor se adapten a las preferencias o necesidades de cada usuario. Por lo tanto,
se ha generado la necesidad de mejorar los sitios Web de acuerdo a las necesidades de los
usuarios.

Los sitios Web existentes para e-gobierno enfrentan la problemática de ofrecer contenidos de
interés a los diferentes tipos de usuario que acceden a ellos. Aunque algunos sitios están
implementando grupos definidos de usuarios para canalizar la diversidad de información que
manejan los sitios en este dominio, sin embargo, requieren que se aborden diferentes perfiles, es
decir, el poder identificar las diversas preferencias de los usuarios y mostrarles la información que
requieran de acuerdo a sus necesidades

En este trabajo de investigación se desarrolló un sistema de personalización de contenidos Web
que permita encontrar reglas que puedan asociar a un tipo de usuario, extrayendo sus atributos
de una ontología de perfiles, para asociarlos a los conceptos de una ontología de dominio, de tal
manera que tenga una recomendación de contenidos de su interés.

1.3 OBJETIVO

Personalizar el contenido de un sitio Web, a través de reglas de inferencia que definan las
relaciones de un perfil de usuario con el contenido del sitio Web, mediante ontologías definidas
para el dominio de e-gobierno.

1.4 JUSTIFICACIÓN

La necesidad de herramientas de personalización se ha manifestado claramente, desde hace ya
mucho tiempo, en numerosos dominios de aplicación, de ahí la gran diversidad de enfoques que
han ido surgiendo en el campo de los sistemas de recomendación en los últimos años
[Adomavicius 2005] y [Demiriz 2001]. En los trabajos de [Tziviskou 2007], [Magdalini 2005] y
[Ankolekar 2005] utilizan reglas de asociación que descubren acciones predecibles del usuario
para lo cual necesitan un historial de su navegación. Los trabajos [Trajkova 2004], [Vallet 2007],
[Brambilla 2008] asignan una ponderación a los contenidos de mayor interés para los usuarios
para posteriormente mostrarlos de mayor escala. En [Blanco 2008] utilizan asociaciones
semánticas para descubrir relaciones ocultas entre los contenidos de interés del usuario. Sin
embargo cada trabajo tiene diferente dominio y técnica de aplicación lo cual da por hecho que la
personalización Web está relacionada con los requerimientos que se deseen cubrir, en general,
cada enfoque es hecho a la medida de cada requerimiento específico de la aplicación en cuestión,
entre estos enfoques podemos encontrar varias soluciones técnicas y esto es una evidencia de que
no hay una metodología globalmente aceptada y genérica para permitir la personalización. El
común denominador de estas aplicaciones es que son orientadas hacia un enfoque basadas en el
conocimiento. La mayoría de ellas explotan de alguna manera técnicas de representación de
conocimiento formal, por ejemplo (ontologías y reglas) [Tsetos 2008]. Con este trabajo de


                                                                                      3|Página
«INTRODUCCIÓN


investigación se propone la personalización de contenidos de un sitio Web en el dominio de e-
gobierno.

1.5 ALCANCES Y LIMITACIONES

En esta sección se presentan los alcances y limitaciones para el presente trabajo de investigación.

Alcances:

            Definir los atributos del perfil de usuario de acuerdo a la estructura de un sitio Web.
            Analizar, extender e implementar la ontología de usuario de acuerdo a los atributos
            de mayor interés.
            Identificar relaciones entre ontología de dominio y de usuario
            Generar las reglas de asociación entre la ontología del dominio y de usuario.
            Personalizar los contenidos del sitio Web de acuerdo al perfil de usuario.

Limitaciones:

            La personalización de contenidos Web está dirigida al dominio de e-gobierno.
            La personalización de contenidos Web está enfocada solo a los contenidos.
            La ejecución de reglas de inferencia se realiza con la máquina de inferencia Jess [Jess
            2010].


1.6 ORGANIZACIÓN DEL DOCUMENTO

El presente documento se encuentra organizado de la siguiente manera:

        Capítulo 2. Marco Teórico: en este capítulo se presentan los fundamentos teóricos de la
        presente investigación.
        Capítulo 3. Estado del arte: en este capítulo se presenta un resumen de los trabajos
        relacionados que sirven como punto de referencia y comparación con el presente trabajo
        de investigación.
        Capítulo 4. Metodología para la personalización de contenidos Web: en este capítulo se
        presenta la metodología para la personalización de contenidos de e-gobierno aplicando un
        proceso de razonamiento semántico.
        Capítulo 5. Análisis, Diseño e Implementación: en este capítulo se presenta la
        arquitectura del sistema de personalización de contenidos, sus detalles de análisis como
        los casos de uso y de diseño como el diagrama de clases, así también la implementación
        de la arquitectura.
        Capítulo 6. Pruebas: en este capítulo se presenta el plan de prueba para el prototipo de
        recomendación de contenidos web y los resultados obtenidos.
        Capítulo 7. Conclusiones: en este capítulo se presentan las conclusiones derivadas de este
        trabajo, las principales aportaciones y los posibles trabajos futuros que se pueden realizar
        a partir de esta investigación.

                                                                                      4|Página
Capítulo 2 :
MARCO TEÓRICO




            5|Página
«MARCO TEÓRICO


En este capítulo se presenta la teoría relacionada con el tema aplicado en este trabajo de tesis. Se
inicia describiendo los conceptos relacionados con la investigación en el ámbito semántico y los
conceptos generales que se utilizarán en el transcurso de este documento.


2.1 WEB SEMÁNTICA

La Web semántica [Berners-Lee 2001] propone superar las limitaciones de la Web actual mediante
la introducción de descripciones explícitas del significado, la estructura interna y la estructura
global de los contenidos y servicios disponibles en la Web. Frente al crecimiento de información, y
la ausencia de una organización clara de la Web actual, la Web semántica aboga por clasificar,
dotar de estructura y anotar con semántica los contenidos en la Web.

Para construir la Web semántica se necesita poder representar el conocimiento de forma que sea
legible por las computadoras, esté consensuado, y sea reutilizable. Las ontologías proporcionan la
vía para representar este conocimiento.

La Web no se limita únicamente a proporcionar acceso a contenidos, también ofrece interacción y
servicios (comprar un libro, reservar un vuelo, hacer una transferencia bancaria, simular una
hipoteca). Los servicios Web semánticos son una línea importante de la Web semántica, que
propone describir no sólo información sino definir ontologías de funcionalidad y procedimientos
para describir servicios Web: sus entradas y salidas, las condiciones necesarias para que se puedan
ejecutar, los efectos que producen, o los pasos a seguir cuando se trata de un servicio compuesto.
Estas descripciones procesables por máquinas permitirían automatizar el descubrimiento, la
composición, y la ejecución de servicios, así como la comunicación entre unos y otros [Castells
2004].


2.2 ONTOLOGÍAS

La representación del conocimiento se hace para homogeneizar los datos y para hacerlos
manejables. Las ontologías expresan universos de objetos y conceptos lógicamente estructurados.

Gruber define una ontología como una especificación formal de una conceptualización compartida
[Gruber 1993]. Una ontología es una jerarquía de conceptos con atributos y relaciones, que define
una terminología consensuada para definir redes semánticas de unidades de información
interrelacionadas. Una ontología proporciona un vocabulario de clases y relaciones para describir
un dominio, poniendo énfasis en la compartición del conocimiento y el consenso en la
representación de éste. Por ejemplo, una ontología sobre arte podría incluir clases como Pintor,
Cuadro, Estilo o Museo, y relaciones como autor de un cuadro, pintores pertenecientes a un estilo
artístico u obras localizadas en un museo.

Continuando con Gruber las ontologías tienen los siguientes componentes que sirven para
representar el conocimiento de algún dominio.



                                                                                     6|Página
«MARCO TEÓRICO


        Conceptos: son las ideas básicas que se intentan formalizar. Los conceptos pueden ser
        clases de objetos, métodos, planes, estrategias, procesos de razonamiento, etc.
        Relaciones: representan la interacción y enlace entre los conceptos del dominio. Suelen
        formar la taxonomía del dominio. Por ejemplo: subclase-de, parte-de, parte-exhaustiva-
        de, conectado-a, etc.
        Funciones: son un tipo concreto de relación donde se identifica un elemento mediante el
        cálculo de una función que considera varios elementos de la ontología. Por ejemplo,
        pueden parecer funciones como categorizar-clase, asignar fecha, etc.
        Instancias: se utilizan para representar objetos determinados de un concepto.
        Axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos
        de la ontología. Por ejemplo: “Si A y B son de la clase C, entonces A no es subclase de B”,
        “Para todo A que cumpla la condición C1, A es B”, etc.

Una ontología es el resultado de seleccionar un dominio, y aplicar sobre el mismo un método para
obtener una representación formal de los conceptos que contiene y las relaciones que existen
entre los mismos. Para poder explotar la Web semántica, se necesitan lenguajes de marcado
apropiados que representen el conocimiento de las ontologías. Existe un lenguaje de marcado
para publicar y compartir datos usando ontologías, el Lenguaje de Ontologías Web (OWL, “Web
Ontology Lenguaje”) *W3C OWL 2004+, el cual se describe en el siguiente punto.


2.3 OWL

El Lenguaje de Ontologías Web (OWL) es el sucesor de DAML + OIL, como sus predecesores, el
vocabulario OWL incluye un conjunto de elementos y atributos XML, con un significado bien
definido. Estos se utilizan para describir los términos de dominio y sus relaciones en una ontología.

OWL está diseñado para ser usado en aplicaciones que necesitan procesar el contenido de la
información en lugar de únicamente representar información para los humanos. OWL facilita un
mejor mecanismo de interoperabilidad de contenido Web que los mecanismos admitidos por XML,
RDF, y esquema RDF (RDF-S) proporcionando vocabulario adicional junto con una semántica
formal. OWL tiene tres sub-lenguajes, con un nivel de expresividad creciente: OWL Lite, OWL DL, y
OWL Full [W3C OWL 2004].

OWL es un lenguaje para describir datos con semántica en la Web y no como protocolo de
intercambio de información. Sus funciones principales se resumen en:

    1. Formaliza dominios mediante clases y propiedades.
    2. Define individuos y propiedades entre individuos.
    3. Permite un razonamiento formal (inferencia) basado en la semántica adoptada en la
       definición de clases propiedades e individuos.

OWL proporciona tres lenguajes, cada uno con nivel de expresividad mayor que el anterior,
diseñados para ser usados por comunidades específicas de desarrolladores y usuarios.



                                                                                      7|Página
«MARCO TEÓRICO


   1. OWL Lite está diseñado para aquellos usuarios que necesitan principalmente una
      clasificación jerárquica y restricciones simples. Por ejemplo, a la vez que admite
      restricciones de cardinalidad, sólo permite establecer valores cardinales de 0 ó 1. OWL Lite
      proporciona una ruta rápida de migración para tesauros y otras taxonomías. OWL Lite
      tiene también una menor complejidad formal que OWL DL.

   2. OWL DL está diseñado para aquellos usuarios que quieren la máxima expresividad
      conservando completitud computacional (se garantiza que todas las conclusiones sean
      computables). OWL DL incluye todas las construcciones del lenguaje de OWL, pero sólo
      pueden ser usados bajo ciertas restricciones (por ejemplo, mientras una clase puede ser
      una subclase de otras muchas clases, una clase no puede ser una instancia de otra). OWL
      DL es denominado de esta forma debido a su correspondencia con la lógica de descripción
      (Description Logics, en inglés), un campo de investigación que estudia la lógica que
      compone la base formal de OWL.

   3. OWL Full está diseñado a usuarios que quieren máxima expresividad y libertad sintáctica
      de RDF. Por ejemplo, en OWL Full una clase puede ser considerada simultáneamente
      como una colección de clases individuales y como una clase individual propiamente dicha.
      OWL Full permite una ontología para aumentar el significado del vocabulario
      preestablecido (RDF u OWL). Es poco probable que cualquier software de razonamiento
      sea capaz de obtener un razonamiento completo para cada característica de OWL Full.
      Cada uno de estos sub-lenguajes es una extensión de su predecesor más simple.

Los desarrolladores de ontologías que adoptan OWL deberían considerar cuál es el sublenguaje
que mejor se adapta a sus necesidades. La elección entre OWL Lite y OWL DL depende de las
necesidades de los usuarios sobre la expresividad de las construcciones, proporcionando OWL DL
las más expresivas. La elección entre OWL DL y OWL Full depende principalmente de las
necesidades de los usuarios sobre los recursos de metamodelado del esquema RDF (por ejemplo,
definir clases de clases, o definir propiedades de clases). Cuando se usa OWL Full en comparación
con OWL DL, el soporte en el razonamiento es menos predecible, ya que no existen en este
momento implementaciones completas de OWL Full.


2.4 PERSONALIZACIÓN WEB

La personalización Web es la habilidad de un sitio para mantener la atención de los usuarios a un
nivel más alto de lo común y guiarlos de forma satisfactoria a obtener información útil y
pertinente, de acuerdo con [Mombasher 2005].La personalización Web contempla el modelado de
objetos Web como páginas y tópicos, la categorización de esos objetos, la búsqueda de
coincidencias entre estos, así como el conjunto de acciones que se deben tomar, para realizar la
personalización. Puede ser basada en sistemas de reglas de decisión manuales, agentes de filtrado
basados en el contenido o sistemas de filtrado colaborativo. La personalización Web consta de dos
definiciones:




                                                                                   8|Página
«MARCO TEÓRICO


Definición 1. Sistema Adaptable y Adaptativo.

Un sistema es llamado "adaptable" cuando permite a un usuario ajustar el comportamiento de un
sistema a sus preferencias y necesidades actuales. Por otra parte, un sistema “adaptativo”, es
aquel que permite ajustar de manera autónoma las preferencias y necesidades actuales del
usuario. El sistema “adaptativo” captura las necesidades del usuario (preferencias, intereses,
experiencia, etc.) y automáticamente se adapta a estas necesidades inferidas [Baldoni 2005].

Definición 2. Personalización.

Es el proceso de presentar contenido y/o servicios a un usuario sobre la base de sus preferencias,
intereses, necesidades y contexto en general. El propósito de este proceso es adaptar el contenido
y servicios a las características específicas del usuario con el fin de lograr un óptimo rendimiento
(la definición de "rendimiento" es dependiente del dominio) [Tsetsos 2008].

En consecuencia llamamos a una aplicación como personalizada o adaptativa al usuario, si está
consciente del perfil del usuario, puede detectar el contexto del usuario y necesidades, y es capaz
de adaptarse a sí misma para satisfacer esas necesidades.


2.4.1 PERSONALIZACIÓN WEB SEMÁNTICA

La creciente demanda de aplicaciones por usuarios, ha generado muchos métodos para
personalizar las aplicaciones, de acuerdo a sus requerimientos. En general, cada enfoque es hecho
a la medida de cada requerimiento específico de la aplicación en cuestión, entre estos enfoque
podemos encontrar varias soluciones técnicas y esto es una evidencia de que no hay una
metodología globalmente aceptada y genérica para permitir la personalización.

El común denominador de estas aplicaciones es que son orientadas hacia un enfoque basadas en
el conocimiento. La mayoría de ellas explotan de alguna manera técnicas de representación de
conocimiento formal, por ejemplo (ontologías y reglas). En [Tsetsos 2008] se presenta una
arquitectura para la Web semántica personalizada. Los principales componentes de esta
arquitectura se muestran en la Figura 2-1: aplicación de la lógica del negocio, modelos y contexto,
mecanismos de detección del contexto, modulo de razonamiento.


     Aplicación de la lógica de negocio:

Se define como una aplicación que presenta los servicios o contenidos a cada uno de los usuarios
de manera óptima, dado el contexto actual. Con óptimo nos referimos a la facilidad de uso, alto
rendimiento, comportamiento proactivo, recuperación efectiva del contenido, filtrado y
presentación.




                                                                                     9|Página
«MARCO TEÓRICO




    Figura 2-1: Arquitectura de una aplicación para la personalización Web semántica [Tsetsos 2008]


     Modelos y Contexto

Se ha puesto énfasis en el modelo basado en la personalización, es decir todos los conocimientos
pertinentes para la aplicación destino se describe a través de modelos. En el caso de la
personalización Web Semántica, la manera común de representar estos modelos es el lenguaje de
ontologías de Web Semántica, el lenguaje de ontologías Web (OWL) y/o el Esquema de Resource
Description Framework (RDFS). Los modelos (es decir, ontologías) pueden describir diversos
aspectos de la arquitectura general del sistema. En la Figura 2-1, se identifican los cinco principales
modelos que se espera encontrar en la personalización de aplicaciones Web Semánticas:

    1. Modelo de aplicación: es un modelo que describe detalles específicos de aplicaciones,
       tales como solicitud de los estados, procesos, y su semántica.

    2. Modelo de usuario: es un modelo obligatorio centrado en el humano. Puede describir
       varios aspectos del perfil del usuario tales como: información demográfica, situación
       actual, intereses y preferencias, es decir, especifica una clasificación de usuarios, de
       acuerdo a su perfil.

    3. Modelo del entorno: es un modelo que especifica elementos periféricos del modelado,
       por ejemplo, el estado del entorno que rodea al usuario o aplicaciones externas que
       pueden afectar el comportamiento de la aplicación en cuestión.

    4. Modelo de Actividad: es un modelo que describe todas las posibles interacciones del
       usuario con el sistema y otras actividades que pueden ser realizadas y proveen alguna
       retroalimentación para un futuro comportamiento de la aplicación. En cierto sentido, este
       modelo es una descripción formal de registros de actividad. Por ejemplo, las varias clases
       que las que el usuario es clasificado durante un periodo de tiempo puede ser información

                                                                                       10 | P á g i n a
«MARCO TEÓRICO


        útil para disparar acciones de adaptación. Las instancias de este modelo capturan
        conocimiento que puede incluir información accedida antes por el usuario, patrones
        temporales del uso de la aplicación etc. Este tipo de información es, generalmente
        obtenido por el sistema de una manera transparente, dicha información es una entrada
        común para mecanismos de aprendizaje de perfiles.

   5.    Modelo de Contenido: es un modelo que describe la semántica del contenido usado por
        la aplicación. Se puede suponer que en la mayoría de los casos el contenido no cambia
        dinámicamente.

    Mecanismos de detección de contexto

En este módulo se realiza la actualización del contexto de usuario, utilizando dos mecanismos: un
sensor de contexto y una traducción del contexto. El sensor de contexto se encarga de obtener
datos de acuerdo a la ubicación de usuario, temperatura ambiental, recabar información del
contexto en el que se encuentre el usuario. La traducción del contexto, realiza la transformación
de los datos de contexto a rutinas para que sean procesadas por la aplicación correspondiente.

    Módulo de Razonamiento

Este módulo se encarga del mecanismo de razonamiento para la adaptación de personalización.
Como entrada recibe reglas, que son la especificación de los modelos, que describen todo el
contexto de la aplicación para su correspondiente personalización.

Como resultado se obtiene las decisiones y acciones que adoptará la aplicación para adaptarse al
contexto de usuario. Dependiendo de la representación, el conocimiento técnico y la expresividad
que se utilicen para los modelos y la adaptación de políticas, este módulo podrá realizar diversos
tipos de inferencia.

    MODELADO DE INGENIERIA DE USUARIO: DEFINICIONES

El modelo de usuario juega un papel clave en todos los sistemas de personalización. Obviamente,
dada la actual tecnología de la Web semántica, la ontología es la "Herramienta" para expresar este
modelo. El modelo de usuario tiene 2 aspectos de conocimiento:

   1. El aspecto funcional: divide el modelo de ingeniería de usuario en categorías basadas en
      su uso real en la solicitud del usuario. Las categorías típicas son:

           Demografía usuario: este tipo de categoría recoge información general del
           usuario. Esta información del usuario puede incluir: nombre, edad, dirección de correo
           electrónico, etc., normalmente, previsto por el usuario.

           Preferencias del usuario: en esta categoría un usuario puede tener varias preferencias
           en relación con su interacción con un sistema. Esta información ayuda al sistema para
           optimizarlo y así proporcionar el acceso, la presentación y la recuperación de la


                                                                                  11 | P á g i n a
«MARCO TEÓRICO


       información para el usuario. Tales preferencias pueden incluir los intereses del usuario
       o sus necesidades de información.

       Capacidades de usuario: en esta categoría un usuario también puede tener las
       capacidades individuales o discapacidad que debería afectar la forma en que el
       sistema funciona. Por ejemplo, en un escenario de navegación peatonal, considerar un
       usuario en un edificio público que utiliza una silla de ruedas. Por otra parte, asumir
       que el edificio ofrece un servicio de navegación a los usuarios con teléfonos
       inteligentes. Obviamente, el servicio de navegación debe excluir todas las rutas que
       contienen las escaleras, debido a la discapacidad del usuario para acceder a ellas.

2. El aspecto estructural: divide al modelo de usuario en categorías de acuerdo a [Cali 2004]:

       Un conjunto de alto nivel, clases de usuario (UC): la UC es utilizada para clasificación
       de los usuarios con respecto al dominio de aplicación.

       Un conjunto de clases que representan las características del perfil (FC): estas clases
       constituyen el super conjunto de los intereses, capacidades y preferencias que un
       usuario pueda tener. Las características reales que se aplican a un usuario están
       representadas como instancias de las respectivas FC.

       Un conjunto de relaciones (o función de las propiedades) (FP), asignan funciones (FC
       casos) a usuarios (UC casos): según el lenguaje OWL, se trata de relaciones binarias y
       se especifica como objeto-propiedad.

       Un conjunto de atributos, A, que asignan valores literales a las características del
       usuario: una característica típica podría ser el nombre, la edad, el sexo, etc., según el
       lenguaje OWL, estos son como el modelo de relaciones binarias y se especifican como
       dato-propiedad.




                                                                                12 | P á g i n a
Capítulo 3 :
ESTADO DEL ARTE




            13 | P á g i n a
«ESTADO DEL ARTE


En este capítulo se revisan las propuestas definidas en la literatura en el campo de los sistemas de
personalización de contenidos Web. Dicha revisión incluye el tipo de modelo en cómo presentan
los contenidos Web, el modelado de usuario para crear sus perfiles con las características de sus
preferencias y los mecanismos para adaptar las recomendaciones de contenidos de acuerdo al
perfil de usuario, al final del capítulo se muestra una comparativa de los trabajos analizados.


3.1 INTRODUCCIÓN

Con el fin de conocer el contexto de la investigación se presentan los ochos trabajos relacionados
con los puntos de revisión considerados (modelo del sitio Web, modelo de usuario y técnica de
personalización). Los ochos trabajos relacionados: 1) Personalización semántica de contenidos
Web, 2) Personalización Web, integrando contenido semántico y patrones de navegación, 3)
Improvisando ontologías basadas en perfiles de usuario, 4) Personalización de navegación Web
con perfiles personales enriquecidos semánticamente, 5) Recuperación del contenido del contexto
personalizado utilizando contenido ontológico, 6) Razonamiento semántico: una ruta a nuevas
posibilidades de personalización, 7) Un enfoque de la Web semántica para la personalización del
contenido y 8) Modelado manejado por ontologías para la personalización de contenido Web se
describen a continuación.


3.2 PERSONALIZACIÓN SEMÁNTICA DE CONTENIDOS DE PORTALES WEB

El modelo conceptual propuesto en [Tziviskou 2007] para la recomendación de contenidos Web se
basa en un algoritmo que asocia pesos (cantidad) a los contenidos visitados el usuario.
Posteriormente realizar un consenso de los contenidos más visitados y así mostrarle los de mayor
interés.

El modelo conceptual se basa en las declaraciones explícitas e implícitas de las preferencias del
usuario y en un proceso iterativo de análisis de su historial de navegación. Para la realización del
modelo conceptual se enfocaron en tres partes:

    1. Ontología del perfil de usuario: se identifican datos y la navegación de los usuarios, para
       crear objetos que categoricen sus preferencias, mientras un usuario visite más el sitio
       Web, la ontología se poblará de más objetos que describan más específicamente al
       usuario.

    2. Ontología del dominio: se utiliza WebML que es una metodología para la creación de
       aplicaciones Web, con la cual se extrae el esquema de datos del sitio Web para encontrar
       las categorías de los contenidos presentados en el sitio y crear la ontología del dominio,
       como se muestra en la Figura 3-1.




                                                                                    14 | P á g i n a
«ESTADO DEL ARTE




             Figura 3-1: Modelo de datos ontológico para un portal Web [Tziviskou 2007].

   3. Razonamiento de personalización: crearon un algoritmo para la extracción de los objetos
      representados en la ontología del dominio para darle las recomendaciones necesarias al
      usuario. El algoritmo consta de 3 pasos:
              Primer paso: el algoritmo especifica las relaciones y los correspondientes pesos
              asignados para la extracción de objetos similares en la página.
              Segundo paso: el algoritmo descarta los objetos recuperados que no están
              relacionados (de manera directa) o que no están contenidas en los intereses del
              usuario.
              Tercer paso: el algoritmo califica los objetos recuperados calculando el total de
              peso de las relaciones que las conectan a los intereses del usuario.


3.3 SISTEMA DE PERSONALIZACIÓN WEB (SEWEP)

La herramienta propuesta en [Magdalini 2005] utiliza reglas de asociación para relacionar la
navegación del usuario con los contenidos representados en una taxonomía del sitio Web. La
herramienta nombrada SeWep consta de seis módulos:

   1. Recuperación de Contenido: este módulo se encarga de rastrear el sitio Web, extrae el
      texto de una variedad de formatos de archivo (html, doc, php, ppt, pdf, flash, etc.) y las
      almacena en su base de datos.

   2. Extracción de palabras clave: este módulo se encarga de extraer los contenidos a los que
      haya accedido el usuario, para encontrar un conjunto de palabras prioritarias que
      identificarán el tipo de contenido al cual el usuario accedió, estas palabras son
      almacenadas en una base de datos con la frecuencia que fueron solicitadas.

   3. Categorización de palabras claves: en este módulo las palabras claves extraídas son
      clasificadas en categorías de acuerdo a un dominio específico (taxonomía). El sistema
      utiliza un tesauro (WordNet) para realizar la categorización. Ponderado estas categorías se
      almacenan en archivos XML y / o en la base de datos.

   4. Administración de sesiones: en este módulo se extrae la navegación de los usuarios, el
      sistema hace uso de la sesionización sobre la base de diferentes direcciones IP y un usuario
      definido en el tiempo límite entre los períodos de sesiones. Las distintas sesiones se
      almacenan en archivos XML y / o tablas de base de datos.


                                                                                      15 | P á g i n a
«ESTADO DEL ARTE


   5. Reglas de la Asociación: en este módulo se extrae las categorías de mayor frecuencia que
      un usuario accedió, creando reglas de asociación, es decir, relaciona los criterios que al
      usuario le interesaron para posteriormente mostrarle esos criterios. Los resultados se
      almacenan en archivos de texto para su posterior análisis o para su utilización en el motor
      de recomendación.

   6. Recomendaciones: este módulo relaciona las reglas de asociación con las categorías de
      palabras claves, de tal manera que genera recomendaciones dinámicas para el visitante de
      la Web.


3.4 CREACIÓN DE ONTOLOGÍAS BASADAS EN PERFILES DE USUARIO

La metodología propuesta en [Trajkova 2004] propone la generación automática de perfiles de
usuario basados en ontologías, se basa en la captura del comportamiento de un usuario mediante
el análisis de su exploración Web habitual. Lo cual, alimenta una estructura jerárquica
proponiendo como niveles más altos a los puntos con más interés y viceversa, a partir de un
cálculo predefinido de ponderaciones, tomando en cuenta que se utilizará el perfil cuando se
considere lo suficientemente maduro para ello.

Para construir el perfil usan como entrada las páginas que ha visitado el usuario, toman la cantidad
mínima de 5 segundos que haya tardado el usuario en las páginas. El sistema clasifica cada página
Web de acuerdo a un concepto definido en la ontología. El proceso de construcción del perfil
consta de 3 fases:

   1) Clasificador de entrenamiento:
   Esta fase se encarga de clasificar páginas que están relacionadas a un concepto particular para
   crear un superdocumento, uno por cada concepto relevante que identifique los contenidos del
   sitio Web.

   2) Recogedor de datos de usuario:
   Esta fase almacena en un archivo de registro las URL´s, fecha y hora de visita, tamaño de la
   página, por un servidor Proxy. Utilizan un programa que extrae las URL para cada usuario y los
   filtros para eliminar los documentos que se consideran demasiado cortos para tener cualquier
   contenido menos de un KB) y aquellos sobre los que el usuario está poco tiempo (menos de 4
   segundos), ya sea porque la página no tiene contenido de interés o debido a que la página fue
   actualizada.

   3) Clasificador de páginas Web de los recogidos URL´s:
   Esta fase se encarga de clasificar las páginas Web de acuerdo a los datos recogidos de los
   usuarios (fase 2). Todos los conceptos accedidos por los usuarios son almacenados en un vector
   y los objetos relacionados a los conceptos se identifican mediante el algoritmo de k-vecinos. De
   los conceptos se extraen palabras clave que ayudarán a describir las páginas Web y poder
   encontrar la relación de los objetos con los conceptos. Se crean categorías a través de la
   relación objeto – concepto para generar una ontología de usuario.


                                                                                    16 | P á g i n a
«ESTADO DEL ARTE


3.5 PERSONALIZACIÓN       DE NAVEGACIÓN WEB CON PERFILES PERSONALES ENRIQUECIDOS
    SEMÁNTICAMENTE

El método propuesto en [Ankolekar 2005] se basa en la ampliación del método HTTP GET para
incluir un nuevo parámetro que apunta a la URL de un archivo del usuario denominado FOAF
(Friend of a Friend) [Miller 00] el cual tiene información que describe a una persona en términos
de varios atributos, tales como páginas Web, afiliaciones, fotografías y datos de contacto, así como
especificaciones de los conocidos y amigos del usuario, está extensión permite que el servidor
Web pueda utilizar la información de la persona contenida en el archivo FOAF para personalizar las
páginas web. Como caso de estudio lo implementaron en un portal de un centro de investigación
con el fin de recomendar enlaces de los investigadores que el usuario tenía relación.

El servidor web con la nueva cabecera es capaz de acceder a los archivos FOAF del usuario, busca
personas que el usuario conoce. En la página principal del portal el usuario cuenta con enlaces
directos a esas personas. A partir de ahí, se puede explorar la lista de la publicación, los datos
actuales de contacto, los cursos, los proyectos que la persona trabaja, y así sucesivamente.



3.6 RECUPERACIÓN        DEL    CONTENIDO      DEL   CONTEXTO      PERSONALIZADO        UTILIZANDO
    CONTENIDO ONTOLÓGICO

El método propuesto en [Vallet 2007] se basa en una ontología de representación del dominio del
discurso, asignando diferentes pesos de acuerdo a los intereses del usuario que haya registrado y
a la navegación que ha tenido de tal manera que se le muestre una página con los enlaces que más
le hayan interesado.

        Las preferencias de los usuarios se abordan de manera implícita y explicita a lo largo de la
        historia de sus acciones.
        Ponderan semánticamente metadatos que describen los contenidos del discurso en
        términos de una ontología del dominio.
        Utilizan una técnica de vectores para establecer los pesos por concepto de la ontología del
        dominio indicando su relación con las preferencias de los usuarios.
        Los usuarios se representan con vectores haciendo una correspondencia de acuerdo a la
        intensidad de sus intereses por cada concepto de la ontología de dominio, creando reglas
        de asociación y transitividad.

Una vez que se obtuvieron los contenidos que tuvieron mayor preferencia se filtran y se clasifican
de manera personalizada.




                                                                                    17 | P á g i n a
«ESTADO DEL ARTE


3.7 RAZONAMIENTO          SEMÁNTICO:       UNA     RUTA     DE    NUEVAS      POSIBILIDADES      DE
    PERSONALIZACIÓN

El método propuesto en [Blanco 2008] se basa en asociaciones semánticas para la recomendación
de programas de televisión que se presentan a los espectadores de la televisión digital interactiva
(IDTV). El método descubre relaciones semánticas entre las preferencias del usuario con los
programas de televisión representados en una ontología de dominio. Para su implementación
consideraron dos modelos:

        1. Modelo del dominio: este modelo realiza la descripción semántica de los programas de
        televisión que se pueden sugerir a los usuarios, este modelo representa la ontología del
        domino de los programas de televisión.
        2. Modelo de usuario: este modelo representan los atributos necesarios para definir las
        preferencias de los usuarios de acuerdo a los programas de televisión.

La estrategia basada en el razonamiento que proponen cuenta con dos fases, con las cuales se
realiza la inferencia para poder sugerir los programas de televisión de acuerdo a las preferencias
del usuario.

        1. Fase de Filtrado: está fase selecciona de la ontología del dominio las instancias de
        clases y propiedades que son relevantes para el usuario, es decir, aquellas que cumplan
        con los atributos que tienen relación con los programas de televisión considerando las
        preferencias personales.

        2. Fase de Recomendación: esta fase detecta los conceptos que están estrechamente
        relacionados con las preferencias del usuario mediante la exploración de las entidades y
        asociaciones semántica, las cuales permiten crear relaciones entre entidades de recursos.
        Estas relaciones captan la conectividad entre las entidades y la similitud entre ellas.

La estrategia es capaz de descubrir que un programa de televisión es atractivo para el usuario, la
información es desplegada en forma de guía de canales con programación que podría ser atractiva
para el usuario.


3.8 UN ENFOQUE DE LA WEB SEMÁNTICA PARA LA PERSONALIZACIÓN DEL CONTENIDO

El método propuesto en [Wolowski 2007] se basa en un sistema de software que da
recomendaciones de compras a través de mensajes de texto a su celular a los usuarios. La
arquitectura propuesta se basa en la premisa de que hay un registro de usuarios que representa la
historia de su comportamiento (sus compras).

El método que utilizaron para inferir sobre los artículos a comprar fue un árbol de decisión, con el
cual se construyen predicciones para representar y categorizar una serie de sucesos. El árbol de
decisión representa un modelo para las preferencias de usuario. El árbol de decisión se transforma
en un perfil de preferencias, marcado en forma de metadatos RDF, y se almacena en el dispositivo
del usuario.
                                                                                    18 | P á g i n a
«ESTADO DEL ARTE


Para el proceso de personalización de contenidos, se realiza una consulta de metadatos
específicos y se crea automáticamente una plantilla genérica, utilizando las preferencias del
usuario generados a partir de un árbol de decisión. Esta consulta puede ejecutar la búsqueda de
los productos representados en forma de metadatos RDF (por ejemplo, artículos de compra) que
satisfacen las preferencias del usuario. El contenido personalizado es entregado en un mensaje
que contiene el resultado del proceso, se envía al nodo del mismo nivel, lo que representa el
dispositivo móvil de un usuario dentro de una red peer-to-peer.


3.9 MODELADO MANEJADO POR ONTOLOGÍAS PARA LA PPERSONALIZACIÓN DE CONTENIDO
    WEB

El método propuesto en [Brambilla 2008] se basa en un proceso de monitoreo iterativo de la
navegación del usuario. Se recolectan sus búsquedas, estas se almacenan como preferencias en
una ontología de perfil de usuario la cual se correlaciona con una ontología de dominio,
finalmente la información obtenida se consulta para entregar contenido personalizado.

El método propuesto evalúa el contexto de contenidos Web para incluir enlaces ad-hoc en las
páginas de navegación. El contexto de los contenidos de la página se describe con esquemas de
ontologías. El método consiste de 3 pasos:

    1. Un modelo entidad – relación que representa los metadatos que describen el contexto
       Web representado en ontologías.
    2. Un conjunto de primitivas de alto nivel para la gestión de hipertexto.
    3. Un mecanismo de personalización para la gestión de contenidos Web, el cual clasifica Las
       preferencias del usuario asignando un peso a las diferentes contribuciones de las
       preferencias explícitas e implícitas que el usuario provee. Este mecanismo consta de
       cuatro partes:
           a. Un modelo conceptual para representar el perfil de usuario, en término de
               ontologías.
           b. Un modelo conceptual para el registro de preferencias de los usuarios.
           c. Un modelo conceptual para almacenar el comportamiento implícito del usuario.
           d. Un modelo conceptual para la publicación de metadatos de contenido
               personalizado basado en el hipertexto de las páginas, de acuerdo a la información
               recogida de los modelos anteriores.


3.10 COMPARATIVA

En esta sección se describe una comparativa con los puntos de interés interrelacionados con los
trabajos del estado del arte y el trabajo de investigación. La comparativa se detalla en la Tabla 3-1,
los criterios de comparación son:




                                                                                      19 | P á g i n a
«ESTADO DEL ARTE


Modelo de usuario: este punto de interés especifica a qué nivel maneja el modelo de
usuario, es decir, si el modelo es una ontología, si está basado en un modelo conceptual, o
está registrado en una Base de Datos.

En los trabajos de [Tziviskou 2007], [Trajkova 2004], [Blanco 2008], [Wolowski 2007] y
[Brambilla 2008] utilizan una ontología para representar los intereses y /o preferencias del
usuario al igual que la tesis, sin embargo la ontología creada en los trabajos de
investigación se desarrolló de acuerdo al historial de navegación del usuario, por lo cual
hay una relación más estrecha con los contenidos del sitio y/o portal Web al que accedió
el usuario. La tesis maneja una ontología de usuario general, que al no estar relacionada al
sitio Web, tiene atributos que perfilan al usuario en diferentes contextos. Una ventaja de
esta ontología es que no se requiere conocer lo que el usuario ha visitado, para ofrecerle
las recomendaciones. La diferencia con esta tesis con el resto de los trabajos es que hacen
recomendaciones de acuerdo a las personas con las que tiene alguna relación el usuario, a
excepción de [Ankolekar 2005] que hace uso del archivo FOAF el cual contiene
información general de un usuario.

Modelo de sitio: este punto de interés especifica a qué nivel maneja el modelo del sitio, es
decir, si el modelo cuenta con un esquema semántico (ontología del dominio), modelo
conceptual, o una simple taxonomía.

En los trabajos de [Tziviskou 2007], [Vallet 2007], [Blanco 2008], [Wolowski 2007] y
[Brambilla 2008] manejan una ontología que representa los contenidos del sitio y /o portal
Web debido a su factibilidad para extraer el contenido y la utilización de la URI que
representa cada contenido, en esta tesis desarrolló una ontología que representa los
contenidos del sitio Web de gobierno estatal con el fin de tener una mayor interacción
entre los conceptos y los intereses del usuario además de que esta tesis inmersa en la
Web Semántica. En otros trabajos como [Magdalini 2005], [Trajkova 2004], [Ankolekar
2005] únicamente consideran la representación de los contenidos a nivel de taxonomía de
acuerdo al historial de navegación del usuario.

Método de relación: este punto de interés especifica la técnica de personalización
utilizada.

En [Tziviskou 2007], [Magdalini 2005] y [Ankolekar 2005] la técnica aplicada son reglas de
asociación que descubren acciones predecibles del usuario para lo cual necesitan un
historial de su navegación. En los trabajos [Trajkova 2004], [Vallet 2007], [Brambilla 2008]
utilizan vectores por peso, ponderan en la escala de 0-1 aquellos contenidos en donde el
usuario estuvo más interesado, representándolos en un vector, asocian la ponderación
con los contenidos de interés. En [Blanco 2008] utilizan asociaciones semánticas para
descubrir relaciones ocultas entre los contenidos de interés del usuario, es decir, buscan
información que tenga relación con los contenidos que en principio, el usuario consideró;
de esta forma se selecciona y presentan los contenidos de interés para el usuario y otros
que podrían interesarle. En [Wolowski 2007] utilizan un árbol de decisión, el cual se basa
en datos de entrenamiento que previamente se cargan, con estos datos se identifica la
información que puede ser de interés al usuario. Con respecto a la tesis se utilizó una
máquina de inferencia definiendo reglas semánticas en lenguaje SWRL (Semantic Web
                                                                             20 | P á g i n a
«ESTADO DEL ARTE


         Rule Lenguaje), para explotar el modelo de recomendación se implementaron dos
         ontologías, una de usuario y otra del contenido de un sitio Web de gobierno estatal, las
         máquinas de inferencia permiten relacionar conceptos entre ontologías, lo cual no realizan
         los trabajos relacionados que sólo manejan una ontología de usuario o de contenido, por
         lo que requieren del historial de navegación de usuario para conocer qué contenidos le
         interesan y partir de esto generar las asociaciones entre sus intereses y los contenidos, en
         esta tesis se necesita conocer atributos de interés que el usuario reflejó en la ontología de
         usuario y buscar los contenidos que se relacionen con esos atributos, por lo que no se
         requiere historial de navegación para mostrarle lo que más haya visitado.

         Personalización: este punto de interés define el nivel de personalización y la manera en
         cómo se muestra el contenido personalizado al usuario.

         En [Tziviskou 2007] y [Brambilla 2008] insertan enlaces directos a los contenidos de interés
         del usuario. En [Magdalini 2005] muestra los documentos (.html, .doc, .pdf, etc.) que para
         el usuario fueron de mayor interés de acuerdo a su historial. En [Trajkova 2004],
         [Ankolekar 2005] y [Vallet 2007] muestran una página en la cual se muestran los
         contenidos que más visitó el usuario. En [Blanco 2008] se muestra una guía de los
         contenidos que le interesaría al usuario a través de un mensaje en la pantalla de su
         televisor y en [Wolowski 2007] envía mensajes al teléfono celular del usuario para
         mostrarle los contenidos de su interés. En esta tesis se muestra una página con diferentes
         enlaces clasificándolos por categorías para su mejor distribución. Hasta el momento en la
         literatura analizada no se ha encontrado algún trabajo que extraiga la estructura del sitio
         para mostrar una página personalizada con el diseño del sitio mostrando únicamente los
         contenidos que podrían ser de interés para el usuario.

                        Tabla 3-1: Cuadro comparativo de trabajos relacionados

                         Modelo de                               Método de
        Nombre                           Modelo del sitio                           Personalización
                          usuario                                  relación
[Tziviskou 2007]         ontología          ontología          Reglas por pesos         Enlaces
                                                                  Reglas de
[Magdalini 2005]             BD             taxonomía                                 Documentos
                                                                  asociación
                                                                Vectores por
[Trajkova 2004]           ontología             Si                                      Páginas
                                                                     pesos
                                                                  Reglas de
[Ankolekar 2005]          ontología         categorías                                   Página
                                                                  asociación
                                                                Vectores por
[Vallet 2007]                 si            ontología                                    Página
                                                                     pesos
                                                                Asociaciones
[Blanco 2008]             ontología         ontología                                  Mensajes
                                                                 Semánticas
[Wolowski 2007]           ontología         ontología         Árbol de decisión        Mensajes
                                                                Vectores por
[Brambilla 2008]          ontología         ontología                                   Enlaces
                                                                     pesos
                                                              Reglas semánticas       Categorías /
Tesis                     ontología         ontología
                                                                    (SWRL)              Enlaces
                                                                                      21 | P á g i n a
«ESTADO DEL ARTE


Como conclusión se han clasificado los sistemas de personalización de contenidos Web definidos
en el estado del arte, de acuerdo a los mecanismos de personalización tales mecanismos incluyen:

       La representación de perfiles de usuario.
       Los métodos empleados pata lograr la recomendación de contenidos a medida de las
       preferencias de los usuario.
       Los mecanismos de personalización para la recomendación de contenidos Web.

En los siguientes capítulos abordamos la descripción del método para la personalización de
contenidos web, la implementación de la herramienta en el contexto de e-gobierno, pruebas y
conclusiones.




                                                                                 22 | P á g i n a
Capítulo 4 :
METODOLOGÍA PARA LA
 PERSONALIZACIÓN DE
    CONTENIDOS WEB




                 23 | P á g i n a
«METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB


En este capítulo se presenta la metodología para la personalización de contenidos Web para la
realización de un sistema de recomendación de contenidos de e-gobierno con el propósito de
promover un uso generalizado de las capacidades de personalización. Dado que nuestra
metodología aplica un proceso de razonamiento semántico sobre las preferencias de los usuarios y
los contenidos de e-gobierno son tres características fundamentales sobre los que asienta sus
bases:

        la ontología que formaliza el conocimiento sobre el dominio de e-gobierno
        los perfiles que registran las preferencias de los usuarios.
        la estrategia de recomendación basándose en el razonamiento semántico con la utilización
        de reglas de inferencia (SWRL).

4.1 INTRODUCCIÓN

La metodología para la personalización de contenidos Web se conforma de cuatro fases que se
fundamentan en las características anteriormente mencionadas con el fin de llevar a cabo la
personalización de contenidos Web a través de reglas de inferencia que permitan asociar los
contenidos de una ontología del dominio con las preferencias relevantes de un usuario. En
primera instancia se consideró el desarrollo de una ontología de dominio debido a que los portales
de gobierno actuales no tienen ontologías que describan sus contenidos, lo cual limitaba la
estrategia de recomendación basada en reglas de inferencia la cual necesita de ontologías para
realizar el razonamiento semántico. Nuestra metodología considera como primer fase el
desarrollo de ontología de gobierno, como segunda fase la selección de atributos de ontología de
usuario desarrollada por [Rojas 2009] con el fin de filtrar aquellos atributos que sirvan para perfilar
a un usuario en el dominio de e-gobierno, como tercer fase la construcción de un catalogo de
reglas de inferencia que se encargan del razonamiento semántico al asociar los contenidos de e-
gobierno con el perfil de usuario y como última fase el desarrollo del sistema de personalización
de contenidos Web, la metodología para la personalización de contenidos Web se puede observar
en la Figura 4-1. Cabe mencionar que en esta sección se describe el proceso que conforma un
prototipo para la personalización de contenidos Web, los detalles relativos al prototipo de
software se presentan en el capítulo 5.




                  Figura 4-1: Metodología para la personalización de contenidos Web.




                                                                                       24 | P á g i n a
«METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB


4.2 FASE 1: DESARROLLO DE ONTOLOGÍA DE E-GOBIERNO

Esta fase consiste en la generación de una ontología de gobierno que represente los contenidos de
los portales gubernamentales mexicanos por el motivo que la estrategia de recomendación de
contenidos Web se realiza a través de reglas de inferencia que permiten asociar los contenidos de
una ontología de dominio con las preferencias del usuario, es decir, las reglas de inferencia
seleccionan información de ontologías y no de texto plano. La motivación principal para el
desarrollo de ontología de e-gobierno se debió a que los portales de gobierno actuales no tienen
ontologías que describan sus contenidos, lo cual limitaba la estrategia de recomendación basada
en reglas de inferencia la cual necesita de ontologías para realizar el razonamiento semántico.
Para el desarrollo de esta fase se consideraron tres procesos: 1) Selección de portales
gubernamentales, dedicado a obtener una muestra de los portales más representativos con
respecto a la manera que presenta la información hacia el usuario, 2) Evaluación de portales
gubernamentales, dedicado a la evaluación de los portales gubernamentales de acuerdo a la
selección del proceso uno con el fin de identificar aquellos portales gubernamentales que cuenten
con las características del buen diseño de portales gubernamentales en cuanto estructura y
organización, 3) Creación de ontología de e-gobierno, dedicado a la generación de la ontología de
e-gobierno partiendo de la iniciativa de los portales gubernamentales seleccionados y evaluados
no tienen ontología que representen sus contenidos tomando en cuenta la metodología para la
creación de ontologías por [F. Noy 2005]. Los procesos involucrados en la fase 1 se esquematizan
en la Figura 4-2.




                       Figura 4-2: Fase 1-Desarrollo de ontología de e-gobierno.

4.2.1 PROCESO 1: SELECCIÓN DE PORTALES GUBERNAMENTALES

Este proceso consiste en la selección de portales gubernamentales que presenten su información
en la Web de manera que el usuario pueda encontrarla fácilmente con el fin de adquirir una
muestra de los portales gubernamentales más representativos de la información y sirvan de base
para la generación de la ontología de e-gobierno. Para tal propósito se consideró el índice de
Gobierno Electrónico Estatal (IGEE 2009) de los portales gubernamentales de los 31 estados y un
Distrito Federal que se presento en el ranking de [Política Digital 2009]. La medición del IGEEE
2009 toman en cuenta las característica de: información, interacción, integración y participación
con tales características permiten ofrecer una aproximación integral sobre la utilidad que ofrece el
portal gubernamental a los ciudadanos, la evaluación dio un total de 16 mil 992 datos para la
consolidación del IGEE 2009, en la Tabla 4-1 se detalla cada una de las características para el
ranking con sus atributos y descripción correspondiente.

                                                                                    25 | P á g i n a
«METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB


                Tabla 4-1: Características evaluadas por ranking de [Política Digital 2009]

CARACTERISTICA:                                1. Información
         ATRIBUTO                                               DESCRIPCIÓN
  Información completa y           El portal debe contar con información completa y detallada
  detallada:                       sobre fuentes de información, estadísticas, etc., que exista en la
                                   página de inicio varios bloques de información relacionados por
                                   ejemplo con noticias, trámites o eventos.
  Información Multimedia:          Integración de soporte o de procedimientos que emplean
                                   sonidos, imágenes o textos para difundir información,
                                   especialmente de forma interactiva.
  Organización de la               Forma en que se encuentra la información dentro del sitio Web.
  Información:
  Accesibilidad de la              Fácil acceso a la información dentro del portal.
  Información:
  Transparencia:                   Acceso público a una información completa, exacta y clara
                                   acerca del gobierno.
CARACTERISTICA:                               2. Interacción
         ATRIBUTO                                               DESCRIPCIÓN
   Contacto con Webmaster          El portal debe contar con información completa y detallada
   y atención ciudadana:           sobre fuentes de información, estadísticas, etc., que exista en la
                                   página de inicio varios bloques de información relacionados por
                                   ejemplo con noticias, trámites o eventos.
   Obtención de formatos en        Obtención de formatos que se puedan bajar y guardar en
   línea:                          nuestro equipo para realizar algún trámite o llenarlo en línea.
   Búsquedas de                    Realizar búsquedas dentro del portal para encontrar de manera
   Información:                    más rápida información.
   Personalización:                Adaptar el portal conforme a preferencias o gustos.
   Información dinámica:           Evaluar la interactividad dentro del portal de gobierno.
   Obtención de formatos en        Obtención de formatos que se puedan bajar y guardar en
   línea:                          nuestro equipo para realizar algún trámite o llenarlo en línea.
CARACTERISTICA:                                3. Transacción
         ATRIBUTO                                               DESCRIPCIÓN
   Pagos en línea:                 Evaluar si dentro del portal se pueden realizar transacciones en
                                   línea.
   Seguridad:                      Evaluar la seguridad con la que cuenta el portal de gobierno para
                                   llevar a cabo transacciones en línea.
CARACTERISTICA:                               4. Integración
         ATRIBUTO                                               DESCRIPCIÓN
   Integración vertical:           Existe información de otros gobiernos tanto federal como
                                   municipal.
   Integración horizontal:         Evaluar si el portal da información completa sobre el gobierno
                                   estatal.
   Integración transaccional       Realizar transacciones en línea de otras dependencias
   o carrito de compras:           gubernamentales y niveles de gobierno.

                                                                                              26 | P á g i n a
«METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB


CARACTERISTICA:                               5. Participación
         ATRIBUTO                                               DESCRIPCIÓN
   Debates en línea de            Se llevan a cabo discusiones o debates con funcionarios.
   asuntos públicos:
   Voto electrónico:              Se lleva a cabo algún tipo de votación electrónica.
CARACTERISTICA:                               6. Diseño y Estilo
DESCRIPCIÓN:                      Evaluar el diseño y estilo que cuenta el portal gubernamental.


En la Figura 4-3 se muestra el producto final de la evaluación de los portales gubernamentales,
destacando las puntuaciones de cada característica evaluada: información, interacción,
transacción, integración y el número de posición correspondiente a cada estado.




              Figura 4-3: Índice de gobierno electrónico estatal 2009 [Política digital 09].


                                                                                           27 | P á g i n a
«METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB


4.2.2 PROCESO 2: EVALUACIÓN DE PORTALES GUBERNAMENTALES

Este proceso consiste en la evaluación de portales gubernamentales con las características del
buen diseño de portales gubernamentales. Tales características se tomaron en cuenta para
evaluar los portales gubernamentales para obtener aquellos que presenten su información de
acuerdo a las características consideradas para el buen diseño de portales gubernamentales con el
fin de generar una ontología de e-gobierno con la información que muestran los sitios Web
gubernamentales pero solo con aquellos que presenten un buen nivel en estructura, organización
y facilidad de acceso a la información de interés de los usuarios.

El diseño de un portal gubernamental debe tomar en cuenta la experiencia que vivirá el usuario
por sus páginas y lograr que encuentre lo que está buscando de manera simple [Aceves 2008]. Por
lo que se considera ciertas características como: Diseño y estructura, arquitectura, tramites y
servicios, accesibilidad, participación ciudadana y transparencia que determinan si un portal
gubernamental tiene una buena estructura y organización en su contenido y diseño.

En la Tabla 4-2 se describen las características: diseño y estructura, arquitectura, trámites y
servicios, accesibilidad, participación ciudadana y transparencia para el desarrollo de portales
gubernamentales centrados en el usuario y en estándares de certificación, cada una con su
correspondiente descripción.

              Tabla 4-2: Características para el desarrollo de portales gubernamentales.

     CARACTERÍSTICA                                         DESCRIPCIÓN
   1. Diseño y estructura        Se refiere a los conceptos para determinar la composición visual
                                 de un sitio (look and feel).

                                         Diseño visual: identidad del portal
                                         Estructura: la forma en que será presentada la
                                         información.
                                         Multimedia: nos permite tener un portal dinámico
                                         (animación, audio y video).
                                         Imágenes      con     intención:    utilizar    imágenes
                                         representativas y contar con un texto descriptivo.
                                         Estándares de estructura: XHTML, XML.
                                         Estándares de presentación: diseño con hojas de estilo
                                         CSS.
   2. Arquitectura               De acuerdo a [Rosenfeld 00], la arquitectura de la información
                                 para la Web se compone de cuatro componentes.

                                     a) Sistema de organización:
                                        Se refiere a las formas en que la información y
                                        contenidos de un sitio se catalogan.
                                     b) Sistema de navegación:
                                        Son los esquemas mediante los cuales el usuario se
                                        moverá a través del sitio.
                                                                                       28 | P á g i n a
«METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB


                              c) Sistema de rotulado (labeling):
                                  Se refiere a la manera en que se representará la
                                  información de un sitio de forma que el usuario
                                  comprenda la terminología.
                              d) Sistema de búsqueda:
                                  Es la forma en que los usuarios tratarán de localizar la
                                  información en el sitio.
3. Trámites y servicios   Una de las formas en que el ciudadano percibe la transformación
                          de un gobierno a e-gobierno está en la posibilidad de realizar
                          trámites y servicios en línea.
                          Se deben de cuidar los siguientes aspectos:
                                  Facilidad para encontrar y acceder al trámite o servicio.
                                  Estado del proceso del trámite.
                                  Diseño de formularios.
                                  Esquemas de seguridad.
                                  Flexibilidad y eficiencia en el uso.

4. Accesibilidad          La accesibilidad Web significa que personas con algún tipo de
                          discapacidad pueden hacer uso de la Web, es decir, al hablar de
                          accesibilidad Web se hace referencia a un diseño que va a
                          permitir que estas personas puedan percibir, entender, navegar
                          e interactuar con la Web, independientemente de sus limitantes
                          físicas o técnicas.
5. Participación          En cualquier gobierno democrático, la participación ciudadana
   Ciudadana              debe representar uno de los principales objetivos a fomentar.

                                  Para lograr la participación ciudadana se debe:
                                      o Promover y fomentar la participación a través de
                                          la publicación de información dirigida a
                                          diferentes sectores de la sociedad (e-
                                          Information).
                                      o Facilitar consultas vía electrónica donde los
                                          ciudadanos pueden enterarse de las acciones de
                                          sus autoridades, así como deliberar opiniones
                                          sobre éstas (e-Consultation).
                                      o Realizar peticiones para convertirse en parte
                                          proactiva en las decisiones, o en su caso recibir
                                          una respuesta directa sobre algún asunto
                                          específico (e-Decisión making).
6. Transparencia          La transparencia de la información es una consecuencia de la
                          participación ciudadana. La transparencia de la información
                          comprende:
                              a) La publicación de información relevante para la sociedad
                                  relacionada con el hacer y qué hacer de una entidad
                                  pública, alineándose generalmente a una ley o
                                  regulación de acceso a la información.
                                                                            29 | P á g i n a
«METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB


                                      b) La fácil localización (findability) de datos relacionados
                                         con la labor de una dependencia gubernamental por
                                         parte de cualquier usuario. Si se requiere información
                                         adicional deberá ser solicitada en línea.
                                      c) La presentación de información en un lenguaje claro, de
                                         manera que cualquier ciudadano pueda comprender el
                                         significado de los contenidos, independientemente de su
                                         experiencia en el uso de herramientas tecnológicas.

De acuerdo en la evaluación de portales gubernamentales en [Política digital 09] se tomaron los
primeros ocho portales de gobierno estatales: Nuevo León, Sinaloa, Puebla, Estado de México,
Distrito Federal, Yucatán, Veracruz y Guerrero, estos se reevaluaron tomando en cuenta las
características del diseño de portales gubernamentales: Diseño y estructura, arquitectura,
tramites y servicios, accesibilidad, participación ciudadana y transparencia. Se consideró una
ponderación de 0 a 1 tomando en cuenta sí cumplían con todas o algunos de los atributos de
evaluación. En la Tabla 4-3 se muestra los resultados obtenidos para cada portal gubernamental
estatal.

Tabla 4-3: Evaluación de portales gubernamentales de acuerdo a las características de diseño de portales
                                          gubernamentales.




                                                                                         Distrito Federal
                                             Nuevo León




                                                                             Estado de




                                                                                                                                    Guerrero
                                                                                                                         Veracruz
                                                                                                            Yucatán
                                                                              México
                                                          Sinaloa

                                                                    Puebla




 Diseño y estructura
        Diseño visual                            1           1         1       1                  1            1            1          1
        Estructura                               1           1         1       1                  1            1            1          1
        Sistema visual                           1           1         1       1                  1            1            1          1
        Iconografía                              1           1         1      .5                 .8            0            1          1
        Multimedia                              .5          .5        .5      .8                 .8           .5            1         .5
        Imágenes con intención                   1           1         1       1                  1            1            1          1
        Estándares de estructura                 1          .5         1       1                  1            1            1          1
        Estándares de presentación               1           1         1       0                  1            1            0          1
 Arquitectura
        Sistema de organización                  1          .8        .8       1                  1           .8           .8          1
        Sistemas de navegación                   1           1         1       1                  1            1            1          1
        Sistema de rotulado                      1           1         1       1                  1            1            1          1
        Sistema de búsqueda                     .8          .8        .5      .8                 .5           .5           .3         .5

 Trámites y servicios                            1           1        .5       1                 .8            1           .8          1


                                                                                                                      30 | P á g i n a
«METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB


 Accesibilidad
         Nivel A (1 punto)                 1      0      0      0       0      0         0      0
         Nivel AA (2 puntos)
         Nivel AAA (3 puntos)
 Participación ciudadana
         Civismo                           0      0      1      1       1      0         1      0
         Audiencias publicas               1      1      1      1       1      1         1      1
         Consulta de opiniones             1      1      0      0       1      1         0      1
         Interacción sincrónica            1      0      1      1       1      1         0      1

 Transparencia                             1      1      1      1      1       1        1        1
 Puntuación                               17.3   14.6   15.3   15.1   16.9    14.8     13.9     16



4.2.3 PROCESO 3: CREACIÓN DE ONTOLOGÍA DE GOBIERNO

Este proceso consiste la creación de una ontología de e-gobierno tomando en cuenta una
metodología para la creación de ontologías con la iniciativa de que no se encontró una ontología
en los portales gubernamentales que se tomaron de la actividad de selección de portales
gubernamentales. Con la falta de la ontología se consideró buscar alguna herramienta disponible
en la Web para la generación de ontologías, en el anexo A1 se muestran las herramientas
utilizadas y el resultado que arrojaron, se usaron tres herramientas Ontogen, TouchGrahp y Web
Data Extracto. Sin embargo el resultado propuesto por las herramientas no fue satisfactorio, ya
que no generaban una ontología, extraían palabras clave o enlaces de ligas externas, hasta el
momento no se encuentran herramientas que generan automáticamente una ontología, necesitan
de la intervención de un experto o algún usuario que tenga conocimiento en el área, para generar
la base de la ontología. Con esta perspectiva se consideró generar una ontología de dominio para
pruebas de la investigación, debido a que el objetivo de la tesis no es construir una ontología de
dominio, pero sí utilizar alguna.

La ontología cubrirá el dominio de e-gobierno con el fin de realizar recomendaciones a usuarios
sobre información de portales gubernamentales, para lo cual fue necesario observar cada portal
gubernamental para extraer la guía de contenido que abordan y las categorías que existen en cada
contenido para realizar una clasificación, ordenación y búsqueda de relaciones entre los conceptos
identificados, para lo cual se utilizo una metodología para la creación de ontologías que se
describe en el siguiente punto.




                                                                                     31 | P á g i n a
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías
Personalización de contenidos Web del dominio de egobierno mediante ontologías

Más contenido relacionado

Similar a Personalización de contenidos Web del dominio de egobierno mediante ontologías

Sistema de Recomendación Contextual Basado en Ontologías para Ambientes Organ...
Sistema de Recomendación Contextual Basado en Ontologías para Ambientes Organ...Sistema de Recomendación Contextual Basado en Ontologías para Ambientes Organ...
Sistema de Recomendación Contextual Basado en Ontologías para Ambientes Organ...Gabriel Gonzalez Serna
 
Generador semiautomático de perfiles de usuario mediante OWL
Generador semiautomático de perfiles de usuario mediante OWLGenerador semiautomático de perfiles de usuario mediante OWL
Generador semiautomático de perfiles de usuario mediante OWLGabriel Gonzalez Serna
 
Servicios de localización conscientes del contexto aplicando perfiles de movi...
Servicios de localización conscientes del contexto aplicando perfiles de movi...Servicios de localización conscientes del contexto aplicando perfiles de movi...
Servicios de localización conscientes del contexto aplicando perfiles de movi...Gabriel Gonzalez Serna
 
API SMS para el Procesamiento de Consultas Georeferenciadas / No Georeferenci...
API SMS para el Procesamiento de Consultas Georeferenciadas / No Georeferenci...API SMS para el Procesamiento de Consultas Georeferenciadas / No Georeferenci...
API SMS para el Procesamiento de Consultas Georeferenciadas / No Georeferenci...Gabriel Gonzalez Serna
 
Poblado Semiautomático de Ontologías Organizacionales a Partir de Análisis de...
Poblado Semiautomático de Ontologías Organizacionales a Partir de Análisis de...Poblado Semiautomático de Ontologías Organizacionales a Partir de Análisis de...
Poblado Semiautomático de Ontologías Organizacionales a Partir de Análisis de...Gabriel Gonzalez Serna
 
Heuristic Evaluations
Heuristic EvaluationsHeuristic Evaluations
Heuristic Evaluationslorena_moreno
 
Heuristic evaluations
Heuristic evaluationsHeuristic evaluations
Heuristic evaluationslorena_moreno
 
Protocolo de Archivo clinico
Protocolo de Archivo clinicoProtocolo de Archivo clinico
Protocolo de Archivo clinicoMiguel de la Cruz
 
Proyecto SocoTecnologico I
Proyecto SocoTecnologico IProyecto SocoTecnologico I
Proyecto SocoTecnologico IIri Rivas
 
PhD thesis contents and Acknowledgements
PhD thesis contents and AcknowledgementsPhD thesis contents and Acknowledgements
PhD thesis contents and AcknowledgementsBP Gurus
 
EFECTOS DEL ESFUERZO INNOVADOR Y DE LAS OPORTUNIDADES TECNOLÓGICAS EN LA IND...
EFECTOS DEL ESFUERZO INNOVADOR Y DE LAS OPORTUNIDADES TECNOLÓGICAS EN LA IND...EFECTOS DEL ESFUERZO INNOVADOR Y DE LAS OPORTUNIDADES TECNOLÓGICAS EN LA IND...
EFECTOS DEL ESFUERZO INNOVADOR Y DE LAS OPORTUNIDADES TECNOLÓGICAS EN LA IND...Carlos Romero Valiente
 
cuaderno digital Cristian.riascos.11.2
cuaderno digital Cristian.riascos.11.2cuaderno digital Cristian.riascos.11.2
cuaderno digital Cristian.riascos.11.2180598riascos
 
Nuevo informe ultimo sobre la tecnologia
Nuevo informe ultimo sobre la tecnologiaNuevo informe ultimo sobre la tecnologia
Nuevo informe ultimo sobre la tecnologiamauriciosandovalmorales
 
TECNOLOGÍA Y FAMILIA
TECNOLOGÍA Y FAMILIATECNOLOGÍA Y FAMILIA
TECNOLOGÍA Y FAMILIAlidma gamboa
 

Similar a Personalización de contenidos Web del dominio de egobierno mediante ontologías (20)

Sistema de Recomendación Contextual Basado en Ontologías para Ambientes Organ...
Sistema de Recomendación Contextual Basado en Ontologías para Ambientes Organ...Sistema de Recomendación Contextual Basado en Ontologías para Ambientes Organ...
Sistema de Recomendación Contextual Basado en Ontologías para Ambientes Organ...
 
Generador semiautomático de perfiles de usuario mediante OWL
Generador semiautomático de perfiles de usuario mediante OWLGenerador semiautomático de perfiles de usuario mediante OWL
Generador semiautomático de perfiles de usuario mediante OWL
 
Servicios de localización conscientes del contexto aplicando perfiles de movi...
Servicios de localización conscientes del contexto aplicando perfiles de movi...Servicios de localización conscientes del contexto aplicando perfiles de movi...
Servicios de localización conscientes del contexto aplicando perfiles de movi...
 
API SMS para el Procesamiento de Consultas Georeferenciadas / No Georeferenci...
API SMS para el Procesamiento de Consultas Georeferenciadas / No Georeferenci...API SMS para el Procesamiento de Consultas Georeferenciadas / No Georeferenci...
API SMS para el Procesamiento de Consultas Georeferenciadas / No Georeferenci...
 
Poblado Semiautomático de Ontologías Organizacionales a Partir de Análisis de...
Poblado Semiautomático de Ontologías Organizacionales a Partir de Análisis de...Poblado Semiautomático de Ontologías Organizacionales a Partir de Análisis de...
Poblado Semiautomático de Ontologías Organizacionales a Partir de Análisis de...
 
Cripto de redes
Cripto de redesCripto de redes
Cripto de redes
 
Trabajo red mod
Trabajo red modTrabajo red mod
Trabajo red mod
 
Heuristic Evaluations
Heuristic EvaluationsHeuristic Evaluations
Heuristic Evaluations
 
Heuristic evaluations
Heuristic evaluationsHeuristic evaluations
Heuristic evaluations
 
Protocolo de Archivo clinico
Protocolo de Archivo clinicoProtocolo de Archivo clinico
Protocolo de Archivo clinico
 
Proyecto SocoTecnologico I
Proyecto SocoTecnologico IProyecto SocoTecnologico I
Proyecto SocoTecnologico I
 
PhD thesis contents and Acknowledgements
PhD thesis contents and AcknowledgementsPhD thesis contents and Acknowledgements
PhD thesis contents and Acknowledgements
 
Nativo digital
Nativo digitalNativo digital
Nativo digital
 
Nativo digital
Nativo digitalNativo digital
Nativo digital
 
EFECTOS DEL ESFUERZO INNOVADOR Y DE LAS OPORTUNIDADES TECNOLÓGICAS EN LA IND...
EFECTOS DEL ESFUERZO INNOVADOR Y DE LAS OPORTUNIDADES TECNOLÓGICAS EN LA IND...EFECTOS DEL ESFUERZO INNOVADOR Y DE LAS OPORTUNIDADES TECNOLÓGICAS EN LA IND...
EFECTOS DEL ESFUERZO INNOVADOR Y DE LAS OPORTUNIDADES TECNOLÓGICAS EN LA IND...
 
cuaderno digital Cristian.riascos.11.2
cuaderno digital Cristian.riascos.11.2cuaderno digital Cristian.riascos.11.2
cuaderno digital Cristian.riascos.11.2
 
Introducción 1
Introducción 1 Introducción 1
Introducción 1
 
Introducción 1
Introducción 1 Introducción 1
Introducción 1
 
Nuevo informe ultimo sobre la tecnologia
Nuevo informe ultimo sobre la tecnologiaNuevo informe ultimo sobre la tecnologia
Nuevo informe ultimo sobre la tecnologia
 
TECNOLOGÍA Y FAMILIA
TECNOLOGÍA Y FAMILIATECNOLOGÍA Y FAMILIA
TECNOLOGÍA Y FAMILIA
 

Más de Gabriel Gonzalez Serna

Metodología para la Generación de Explicaciones para Sistemas de Recomendació...
Metodología para la Generación de Explicaciones para Sistemas de Recomendació...Metodología para la Generación de Explicaciones para Sistemas de Recomendació...
Metodología para la Generación de Explicaciones para Sistemas de Recomendació...Gabriel Gonzalez Serna
 
Clasificación Automática de Objetos de Conocimiento con Contenido no Estruct...
 Clasificación Automática de Objetos de Conocimiento con Contenido no Estruct... Clasificación Automática de Objetos de Conocimiento con Contenido no Estruct...
Clasificación Automática de Objetos de Conocimiento con Contenido no Estruct...Gabriel Gonzalez Serna
 
Metodología para Evaluación de SRSC Centrada en el Usuario, Basada en Caracte...
Metodología para Evaluación de SRSC Centrada en el Usuario, Basada en Caracte...Metodología para Evaluación de SRSC Centrada en el Usuario, Basada en Caracte...
Metodología para Evaluación de SRSC Centrada en el Usuario, Basada en Caracte...Gabriel Gonzalez Serna
 
Tutorial Near Field Communication (NFC)
Tutorial Near Field Communication (NFC)Tutorial Near Field Communication (NFC)
Tutorial Near Field Communication (NFC)Gabriel Gonzalez Serna
 
Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...
Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...
Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...Gabriel Gonzalez Serna
 
Tecnologías de Interacción Humano-Computadora para Sistemas de Información Co...
Tecnologías de Interacción Humano-Computadora para Sistemas de Información Co...Tecnologías de Interacción Humano-Computadora para Sistemas de Información Co...
Tecnologías de Interacción Humano-Computadora para Sistemas de Información Co...Gabriel Gonzalez Serna
 
Gateway SMS Pull para Servicios Basados en Localización con una Arquitectura ...
Gateway SMS Pull para Servicios Basados en Localización con una Arquitectura ...Gateway SMS Pull para Servicios Basados en Localización con una Arquitectura ...
Gateway SMS Pull para Servicios Basados en Localización con una Arquitectura ...Gabriel Gonzalez Serna
 
Herramienta para la Generación de Estilos Definidos por el Usuario para su As...
Herramienta para la Generación de Estilos Definidos por el Usuario para su As...Herramienta para la Generación de Estilos Definidos por el Usuario para su As...
Herramienta para la Generación de Estilos Definidos por el Usuario para su As...Gabriel Gonzalez Serna
 
Generador de mapas croquis en formato SVG-Tiny para dispositivos móviles apli...
Generador de mapas croquis en formato SVG-Tiny para dispositivos móviles apli...Generador de mapas croquis en formato SVG-Tiny para dispositivos móviles apli...
Generador de mapas croquis en formato SVG-Tiny para dispositivos móviles apli...Gabriel Gonzalez Serna
 
Búsquedas contextuales de Servicios Basados en Localización en un entorno de ...
Búsquedas contextuales de Servicios Basados en Localización en un entorno de ...Búsquedas contextuales de Servicios Basados en Localización en un entorno de ...
Búsquedas contextuales de Servicios Basados en Localización en un entorno de ...Gabriel Gonzalez Serna
 
API para servicios de localización en interiores basada en tecnología Wi-Fi, ...
API para servicios de localización en interiores basada en tecnología Wi-Fi, ...API para servicios de localización en interiores basada en tecnología Wi-Fi, ...
API para servicios de localización en interiores basada en tecnología Wi-Fi, ...Gabriel Gonzalez Serna
 
Servicios de Recomendación Contextual para Instituciones de Educación Superio...
Servicios de Recomendación Contextual para Instituciones de Educación Superio...Servicios de Recomendación Contextual para Instituciones de Educación Superio...
Servicios de Recomendación Contextual para Instituciones de Educación Superio...Gabriel Gonzalez Serna
 
Generación y Explotación de Mapas Semánticos de Instalaciones Organizacionale...
Generación y Explotación de Mapas Semánticos de Instalaciones Organizacionale...Generación y Explotación de Mapas Semánticos de Instalaciones Organizacionale...
Generación y Explotación de Mapas Semánticos de Instalaciones Organizacionale...Gabriel Gonzalez Serna
 
Servicios de recomendación contextual para Instituciones de Educación Superio...
Servicios de recomendación contextual para Instituciones de Educación Superio...Servicios de recomendación contextual para Instituciones de Educación Superio...
Servicios de recomendación contextual para Instituciones de Educación Superio...Gabriel Gonzalez Serna
 
Mapas SVG Contextuales a partir de Ontologías organizacionales Multidimension...
Mapas SVG Contextuales a partir de Ontologías organizacionales Multidimension...Mapas SVG Contextuales a partir de Ontologías organizacionales Multidimension...
Mapas SVG Contextuales a partir de Ontologías organizacionales Multidimension...Gabriel Gonzalez Serna
 

Más de Gabriel Gonzalez Serna (20)

Metodología para la Generación de Explicaciones para Sistemas de Recomendació...
Metodología para la Generación de Explicaciones para Sistemas de Recomendació...Metodología para la Generación de Explicaciones para Sistemas de Recomendació...
Metodología para la Generación de Explicaciones para Sistemas de Recomendació...
 
Clasificación Automática de Objetos de Conocimiento con Contenido no Estruct...
 Clasificación Automática de Objetos de Conocimiento con Contenido no Estruct... Clasificación Automática de Objetos de Conocimiento con Contenido no Estruct...
Clasificación Automática de Objetos de Conocimiento con Contenido no Estruct...
 
Metodología para Evaluación de SRSC Centrada en el Usuario, Basada en Caracte...
Metodología para Evaluación de SRSC Centrada en el Usuario, Basada en Caracte...Metodología para Evaluación de SRSC Centrada en el Usuario, Basada en Caracte...
Metodología para Evaluación de SRSC Centrada en el Usuario, Basada en Caracte...
 
Tutorial Near Field Communication (NFC)
Tutorial Near Field Communication (NFC)Tutorial Near Field Communication (NFC)
Tutorial Near Field Communication (NFC)
 
Context-Aware Recommender System
Context-Aware Recommender System�Context-Aware Recommender System�
Context-Aware Recommender System
 
Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...
Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...
Cómputo Consciente del Contexto: Cognición Aumentada mediante Interfaz Cerebr...
 
Tecnologías de Interacción Humano-Computadora para Sistemas de Información Co...
Tecnologías de Interacción Humano-Computadora para Sistemas de Información Co...Tecnologías de Interacción Humano-Computadora para Sistemas de Información Co...
Tecnologías de Interacción Humano-Computadora para Sistemas de Información Co...
 
Gateway SMS Pull para Servicios Basados en Localización con una Arquitectura ...
Gateway SMS Pull para Servicios Basados en Localización con una Arquitectura ...Gateway SMS Pull para Servicios Basados en Localización con una Arquitectura ...
Gateway SMS Pull para Servicios Basados en Localización con una Arquitectura ...
 
Herramienta para la Generación de Estilos Definidos por el Usuario para su As...
Herramienta para la Generación de Estilos Definidos por el Usuario para su As...Herramienta para la Generación de Estilos Definidos por el Usuario para su As...
Herramienta para la Generación de Estilos Definidos por el Usuario para su As...
 
Generador de mapas croquis en formato SVG-Tiny para dispositivos móviles apli...
Generador de mapas croquis en formato SVG-Tiny para dispositivos móviles apli...Generador de mapas croquis en formato SVG-Tiny para dispositivos móviles apli...
Generador de mapas croquis en formato SVG-Tiny para dispositivos móviles apli...
 
Búsquedas contextuales de Servicios Basados en Localización en un entorno de ...
Búsquedas contextuales de Servicios Basados en Localización en un entorno de ...Búsquedas contextuales de Servicios Basados en Localización en un entorno de ...
Búsquedas contextuales de Servicios Basados en Localización en un entorno de ...
 
API para servicios de localización en interiores basada en tecnología Wi-Fi, ...
API para servicios de localización en interiores basada en tecnología Wi-Fi, ...API para servicios de localización en interiores basada en tecnología Wi-Fi, ...
API para servicios de localización en interiores basada en tecnología Wi-Fi, ...
 
Servicios de Recomendación Contextual para Instituciones de Educación Superio...
Servicios de Recomendación Contextual para Instituciones de Educación Superio...Servicios de Recomendación Contextual para Instituciones de Educación Superio...
Servicios de Recomendación Contextual para Instituciones de Educación Superio...
 
Generación y Explotación de Mapas Semánticos de Instalaciones Organizacionale...
Generación y Explotación de Mapas Semánticos de Instalaciones Organizacionale...Generación y Explotación de Mapas Semánticos de Instalaciones Organizacionale...
Generación y Explotación de Mapas Semánticos de Instalaciones Organizacionale...
 
Servicios de recomendación contextual para Instituciones de Educación Superio...
Servicios de recomendación contextual para Instituciones de Educación Superio...Servicios de recomendación contextual para Instituciones de Educación Superio...
Servicios de recomendación contextual para Instituciones de Educación Superio...
 
Mapas SVG Contextuales a partir de Ontologías organizacionales Multidimension...
Mapas SVG Contextuales a partir de Ontologías organizacionales Multidimension...Mapas SVG Contextuales a partir de Ontologías organizacionales Multidimension...
Mapas SVG Contextuales a partir de Ontologías organizacionales Multidimension...
 
Examen ngf2012
Examen ngf2012Examen ngf2012
Examen ngf2012
 
Hoas
HoasHoas
Hoas
 
Proyecto t guia_ies-cenidet
Proyecto t guia_ies-cenidetProyecto t guia_ies-cenidet
Proyecto t guia_ies-cenidet
 
RFID Tutorial
RFID TutorialRFID Tutorial
RFID Tutorial
 

Último

Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofJuancarlosHuertasNio1
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...JaquelineJuarez15
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 

Último (20)

Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
ejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sofejercicios pseint para aprogramacion sof
ejercicios pseint para aprogramacion sof
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
El gusano informático Morris (1988) - Julio Ardita (1995) - Citizenfour (2014...
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 

Personalización de contenidos Web del dominio de egobierno mediante ontologías

  • 1. cenidet Centro Nacional de Investigación y Desarrollo Tecnológico Departamento de Ciencias Computacionales TESIS DE MAESTRÍA EN CIENCIAS Personalización de contenidos Web del dominio de e- gobierno mediante ontologías presentada por Jenifer Torres Tapia Ing. en Sistemas Computacionales por el I. T. de Cuautla como requisito para la obtención del grado de: Maestría en Ciencias en Ciencias de la Computación Director de tesis: Dr. Juan Gabriel González Serna Co-Director de tesis: Dr. Guillermo Rodríguez Ortiz Jurado: Dr. Hugo Estrada Esquivel – Presidente Dr. Juan Gabriel González Serna – Secretario Dra. Alicia Martínez Rebollar – Vocal Cuernavaca, Morelos, México. 24 de Febrero de 2011
  • 2. DEDICATORIA A mi Hijo: Ian Galindo Torres es lo mejor que me ha pasado, ha venido a este mundo para ser mi fuente de inspiración para el término del trabajo de investigación, es sin duda mi referente para el presente y el futuro. A mi esposo: Juan Antonio Galindo García por su confianza, empeño, comprensión y amor. A mis padres: Ignacio Germán Torres Martínez y Andrea Tapia Núñez por su comprensión, paciencia y su ayuda en todos los momentos de la vida, me han dado todo lo que soy como persona, mis valores, principios y perseverancia. A mis hermanos: Ignacio Germán y Andrés Torres Tapia por su comprensión y apoyo incondicional. A mi tío: Zacarías Torres Martínez por su confianza y apoyo.
  • 3. AGRADECIMIENTOS A CONACYT por su apoyo económico otorgado para la realización de este trabajo de investigación. A DGEST por su apoyo económico para la finalización de este trabajo de investigación. Al CENIDET por brindarme la oportunidad para seguir en esta formación continua. A mi director de tesis, el Dr. Juan Gabriel González Serna por brindarme su consejo, confianza, comprensión y paciencia para terminar este trabajo de tesis. A mi codirector de tesis, el Dr. Guillermo Rodríguez Ortiz por sus comentarios. A los revisores de este trabajo de investigación, la Dra. Alicia Martínez Rebollar y el Dr. Hugo Estrada Esquivel, por su tiempo dedicado, observaciones, y comentarios para mejorar este trabajo de investigación. A mis compañeros del CENIDET: Elizabeth, Lizeth, Marino, Carlos, Cesar, Hugo y Adair por su tiempo, confianza y amistad. En especial a Cesar y Hugo porque siempre estuvieron ahí para apoyarme. A todos, mil gracias. Jenifer Torres Tapia
  • 4. RESUMEN La World Wide Web se ha convertido en un instrumento de uso cotidiano en nuestra sociedad, comparable a otros medios tan importantes como la radio, la televisión o el teléfono, su aplicación se ha extendido a diversos dominios como la educación , el gobierno y el comercio electrónico en los que actualmente se advierte una sobrecarga de información que dificulta la navegación y uso de los mismos, por este motivo los usuarios deben explorar espacios excesivamente densos, convirtiendo la selección de información que les interesa en una tarea tediosa. Un mecanismo para suplir esta tarea son los sistemas de recomendación los cuales seleccionan de forma automática y personalizada los contenidos que mejor se adapten a las preferencias o necesidades de cada usuario. En la literatura se han propuesto diversas estrategias de personalización que los investigadores han adoptado de forma generalizada en sus trabajos. En los últimos años ha surgido una prometedora línea de investigación bajo el nombre de Web Semántica. Esta iniciativa propone describir los recursos Web mediante metadatos procesables por las máquinas, para que éstas puedan razonar sobre su semántica e inferir relaciones entre ellos, es decir, descubrir nuevo conocimiento a partir del ya conocido. Los procesos de razonamiento semántico requieren que las colecciones de datos a los que acceden las máquinas estén definidas y estructuradas de una forma adecuada como las ontologías, que son una formalización consensuada y reutilizable en la que se identifican los conceptos y relaciones típicas en un dominio de aplicación. En este trabajo de investigación se presenta un sistema de personalización de contenidos Web que hace uso de una mecanismo de razonamiento semántico a través de reglas de inferencia que asocian a un tipo de usuario, extrayendo sus atributos de una ontología de perfiles, para relacionarlos con los conceptos de una ontología de dominio, de tal manera que obtengan una recomendación de contenidos de su interés.
  • 5. ABSTRACT The World Wide Web has become an everyday tool in our society, comparable to other major media such as radio, television or telephone, its application has been extended to various fields such as education, government and e-commerce where currently the information overload makes it difficult to navigate and use them, is because of this that users should explore areas too dense, making the selection of information they are interested in a tedious task. A mechanism to meet this task are recommendation systems which automatically select and customize the content that best suit the preferences and needs of each user. In the literature have proposed different personalization strategies that researchers have widely adopted in their work. In recent years there has been a promising line of research under the name of the Semantic Web. This initiative aims to describe Web resources with machine-processable metadata, so that they can reason about the semantics and infer relationships among them, that is, discovering new knowledge from already known. Semantic reasoning processes require that data collections being accessed by machines are defined and structured in an appropriate manner such as ontologies, which are consensual and reusable formalization which identifies the concepts and relationships in a domain of application. In this research we present a system for customizing Web content that uses a semantic reasoning mechanism through inference rules associated with a type of user, extracting attributes of ontology of profiles, to relate the concepts in domain ontology, so they get a recommendation of content of interest.
  • 6. CONTENIDO Capítulo 1 : INTRODUCCIÓN................................................................................................................ 1 1.1 INTRODUCCIÓN ........................................................................................................... 2 1.2 DESCRIPCIÓN DEL PROBLEMA ......................................................................................... 2 1.3 OBJETIVO ................................................................................................................... 3 1.4 JUSTIFICACIÓN ............................................................................................................. 3 1.5 ALCANCES Y LIMITACIONES ............................................................................................ 4 1.6 ORGANIZACIÓN DEL DOCUMENTO................................................................................... 4 Capítulo 2 : MARCO TEÓRICO ............................................................................................................. 5 2.1 WEB SEMÁNTICA ......................................................................................................... 6 2.2 ONTOLOGÍAS .............................................................................................................. 6 2.3 OWL ......................................................................................................................... 7 2.4 PERSONALIZACIÓN WEB................................................................................................ 8 2.4.1 PERSONALIZACIÓN WEB SEMÁNTICA ........................................................................ 9 Capítulo 3 : ESTADO DEL ARTE .......................................................................................................... 13 3.1 INTRODUCCIÓN ......................................................................................................... 14 3.2 PERSONALIZACIÓN SEMÁNTICA DE CONTENIDOS DE PORTALES WEB.................................... 14 3.3 SISTEMA DE PERSONALIZACIÓN WEB (SEWEP) .............................................................. 15 3.4 CREACIÓN DE ONTOLOGÍAS BASADAS EN PERFILES DE USUARIO .......................................... 16 3.5 PERSONALIZACIÓN DE NAVEGACIÓN WEB CON PERFILES PERSONALES ENRIQUECIDOS SEMÁNTICAMENTE .................................................................................................................... 17 3.6 RECUPERACIÓN DEL CONTENIDO DEL CONTEXTO PERSONALIZADO UTILIZANDO CONTENIDO ONTOLÓGICO............................................................................................................................ 17 3.7 RAZONAMIENTO SEMÁNTICO: UNA RUTA DE NUEVAS POSIBILIDADES DE PERSONALIZACIÓN .... 18 3.8 UN ENFOQUE DE LA WEB SEMÁNTICA PARA LA PERSONALIZACIÓN DEL CONTENIDO ............... 18 3.9 MODELADO MANEJADO POR ONTOLOGÍAS PARA LA PERSONALIZACIÓN DE CONTENIDO WEB .. 19 3.10 COMPARATIVA .......................................................................................................... 19 Capítulo 4 : METODOLOGÍA PARA LA PERSONALIZACIÓN DE CONTENIDOS WEB............................ 23 4.1 INTRODUCCIÓN ......................................................................................................... 24 4.2 FASE 1: DESARROLLO DE ONTOLOGÍA DE E-GOBIERNO ...................................................... 25 i|Página
  • 7. 4.2.1 PROCESO 1: SELECCIÓN DE PORTALES GUBERNAMENTALES......................................... 25 4.2.2 PROCESO 2: EVALUACIÓN DE PORTALES GUBERNAMENTALES...................................... 28 4.2.3 PROCESO 3: CREACIÓN DE ONTOLOGÍA DE GOBIERNO ............................................... 31 4.2.3.1 METODOLOGÍA PARA LA CREACIÓN DE ONTOLOGÍA DE E-GOBIERNO....................... 32 4.3 FASE 2: SELECCIÓN DE ATRIBUTOS DE ONTOLOGÍA DE USUARIO ......................................... 41 4.4 FASE 3: CATÁLOGO DE REGLAS DE INFERENCIA (SWRL).................................................... 43 4.4.1 REGLAS PARA EL PERFIL DE ADULTOS....................................................................... 44 4.4.2 REGLAS PARA EL PERFIL DE ADULTOS MAYORES......................................................... 45 4.4.3 REGLAS PARA EL PERFIL DE PERSONAS CON DISCAPACIDAD .......................................... 47 4.4.4 REGLAS PARA EL PERFIL DE JÓVENES ....................................................................... 48 4.4.5 REGLAS PARA EL PERFIL DE MUJERES ....................................................................... 50 4.4.6 REGLAS PARA EL PERFIL DE NIÑOS........................................................................... 51 4.4.7 REGLAS GENERALES ............................................................................................. 52 4.4.8 REGLAS EN LENGUAJE SWRL .................................................................................. 53 4.5 FASE 4: DESARROLLO DEL SISTEMA DE PERSONALIZACIÓN WEB ......................................... 62 Capítulo 5 : ANÁLISIS, DISEÑO E IMPLEMENTACIÓN ........................................................................ 63 5.1 ARQUITECTURA DEL SISTEMA DE PERSONALIZACIÓN DE CONTENIDOS WEB........................... 64 5.2 ANÁLISIS .................................................................................................................. 66 5.2.1 DIAGRAMAS DE CASOS DE USO ............................................................................. 66 5.3 DISEÑO .................................................................................................................... 70 5.3.1 DIAGRAMA DE CLASES ......................................................................................... 70 5.4 CARACTERÍSTICAS DE IMPLEMENTACIÓN ........................................................................ 72 5.5 IMPLEMENTACIÓN...................................................................................................... 72 Capítulo 6 : PRUEBAS ........................................................................................................................ 78 6.1 INTRODUCCIÓN ......................................................................................................... 79 6.2 RESULTADOS ............................................................................................................. 80 6.2.1 CASO DE ESTUDIO CE-SRC-A01 ............................................................................ 80 6.2.2 CASO DE ESTUDIO CE-SRC-A02 ............................................................................ 83 6.2.3 CASO DE ESTUDIO CE-SRC-AM01 ........................................................................ 85 6.2.4 CASO DE ESTUDIO CE-SRC-J01 ............................................................................. 87 6.2.5 CASO DE ESTUDIO CE-SRC-J02 ............................................................................. 89 ii | P á g i n a
  • 8. 6.2.6 CASO DE ESTUDIO CE-SRC-M01 ........................................................................... 90 6.2.7 CASO DE ESTUDIO CE-SRC-M02 ........................................................................... 92 6.2.8 CASO DE ESTUDIO CE-SRC-N01............................................................................ 95 6.2.9 CASO DE ESTUDIO CE-SRC-N02............................................................................ 96 6.2.10 CASO DE ESTUDIO CE-SRC-D01 .......................................................................... 97 6.2.11 RESULTADO ...................................................................................................... 98 Capítulo 7 : CONCLUSIONES ............................................................................................................ 100 7.1 CONCLUSIONES........................................................................................................ 101 7.2 APORTACIONES ....................................................................................................... 101 7.3 TRABAJOS FUTUROS ................................................................................................. 102 REFERENCIAS ................................................................................................................................... 103 ANEXO A .......................................................................................................................................... 105 A1: Herramientas para el análisis de datos. ....................................................................... 105 A2: Clases de ontología de e-gobierno con propiedad tipo dato....................................... 106 A3: Grafo jerárquico de ontología de e-gobierno. ............................................................. 107 A4: Relaciones no taxonómicas de ontología de e-gobierno. ............................................ 108 iii | P á g i n a
  • 10. «INTRODUCCIÓN En este capítulo se presenta una introducción, el problema que dio origen a la tesis, sus alcances y limitaciones. Finalmente se describe la organización del documento. 1.1 INTRODUCCIÓN Uno de los servicios que más éxito ha tenido el Internet, es la World Wide Web (WWW, o "la Web”), que se ha convertido en un instrumento cotidiano de comunicación en nuestra sociedad. La información está representada en forma de páginas Web que los usuarios pueden acceder y explorar, y la forma de hacerlo depende en gran medida de lo que estén buscando. Debido a la cantidad de información contenida en la Web la ha llevado a evolucionar de ser una Web basada en documentos a una Web basada en aplicaciones y servicios (Web 2.0) en donde los usuarios participan y deciden los contenidos actuales de la Web. Actualmente la nueva visión de la Web se define como “Web semántica” *Berners-Lee 2001], la cual propone describir los recursos de la Web con representaciones procesables (es decir, entendibles) no sólo por personas, sino por programas, donde es más fácil localizar, compartir e integrar información y servicios para sacar un mayor partido de los recursos disponibles en la Web. El punto clave de la Web semántica son las ontologías que permiten crear, interpretar y comparar el contenido semántico de un recurso Web. Esto ha generado la necesidad, por parte de los proveedores de sitios Web, de hacer sitios más intuitivos y accesibles para los usuarios. Hoy en día los sitios Web definen grupos de usuarios, de tal manera que un usuario se identifique con algún grupo y obtenga información pertinente del sitio Web de acuerdo a las características del grupo elegido, tal es el caso de los sitios Web existentes para e-gobierno en donde definen grupos de usuarios para canalizar la diversidad de información que manejan los sitios en ese dominio, sin embargo la información suele ser general y no tener relaciones con otros grupos de información. Una solución a esta problemática es la personalización de contenidos Web, que pretende equilibrar la sobrecarga de la información contenida en los sitios Web mediante la selección de información que sea pertinente y de interés para el usuario. Esto permite dar recomendaciones a los usuarios, ya sea por simples páginas, o por la construcción de nuevos mapas de contenidos de sitio Web para los grupos de usuarios. Con la ayuda de las ontologías que nos permiten tener una mejor representación y organización de la información que facilite el mejor filtrado de contenido para las recomendaciones de los usuarios. El objetivo de este proyecto de investigación es personalizar los contenidos Web en el dominio de e-gobierno de acuerdo a grupos de usuarios. La estrategia es desarrollar una ontología que represente lo contenidos de sitios Web de gobierno y una ontología que represente los intereses y preferencias de los usuarios, con el fin de perfilar al usuario en un grupo y ofrecerle recomendaciones de acuerdo a su perfil. 1.2 DESCRIPCIÓN DEL PROBLEMA La llamada Sociedad de la Información [Masuda 1968] es una consecuencia natural del rápido crecimiento de Internet desde su nacimiento. Este contexto genera nuevos retos para los usuarios de integrarse de acuerdo a sus exigencias (tecnologías). En la lucha por alcanzar tales desafíos 2|Página
  • 11. «INTRODUCCIÓN tropiezan con la gran cantidad de información que se ha extendido a diversos dominios, en este escenario los usuarios deben explorar espacios densos de información para seleccionar lo que están buscando lo que resulta ser una tarea tediosa. Un mecanismo para suplir esta tarea son los sistemas de recomendación los cuales seleccionan de forma automática y personalizada los contenidos que mejor se adapten a las preferencias o necesidades de cada usuario. Por lo tanto, se ha generado la necesidad de mejorar los sitios Web de acuerdo a las necesidades de los usuarios. Los sitios Web existentes para e-gobierno enfrentan la problemática de ofrecer contenidos de interés a los diferentes tipos de usuario que acceden a ellos. Aunque algunos sitios están implementando grupos definidos de usuarios para canalizar la diversidad de información que manejan los sitios en este dominio, sin embargo, requieren que se aborden diferentes perfiles, es decir, el poder identificar las diversas preferencias de los usuarios y mostrarles la información que requieran de acuerdo a sus necesidades En este trabajo de investigación se desarrolló un sistema de personalización de contenidos Web que permita encontrar reglas que puedan asociar a un tipo de usuario, extrayendo sus atributos de una ontología de perfiles, para asociarlos a los conceptos de una ontología de dominio, de tal manera que tenga una recomendación de contenidos de su interés. 1.3 OBJETIVO Personalizar el contenido de un sitio Web, a través de reglas de inferencia que definan las relaciones de un perfil de usuario con el contenido del sitio Web, mediante ontologías definidas para el dominio de e-gobierno. 1.4 JUSTIFICACIÓN La necesidad de herramientas de personalización se ha manifestado claramente, desde hace ya mucho tiempo, en numerosos dominios de aplicación, de ahí la gran diversidad de enfoques que han ido surgiendo en el campo de los sistemas de recomendación en los últimos años [Adomavicius 2005] y [Demiriz 2001]. En los trabajos de [Tziviskou 2007], [Magdalini 2005] y [Ankolekar 2005] utilizan reglas de asociación que descubren acciones predecibles del usuario para lo cual necesitan un historial de su navegación. Los trabajos [Trajkova 2004], [Vallet 2007], [Brambilla 2008] asignan una ponderación a los contenidos de mayor interés para los usuarios para posteriormente mostrarlos de mayor escala. En [Blanco 2008] utilizan asociaciones semánticas para descubrir relaciones ocultas entre los contenidos de interés del usuario. Sin embargo cada trabajo tiene diferente dominio y técnica de aplicación lo cual da por hecho que la personalización Web está relacionada con los requerimientos que se deseen cubrir, en general, cada enfoque es hecho a la medida de cada requerimiento específico de la aplicación en cuestión, entre estos enfoques podemos encontrar varias soluciones técnicas y esto es una evidencia de que no hay una metodología globalmente aceptada y genérica para permitir la personalización. El común denominador de estas aplicaciones es que son orientadas hacia un enfoque basadas en el conocimiento. La mayoría de ellas explotan de alguna manera técnicas de representación de conocimiento formal, por ejemplo (ontologías y reglas) [Tsetos 2008]. Con este trabajo de 3|Página
  • 12. «INTRODUCCIÓN investigación se propone la personalización de contenidos de un sitio Web en el dominio de e- gobierno. 1.5 ALCANCES Y LIMITACIONES En esta sección se presentan los alcances y limitaciones para el presente trabajo de investigación. Alcances: Definir los atributos del perfil de usuario de acuerdo a la estructura de un sitio Web. Analizar, extender e implementar la ontología de usuario de acuerdo a los atributos de mayor interés. Identificar relaciones entre ontología de dominio y de usuario Generar las reglas de asociación entre la ontología del dominio y de usuario. Personalizar los contenidos del sitio Web de acuerdo al perfil de usuario. Limitaciones: La personalización de contenidos Web está dirigida al dominio de e-gobierno. La personalización de contenidos Web está enfocada solo a los contenidos. La ejecución de reglas de inferencia se realiza con la máquina de inferencia Jess [Jess 2010]. 1.6 ORGANIZACIÓN DEL DOCUMENTO El presente documento se encuentra organizado de la siguiente manera: Capítulo 2. Marco Teórico: en este capítulo se presentan los fundamentos teóricos de la presente investigación. Capítulo 3. Estado del arte: en este capítulo se presenta un resumen de los trabajos relacionados que sirven como punto de referencia y comparación con el presente trabajo de investigación. Capítulo 4. Metodología para la personalización de contenidos Web: en este capítulo se presenta la metodología para la personalización de contenidos de e-gobierno aplicando un proceso de razonamiento semántico. Capítulo 5. Análisis, Diseño e Implementación: en este capítulo se presenta la arquitectura del sistema de personalización de contenidos, sus detalles de análisis como los casos de uso y de diseño como el diagrama de clases, así también la implementación de la arquitectura. Capítulo 6. Pruebas: en este capítulo se presenta el plan de prueba para el prototipo de recomendación de contenidos web y los resultados obtenidos. Capítulo 7. Conclusiones: en este capítulo se presentan las conclusiones derivadas de este trabajo, las principales aportaciones y los posibles trabajos futuros que se pueden realizar a partir de esta investigación. 4|Página
  • 13. Capítulo 2 : MARCO TEÓRICO 5|Página
  • 14. «MARCO TEÓRICO En este capítulo se presenta la teoría relacionada con el tema aplicado en este trabajo de tesis. Se inicia describiendo los conceptos relacionados con la investigación en el ámbito semántico y los conceptos generales que se utilizarán en el transcurso de este documento. 2.1 WEB SEMÁNTICA La Web semántica [Berners-Lee 2001] propone superar las limitaciones de la Web actual mediante la introducción de descripciones explícitas del significado, la estructura interna y la estructura global de los contenidos y servicios disponibles en la Web. Frente al crecimiento de información, y la ausencia de una organización clara de la Web actual, la Web semántica aboga por clasificar, dotar de estructura y anotar con semántica los contenidos en la Web. Para construir la Web semántica se necesita poder representar el conocimiento de forma que sea legible por las computadoras, esté consensuado, y sea reutilizable. Las ontologías proporcionan la vía para representar este conocimiento. La Web no se limita únicamente a proporcionar acceso a contenidos, también ofrece interacción y servicios (comprar un libro, reservar un vuelo, hacer una transferencia bancaria, simular una hipoteca). Los servicios Web semánticos son una línea importante de la Web semántica, que propone describir no sólo información sino definir ontologías de funcionalidad y procedimientos para describir servicios Web: sus entradas y salidas, las condiciones necesarias para que se puedan ejecutar, los efectos que producen, o los pasos a seguir cuando se trata de un servicio compuesto. Estas descripciones procesables por máquinas permitirían automatizar el descubrimiento, la composición, y la ejecución de servicios, así como la comunicación entre unos y otros [Castells 2004]. 2.2 ONTOLOGÍAS La representación del conocimiento se hace para homogeneizar los datos y para hacerlos manejables. Las ontologías expresan universos de objetos y conceptos lógicamente estructurados. Gruber define una ontología como una especificación formal de una conceptualización compartida [Gruber 1993]. Una ontología es una jerarquía de conceptos con atributos y relaciones, que define una terminología consensuada para definir redes semánticas de unidades de información interrelacionadas. Una ontología proporciona un vocabulario de clases y relaciones para describir un dominio, poniendo énfasis en la compartición del conocimiento y el consenso en la representación de éste. Por ejemplo, una ontología sobre arte podría incluir clases como Pintor, Cuadro, Estilo o Museo, y relaciones como autor de un cuadro, pintores pertenecientes a un estilo artístico u obras localizadas en un museo. Continuando con Gruber las ontologías tienen los siguientes componentes que sirven para representar el conocimiento de algún dominio. 6|Página
  • 15. «MARCO TEÓRICO Conceptos: son las ideas básicas que se intentan formalizar. Los conceptos pueden ser clases de objetos, métodos, planes, estrategias, procesos de razonamiento, etc. Relaciones: representan la interacción y enlace entre los conceptos del dominio. Suelen formar la taxonomía del dominio. Por ejemplo: subclase-de, parte-de, parte-exhaustiva- de, conectado-a, etc. Funciones: son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología. Por ejemplo, pueden parecer funciones como categorizar-clase, asignar fecha, etc. Instancias: se utilizan para representar objetos determinados de un concepto. Axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología. Por ejemplo: “Si A y B son de la clase C, entonces A no es subclase de B”, “Para todo A que cumpla la condición C1, A es B”, etc. Una ontología es el resultado de seleccionar un dominio, y aplicar sobre el mismo un método para obtener una representación formal de los conceptos que contiene y las relaciones que existen entre los mismos. Para poder explotar la Web semántica, se necesitan lenguajes de marcado apropiados que representen el conocimiento de las ontologías. Existe un lenguaje de marcado para publicar y compartir datos usando ontologías, el Lenguaje de Ontologías Web (OWL, “Web Ontology Lenguaje”) *W3C OWL 2004+, el cual se describe en el siguiente punto. 2.3 OWL El Lenguaje de Ontologías Web (OWL) es el sucesor de DAML + OIL, como sus predecesores, el vocabulario OWL incluye un conjunto de elementos y atributos XML, con un significado bien definido. Estos se utilizan para describir los términos de dominio y sus relaciones en una ontología. OWL está diseñado para ser usado en aplicaciones que necesitan procesar el contenido de la información en lugar de únicamente representar información para los humanos. OWL facilita un mejor mecanismo de interoperabilidad de contenido Web que los mecanismos admitidos por XML, RDF, y esquema RDF (RDF-S) proporcionando vocabulario adicional junto con una semántica formal. OWL tiene tres sub-lenguajes, con un nivel de expresividad creciente: OWL Lite, OWL DL, y OWL Full [W3C OWL 2004]. OWL es un lenguaje para describir datos con semántica en la Web y no como protocolo de intercambio de información. Sus funciones principales se resumen en: 1. Formaliza dominios mediante clases y propiedades. 2. Define individuos y propiedades entre individuos. 3. Permite un razonamiento formal (inferencia) basado en la semántica adoptada en la definición de clases propiedades e individuos. OWL proporciona tres lenguajes, cada uno con nivel de expresividad mayor que el anterior, diseñados para ser usados por comunidades específicas de desarrolladores y usuarios. 7|Página
  • 16. «MARCO TEÓRICO 1. OWL Lite está diseñado para aquellos usuarios que necesitan principalmente una clasificación jerárquica y restricciones simples. Por ejemplo, a la vez que admite restricciones de cardinalidad, sólo permite establecer valores cardinales de 0 ó 1. OWL Lite proporciona una ruta rápida de migración para tesauros y otras taxonomías. OWL Lite tiene también una menor complejidad formal que OWL DL. 2. OWL DL está diseñado para aquellos usuarios que quieren la máxima expresividad conservando completitud computacional (se garantiza que todas las conclusiones sean computables). OWL DL incluye todas las construcciones del lenguaje de OWL, pero sólo pueden ser usados bajo ciertas restricciones (por ejemplo, mientras una clase puede ser una subclase de otras muchas clases, una clase no puede ser una instancia de otra). OWL DL es denominado de esta forma debido a su correspondencia con la lógica de descripción (Description Logics, en inglés), un campo de investigación que estudia la lógica que compone la base formal de OWL. 3. OWL Full está diseñado a usuarios que quieren máxima expresividad y libertad sintáctica de RDF. Por ejemplo, en OWL Full una clase puede ser considerada simultáneamente como una colección de clases individuales y como una clase individual propiamente dicha. OWL Full permite una ontología para aumentar el significado del vocabulario preestablecido (RDF u OWL). Es poco probable que cualquier software de razonamiento sea capaz de obtener un razonamiento completo para cada característica de OWL Full. Cada uno de estos sub-lenguajes es una extensión de su predecesor más simple. Los desarrolladores de ontologías que adoptan OWL deberían considerar cuál es el sublenguaje que mejor se adapta a sus necesidades. La elección entre OWL Lite y OWL DL depende de las necesidades de los usuarios sobre la expresividad de las construcciones, proporcionando OWL DL las más expresivas. La elección entre OWL DL y OWL Full depende principalmente de las necesidades de los usuarios sobre los recursos de metamodelado del esquema RDF (por ejemplo, definir clases de clases, o definir propiedades de clases). Cuando se usa OWL Full en comparación con OWL DL, el soporte en el razonamiento es menos predecible, ya que no existen en este momento implementaciones completas de OWL Full. 2.4 PERSONALIZACIÓN WEB La personalización Web es la habilidad de un sitio para mantener la atención de los usuarios a un nivel más alto de lo común y guiarlos de forma satisfactoria a obtener información útil y pertinente, de acuerdo con [Mombasher 2005].La personalización Web contempla el modelado de objetos Web como páginas y tópicos, la categorización de esos objetos, la búsqueda de coincidencias entre estos, así como el conjunto de acciones que se deben tomar, para realizar la personalización. Puede ser basada en sistemas de reglas de decisión manuales, agentes de filtrado basados en el contenido o sistemas de filtrado colaborativo. La personalización Web consta de dos definiciones: 8|Página
  • 17. «MARCO TEÓRICO Definición 1. Sistema Adaptable y Adaptativo. Un sistema es llamado "adaptable" cuando permite a un usuario ajustar el comportamiento de un sistema a sus preferencias y necesidades actuales. Por otra parte, un sistema “adaptativo”, es aquel que permite ajustar de manera autónoma las preferencias y necesidades actuales del usuario. El sistema “adaptativo” captura las necesidades del usuario (preferencias, intereses, experiencia, etc.) y automáticamente se adapta a estas necesidades inferidas [Baldoni 2005]. Definición 2. Personalización. Es el proceso de presentar contenido y/o servicios a un usuario sobre la base de sus preferencias, intereses, necesidades y contexto en general. El propósito de este proceso es adaptar el contenido y servicios a las características específicas del usuario con el fin de lograr un óptimo rendimiento (la definición de "rendimiento" es dependiente del dominio) [Tsetsos 2008]. En consecuencia llamamos a una aplicación como personalizada o adaptativa al usuario, si está consciente del perfil del usuario, puede detectar el contexto del usuario y necesidades, y es capaz de adaptarse a sí misma para satisfacer esas necesidades. 2.4.1 PERSONALIZACIÓN WEB SEMÁNTICA La creciente demanda de aplicaciones por usuarios, ha generado muchos métodos para personalizar las aplicaciones, de acuerdo a sus requerimientos. En general, cada enfoque es hecho a la medida de cada requerimiento específico de la aplicación en cuestión, entre estos enfoque podemos encontrar varias soluciones técnicas y esto es una evidencia de que no hay una metodología globalmente aceptada y genérica para permitir la personalización. El común denominador de estas aplicaciones es que son orientadas hacia un enfoque basadas en el conocimiento. La mayoría de ellas explotan de alguna manera técnicas de representación de conocimiento formal, por ejemplo (ontologías y reglas). En [Tsetsos 2008] se presenta una arquitectura para la Web semántica personalizada. Los principales componentes de esta arquitectura se muestran en la Figura 2-1: aplicación de la lógica del negocio, modelos y contexto, mecanismos de detección del contexto, modulo de razonamiento.  Aplicación de la lógica de negocio: Se define como una aplicación que presenta los servicios o contenidos a cada uno de los usuarios de manera óptima, dado el contexto actual. Con óptimo nos referimos a la facilidad de uso, alto rendimiento, comportamiento proactivo, recuperación efectiva del contenido, filtrado y presentación. 9|Página
  • 18. «MARCO TEÓRICO Figura 2-1: Arquitectura de una aplicación para la personalización Web semántica [Tsetsos 2008]  Modelos y Contexto Se ha puesto énfasis en el modelo basado en la personalización, es decir todos los conocimientos pertinentes para la aplicación destino se describe a través de modelos. En el caso de la personalización Web Semántica, la manera común de representar estos modelos es el lenguaje de ontologías de Web Semántica, el lenguaje de ontologías Web (OWL) y/o el Esquema de Resource Description Framework (RDFS). Los modelos (es decir, ontologías) pueden describir diversos aspectos de la arquitectura general del sistema. En la Figura 2-1, se identifican los cinco principales modelos que se espera encontrar en la personalización de aplicaciones Web Semánticas: 1. Modelo de aplicación: es un modelo que describe detalles específicos de aplicaciones, tales como solicitud de los estados, procesos, y su semántica. 2. Modelo de usuario: es un modelo obligatorio centrado en el humano. Puede describir varios aspectos del perfil del usuario tales como: información demográfica, situación actual, intereses y preferencias, es decir, especifica una clasificación de usuarios, de acuerdo a su perfil. 3. Modelo del entorno: es un modelo que especifica elementos periféricos del modelado, por ejemplo, el estado del entorno que rodea al usuario o aplicaciones externas que pueden afectar el comportamiento de la aplicación en cuestión. 4. Modelo de Actividad: es un modelo que describe todas las posibles interacciones del usuario con el sistema y otras actividades que pueden ser realizadas y proveen alguna retroalimentación para un futuro comportamiento de la aplicación. En cierto sentido, este modelo es una descripción formal de registros de actividad. Por ejemplo, las varias clases que las que el usuario es clasificado durante un periodo de tiempo puede ser información 10 | P á g i n a
  • 19. «MARCO TEÓRICO útil para disparar acciones de adaptación. Las instancias de este modelo capturan conocimiento que puede incluir información accedida antes por el usuario, patrones temporales del uso de la aplicación etc. Este tipo de información es, generalmente obtenido por el sistema de una manera transparente, dicha información es una entrada común para mecanismos de aprendizaje de perfiles. 5. Modelo de Contenido: es un modelo que describe la semántica del contenido usado por la aplicación. Se puede suponer que en la mayoría de los casos el contenido no cambia dinámicamente.  Mecanismos de detección de contexto En este módulo se realiza la actualización del contexto de usuario, utilizando dos mecanismos: un sensor de contexto y una traducción del contexto. El sensor de contexto se encarga de obtener datos de acuerdo a la ubicación de usuario, temperatura ambiental, recabar información del contexto en el que se encuentre el usuario. La traducción del contexto, realiza la transformación de los datos de contexto a rutinas para que sean procesadas por la aplicación correspondiente.  Módulo de Razonamiento Este módulo se encarga del mecanismo de razonamiento para la adaptación de personalización. Como entrada recibe reglas, que son la especificación de los modelos, que describen todo el contexto de la aplicación para su correspondiente personalización. Como resultado se obtiene las decisiones y acciones que adoptará la aplicación para adaptarse al contexto de usuario. Dependiendo de la representación, el conocimiento técnico y la expresividad que se utilicen para los modelos y la adaptación de políticas, este módulo podrá realizar diversos tipos de inferencia.  MODELADO DE INGENIERIA DE USUARIO: DEFINICIONES El modelo de usuario juega un papel clave en todos los sistemas de personalización. Obviamente, dada la actual tecnología de la Web semántica, la ontología es la "Herramienta" para expresar este modelo. El modelo de usuario tiene 2 aspectos de conocimiento: 1. El aspecto funcional: divide el modelo de ingeniería de usuario en categorías basadas en su uso real en la solicitud del usuario. Las categorías típicas son: Demografía usuario: este tipo de categoría recoge información general del usuario. Esta información del usuario puede incluir: nombre, edad, dirección de correo electrónico, etc., normalmente, previsto por el usuario. Preferencias del usuario: en esta categoría un usuario puede tener varias preferencias en relación con su interacción con un sistema. Esta información ayuda al sistema para optimizarlo y así proporcionar el acceso, la presentación y la recuperación de la 11 | P á g i n a
  • 20. «MARCO TEÓRICO información para el usuario. Tales preferencias pueden incluir los intereses del usuario o sus necesidades de información. Capacidades de usuario: en esta categoría un usuario también puede tener las capacidades individuales o discapacidad que debería afectar la forma en que el sistema funciona. Por ejemplo, en un escenario de navegación peatonal, considerar un usuario en un edificio público que utiliza una silla de ruedas. Por otra parte, asumir que el edificio ofrece un servicio de navegación a los usuarios con teléfonos inteligentes. Obviamente, el servicio de navegación debe excluir todas las rutas que contienen las escaleras, debido a la discapacidad del usuario para acceder a ellas. 2. El aspecto estructural: divide al modelo de usuario en categorías de acuerdo a [Cali 2004]: Un conjunto de alto nivel, clases de usuario (UC): la UC es utilizada para clasificación de los usuarios con respecto al dominio de aplicación. Un conjunto de clases que representan las características del perfil (FC): estas clases constituyen el super conjunto de los intereses, capacidades y preferencias que un usuario pueda tener. Las características reales que se aplican a un usuario están representadas como instancias de las respectivas FC. Un conjunto de relaciones (o función de las propiedades) (FP), asignan funciones (FC casos) a usuarios (UC casos): según el lenguaje OWL, se trata de relaciones binarias y se especifica como objeto-propiedad. Un conjunto de atributos, A, que asignan valores literales a las características del usuario: una característica típica podría ser el nombre, la edad, el sexo, etc., según el lenguaje OWL, estos son como el modelo de relaciones binarias y se especifican como dato-propiedad. 12 | P á g i n a
  • 21. Capítulo 3 : ESTADO DEL ARTE 13 | P á g i n a
  • 22. «ESTADO DEL ARTE En este capítulo se revisan las propuestas definidas en la literatura en el campo de los sistemas de personalización de contenidos Web. Dicha revisión incluye el tipo de modelo en cómo presentan los contenidos Web, el modelado de usuario para crear sus perfiles con las características de sus preferencias y los mecanismos para adaptar las recomendaciones de contenidos de acuerdo al perfil de usuario, al final del capítulo se muestra una comparativa de los trabajos analizados. 3.1 INTRODUCCIÓN Con el fin de conocer el contexto de la investigación se presentan los ochos trabajos relacionados con los puntos de revisión considerados (modelo del sitio Web, modelo de usuario y técnica de personalización). Los ochos trabajos relacionados: 1) Personalización semántica de contenidos Web, 2) Personalización Web, integrando contenido semántico y patrones de navegación, 3) Improvisando ontologías basadas en perfiles de usuario, 4) Personalización de navegación Web con perfiles personales enriquecidos semánticamente, 5) Recuperación del contenido del contexto personalizado utilizando contenido ontológico, 6) Razonamiento semántico: una ruta a nuevas posibilidades de personalización, 7) Un enfoque de la Web semántica para la personalización del contenido y 8) Modelado manejado por ontologías para la personalización de contenido Web se describen a continuación. 3.2 PERSONALIZACIÓN SEMÁNTICA DE CONTENIDOS DE PORTALES WEB El modelo conceptual propuesto en [Tziviskou 2007] para la recomendación de contenidos Web se basa en un algoritmo que asocia pesos (cantidad) a los contenidos visitados el usuario. Posteriormente realizar un consenso de los contenidos más visitados y así mostrarle los de mayor interés. El modelo conceptual se basa en las declaraciones explícitas e implícitas de las preferencias del usuario y en un proceso iterativo de análisis de su historial de navegación. Para la realización del modelo conceptual se enfocaron en tres partes: 1. Ontología del perfil de usuario: se identifican datos y la navegación de los usuarios, para crear objetos que categoricen sus preferencias, mientras un usuario visite más el sitio Web, la ontología se poblará de más objetos que describan más específicamente al usuario. 2. Ontología del dominio: se utiliza WebML que es una metodología para la creación de aplicaciones Web, con la cual se extrae el esquema de datos del sitio Web para encontrar las categorías de los contenidos presentados en el sitio y crear la ontología del dominio, como se muestra en la Figura 3-1. 14 | P á g i n a
  • 23. «ESTADO DEL ARTE Figura 3-1: Modelo de datos ontológico para un portal Web [Tziviskou 2007]. 3. Razonamiento de personalización: crearon un algoritmo para la extracción de los objetos representados en la ontología del dominio para darle las recomendaciones necesarias al usuario. El algoritmo consta de 3 pasos: Primer paso: el algoritmo especifica las relaciones y los correspondientes pesos asignados para la extracción de objetos similares en la página. Segundo paso: el algoritmo descarta los objetos recuperados que no están relacionados (de manera directa) o que no están contenidas en los intereses del usuario. Tercer paso: el algoritmo califica los objetos recuperados calculando el total de peso de las relaciones que las conectan a los intereses del usuario. 3.3 SISTEMA DE PERSONALIZACIÓN WEB (SEWEP) La herramienta propuesta en [Magdalini 2005] utiliza reglas de asociación para relacionar la navegación del usuario con los contenidos representados en una taxonomía del sitio Web. La herramienta nombrada SeWep consta de seis módulos: 1. Recuperación de Contenido: este módulo se encarga de rastrear el sitio Web, extrae el texto de una variedad de formatos de archivo (html, doc, php, ppt, pdf, flash, etc.) y las almacena en su base de datos. 2. Extracción de palabras clave: este módulo se encarga de extraer los contenidos a los que haya accedido el usuario, para encontrar un conjunto de palabras prioritarias que identificarán el tipo de contenido al cual el usuario accedió, estas palabras son almacenadas en una base de datos con la frecuencia que fueron solicitadas. 3. Categorización de palabras claves: en este módulo las palabras claves extraídas son clasificadas en categorías de acuerdo a un dominio específico (taxonomía). El sistema utiliza un tesauro (WordNet) para realizar la categorización. Ponderado estas categorías se almacenan en archivos XML y / o en la base de datos. 4. Administración de sesiones: en este módulo se extrae la navegación de los usuarios, el sistema hace uso de la sesionización sobre la base de diferentes direcciones IP y un usuario definido en el tiempo límite entre los períodos de sesiones. Las distintas sesiones se almacenan en archivos XML y / o tablas de base de datos. 15 | P á g i n a
  • 24. «ESTADO DEL ARTE 5. Reglas de la Asociación: en este módulo se extrae las categorías de mayor frecuencia que un usuario accedió, creando reglas de asociación, es decir, relaciona los criterios que al usuario le interesaron para posteriormente mostrarle esos criterios. Los resultados se almacenan en archivos de texto para su posterior análisis o para su utilización en el motor de recomendación. 6. Recomendaciones: este módulo relaciona las reglas de asociación con las categorías de palabras claves, de tal manera que genera recomendaciones dinámicas para el visitante de la Web. 3.4 CREACIÓN DE ONTOLOGÍAS BASADAS EN PERFILES DE USUARIO La metodología propuesta en [Trajkova 2004] propone la generación automática de perfiles de usuario basados en ontologías, se basa en la captura del comportamiento de un usuario mediante el análisis de su exploración Web habitual. Lo cual, alimenta una estructura jerárquica proponiendo como niveles más altos a los puntos con más interés y viceversa, a partir de un cálculo predefinido de ponderaciones, tomando en cuenta que se utilizará el perfil cuando se considere lo suficientemente maduro para ello. Para construir el perfil usan como entrada las páginas que ha visitado el usuario, toman la cantidad mínima de 5 segundos que haya tardado el usuario en las páginas. El sistema clasifica cada página Web de acuerdo a un concepto definido en la ontología. El proceso de construcción del perfil consta de 3 fases: 1) Clasificador de entrenamiento: Esta fase se encarga de clasificar páginas que están relacionadas a un concepto particular para crear un superdocumento, uno por cada concepto relevante que identifique los contenidos del sitio Web. 2) Recogedor de datos de usuario: Esta fase almacena en un archivo de registro las URL´s, fecha y hora de visita, tamaño de la página, por un servidor Proxy. Utilizan un programa que extrae las URL para cada usuario y los filtros para eliminar los documentos que se consideran demasiado cortos para tener cualquier contenido menos de un KB) y aquellos sobre los que el usuario está poco tiempo (menos de 4 segundos), ya sea porque la página no tiene contenido de interés o debido a que la página fue actualizada. 3) Clasificador de páginas Web de los recogidos URL´s: Esta fase se encarga de clasificar las páginas Web de acuerdo a los datos recogidos de los usuarios (fase 2). Todos los conceptos accedidos por los usuarios son almacenados en un vector y los objetos relacionados a los conceptos se identifican mediante el algoritmo de k-vecinos. De los conceptos se extraen palabras clave que ayudarán a describir las páginas Web y poder encontrar la relación de los objetos con los conceptos. Se crean categorías a través de la relación objeto – concepto para generar una ontología de usuario. 16 | P á g i n a
  • 25. «ESTADO DEL ARTE 3.5 PERSONALIZACIÓN DE NAVEGACIÓN WEB CON PERFILES PERSONALES ENRIQUECIDOS SEMÁNTICAMENTE El método propuesto en [Ankolekar 2005] se basa en la ampliación del método HTTP GET para incluir un nuevo parámetro que apunta a la URL de un archivo del usuario denominado FOAF (Friend of a Friend) [Miller 00] el cual tiene información que describe a una persona en términos de varios atributos, tales como páginas Web, afiliaciones, fotografías y datos de contacto, así como especificaciones de los conocidos y amigos del usuario, está extensión permite que el servidor Web pueda utilizar la información de la persona contenida en el archivo FOAF para personalizar las páginas web. Como caso de estudio lo implementaron en un portal de un centro de investigación con el fin de recomendar enlaces de los investigadores que el usuario tenía relación. El servidor web con la nueva cabecera es capaz de acceder a los archivos FOAF del usuario, busca personas que el usuario conoce. En la página principal del portal el usuario cuenta con enlaces directos a esas personas. A partir de ahí, se puede explorar la lista de la publicación, los datos actuales de contacto, los cursos, los proyectos que la persona trabaja, y así sucesivamente. 3.6 RECUPERACIÓN DEL CONTENIDO DEL CONTEXTO PERSONALIZADO UTILIZANDO CONTENIDO ONTOLÓGICO El método propuesto en [Vallet 2007] se basa en una ontología de representación del dominio del discurso, asignando diferentes pesos de acuerdo a los intereses del usuario que haya registrado y a la navegación que ha tenido de tal manera que se le muestre una página con los enlaces que más le hayan interesado. Las preferencias de los usuarios se abordan de manera implícita y explicita a lo largo de la historia de sus acciones. Ponderan semánticamente metadatos que describen los contenidos del discurso en términos de una ontología del dominio. Utilizan una técnica de vectores para establecer los pesos por concepto de la ontología del dominio indicando su relación con las preferencias de los usuarios. Los usuarios se representan con vectores haciendo una correspondencia de acuerdo a la intensidad de sus intereses por cada concepto de la ontología de dominio, creando reglas de asociación y transitividad. Una vez que se obtuvieron los contenidos que tuvieron mayor preferencia se filtran y se clasifican de manera personalizada. 17 | P á g i n a
  • 26. «ESTADO DEL ARTE 3.7 RAZONAMIENTO SEMÁNTICO: UNA RUTA DE NUEVAS POSIBILIDADES DE PERSONALIZACIÓN El método propuesto en [Blanco 2008] se basa en asociaciones semánticas para la recomendación de programas de televisión que se presentan a los espectadores de la televisión digital interactiva (IDTV). El método descubre relaciones semánticas entre las preferencias del usuario con los programas de televisión representados en una ontología de dominio. Para su implementación consideraron dos modelos: 1. Modelo del dominio: este modelo realiza la descripción semántica de los programas de televisión que se pueden sugerir a los usuarios, este modelo representa la ontología del domino de los programas de televisión. 2. Modelo de usuario: este modelo representan los atributos necesarios para definir las preferencias de los usuarios de acuerdo a los programas de televisión. La estrategia basada en el razonamiento que proponen cuenta con dos fases, con las cuales se realiza la inferencia para poder sugerir los programas de televisión de acuerdo a las preferencias del usuario. 1. Fase de Filtrado: está fase selecciona de la ontología del dominio las instancias de clases y propiedades que son relevantes para el usuario, es decir, aquellas que cumplan con los atributos que tienen relación con los programas de televisión considerando las preferencias personales. 2. Fase de Recomendación: esta fase detecta los conceptos que están estrechamente relacionados con las preferencias del usuario mediante la exploración de las entidades y asociaciones semántica, las cuales permiten crear relaciones entre entidades de recursos. Estas relaciones captan la conectividad entre las entidades y la similitud entre ellas. La estrategia es capaz de descubrir que un programa de televisión es atractivo para el usuario, la información es desplegada en forma de guía de canales con programación que podría ser atractiva para el usuario. 3.8 UN ENFOQUE DE LA WEB SEMÁNTICA PARA LA PERSONALIZACIÓN DEL CONTENIDO El método propuesto en [Wolowski 2007] se basa en un sistema de software que da recomendaciones de compras a través de mensajes de texto a su celular a los usuarios. La arquitectura propuesta se basa en la premisa de que hay un registro de usuarios que representa la historia de su comportamiento (sus compras). El método que utilizaron para inferir sobre los artículos a comprar fue un árbol de decisión, con el cual se construyen predicciones para representar y categorizar una serie de sucesos. El árbol de decisión representa un modelo para las preferencias de usuario. El árbol de decisión se transforma en un perfil de preferencias, marcado en forma de metadatos RDF, y se almacena en el dispositivo del usuario. 18 | P á g i n a
  • 27. «ESTADO DEL ARTE Para el proceso de personalización de contenidos, se realiza una consulta de metadatos específicos y se crea automáticamente una plantilla genérica, utilizando las preferencias del usuario generados a partir de un árbol de decisión. Esta consulta puede ejecutar la búsqueda de los productos representados en forma de metadatos RDF (por ejemplo, artículos de compra) que satisfacen las preferencias del usuario. El contenido personalizado es entregado en un mensaje que contiene el resultado del proceso, se envía al nodo del mismo nivel, lo que representa el dispositivo móvil de un usuario dentro de una red peer-to-peer. 3.9 MODELADO MANEJADO POR ONTOLOGÍAS PARA LA PPERSONALIZACIÓN DE CONTENIDO WEB El método propuesto en [Brambilla 2008] se basa en un proceso de monitoreo iterativo de la navegación del usuario. Se recolectan sus búsquedas, estas se almacenan como preferencias en una ontología de perfil de usuario la cual se correlaciona con una ontología de dominio, finalmente la información obtenida se consulta para entregar contenido personalizado. El método propuesto evalúa el contexto de contenidos Web para incluir enlaces ad-hoc en las páginas de navegación. El contexto de los contenidos de la página se describe con esquemas de ontologías. El método consiste de 3 pasos: 1. Un modelo entidad – relación que representa los metadatos que describen el contexto Web representado en ontologías. 2. Un conjunto de primitivas de alto nivel para la gestión de hipertexto. 3. Un mecanismo de personalización para la gestión de contenidos Web, el cual clasifica Las preferencias del usuario asignando un peso a las diferentes contribuciones de las preferencias explícitas e implícitas que el usuario provee. Este mecanismo consta de cuatro partes: a. Un modelo conceptual para representar el perfil de usuario, en término de ontologías. b. Un modelo conceptual para el registro de preferencias de los usuarios. c. Un modelo conceptual para almacenar el comportamiento implícito del usuario. d. Un modelo conceptual para la publicación de metadatos de contenido personalizado basado en el hipertexto de las páginas, de acuerdo a la información recogida de los modelos anteriores. 3.10 COMPARATIVA En esta sección se describe una comparativa con los puntos de interés interrelacionados con los trabajos del estado del arte y el trabajo de investigación. La comparativa se detalla en la Tabla 3-1, los criterios de comparación son: 19 | P á g i n a
  • 28. «ESTADO DEL ARTE Modelo de usuario: este punto de interés especifica a qué nivel maneja el modelo de usuario, es decir, si el modelo es una ontología, si está basado en un modelo conceptual, o está registrado en una Base de Datos. En los trabajos de [Tziviskou 2007], [Trajkova 2004], [Blanco 2008], [Wolowski 2007] y [Brambilla 2008] utilizan una ontología para representar los intereses y /o preferencias del usuario al igual que la tesis, sin embargo la ontología creada en los trabajos de investigación se desarrolló de acuerdo al historial de navegación del usuario, por lo cual hay una relación más estrecha con los contenidos del sitio y/o portal Web al que accedió el usuario. La tesis maneja una ontología de usuario general, que al no estar relacionada al sitio Web, tiene atributos que perfilan al usuario en diferentes contextos. Una ventaja de esta ontología es que no se requiere conocer lo que el usuario ha visitado, para ofrecerle las recomendaciones. La diferencia con esta tesis con el resto de los trabajos es que hacen recomendaciones de acuerdo a las personas con las que tiene alguna relación el usuario, a excepción de [Ankolekar 2005] que hace uso del archivo FOAF el cual contiene información general de un usuario. Modelo de sitio: este punto de interés especifica a qué nivel maneja el modelo del sitio, es decir, si el modelo cuenta con un esquema semántico (ontología del dominio), modelo conceptual, o una simple taxonomía. En los trabajos de [Tziviskou 2007], [Vallet 2007], [Blanco 2008], [Wolowski 2007] y [Brambilla 2008] manejan una ontología que representa los contenidos del sitio y /o portal Web debido a su factibilidad para extraer el contenido y la utilización de la URI que representa cada contenido, en esta tesis desarrolló una ontología que representa los contenidos del sitio Web de gobierno estatal con el fin de tener una mayor interacción entre los conceptos y los intereses del usuario además de que esta tesis inmersa en la Web Semántica. En otros trabajos como [Magdalini 2005], [Trajkova 2004], [Ankolekar 2005] únicamente consideran la representación de los contenidos a nivel de taxonomía de acuerdo al historial de navegación del usuario. Método de relación: este punto de interés especifica la técnica de personalización utilizada. En [Tziviskou 2007], [Magdalini 2005] y [Ankolekar 2005] la técnica aplicada son reglas de asociación que descubren acciones predecibles del usuario para lo cual necesitan un historial de su navegación. En los trabajos [Trajkova 2004], [Vallet 2007], [Brambilla 2008] utilizan vectores por peso, ponderan en la escala de 0-1 aquellos contenidos en donde el usuario estuvo más interesado, representándolos en un vector, asocian la ponderación con los contenidos de interés. En [Blanco 2008] utilizan asociaciones semánticas para descubrir relaciones ocultas entre los contenidos de interés del usuario, es decir, buscan información que tenga relación con los contenidos que en principio, el usuario consideró; de esta forma se selecciona y presentan los contenidos de interés para el usuario y otros que podrían interesarle. En [Wolowski 2007] utilizan un árbol de decisión, el cual se basa en datos de entrenamiento que previamente se cargan, con estos datos se identifica la información que puede ser de interés al usuario. Con respecto a la tesis se utilizó una máquina de inferencia definiendo reglas semánticas en lenguaje SWRL (Semantic Web 20 | P á g i n a
  • 29. «ESTADO DEL ARTE Rule Lenguaje), para explotar el modelo de recomendación se implementaron dos ontologías, una de usuario y otra del contenido de un sitio Web de gobierno estatal, las máquinas de inferencia permiten relacionar conceptos entre ontologías, lo cual no realizan los trabajos relacionados que sólo manejan una ontología de usuario o de contenido, por lo que requieren del historial de navegación de usuario para conocer qué contenidos le interesan y partir de esto generar las asociaciones entre sus intereses y los contenidos, en esta tesis se necesita conocer atributos de interés que el usuario reflejó en la ontología de usuario y buscar los contenidos que se relacionen con esos atributos, por lo que no se requiere historial de navegación para mostrarle lo que más haya visitado. Personalización: este punto de interés define el nivel de personalización y la manera en cómo se muestra el contenido personalizado al usuario. En [Tziviskou 2007] y [Brambilla 2008] insertan enlaces directos a los contenidos de interés del usuario. En [Magdalini 2005] muestra los documentos (.html, .doc, .pdf, etc.) que para el usuario fueron de mayor interés de acuerdo a su historial. En [Trajkova 2004], [Ankolekar 2005] y [Vallet 2007] muestran una página en la cual se muestran los contenidos que más visitó el usuario. En [Blanco 2008] se muestra una guía de los contenidos que le interesaría al usuario a través de un mensaje en la pantalla de su televisor y en [Wolowski 2007] envía mensajes al teléfono celular del usuario para mostrarle los contenidos de su interés. En esta tesis se muestra una página con diferentes enlaces clasificándolos por categorías para su mejor distribución. Hasta el momento en la literatura analizada no se ha encontrado algún trabajo que extraiga la estructura del sitio para mostrar una página personalizada con el diseño del sitio mostrando únicamente los contenidos que podrían ser de interés para el usuario. Tabla 3-1: Cuadro comparativo de trabajos relacionados Modelo de Método de Nombre Modelo del sitio Personalización usuario relación [Tziviskou 2007] ontología ontología Reglas por pesos Enlaces Reglas de [Magdalini 2005] BD taxonomía Documentos asociación Vectores por [Trajkova 2004] ontología Si Páginas pesos Reglas de [Ankolekar 2005] ontología categorías Página asociación Vectores por [Vallet 2007] si ontología Página pesos Asociaciones [Blanco 2008] ontología ontología Mensajes Semánticas [Wolowski 2007] ontología ontología Árbol de decisión Mensajes Vectores por [Brambilla 2008] ontología ontología Enlaces pesos Reglas semánticas Categorías / Tesis ontología ontología (SWRL) Enlaces 21 | P á g i n a
  • 30. «ESTADO DEL ARTE Como conclusión se han clasificado los sistemas de personalización de contenidos Web definidos en el estado del arte, de acuerdo a los mecanismos de personalización tales mecanismos incluyen: La representación de perfiles de usuario. Los métodos empleados pata lograr la recomendación de contenidos a medida de las preferencias de los usuario. Los mecanismos de personalización para la recomendación de contenidos Web. En los siguientes capítulos abordamos la descripción del método para la personalización de contenidos web, la implementación de la herramienta en el contexto de e-gobierno, pruebas y conclusiones. 22 | P á g i n a
  • 31. Capítulo 4 : METODOLOGÍA PARA LA PERSONALIZACIÓN DE CONTENIDOS WEB 23 | P á g i n a
  • 32. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB En este capítulo se presenta la metodología para la personalización de contenidos Web para la realización de un sistema de recomendación de contenidos de e-gobierno con el propósito de promover un uso generalizado de las capacidades de personalización. Dado que nuestra metodología aplica un proceso de razonamiento semántico sobre las preferencias de los usuarios y los contenidos de e-gobierno son tres características fundamentales sobre los que asienta sus bases: la ontología que formaliza el conocimiento sobre el dominio de e-gobierno los perfiles que registran las preferencias de los usuarios. la estrategia de recomendación basándose en el razonamiento semántico con la utilización de reglas de inferencia (SWRL). 4.1 INTRODUCCIÓN La metodología para la personalización de contenidos Web se conforma de cuatro fases que se fundamentan en las características anteriormente mencionadas con el fin de llevar a cabo la personalización de contenidos Web a través de reglas de inferencia que permitan asociar los contenidos de una ontología del dominio con las preferencias relevantes de un usuario. En primera instancia se consideró el desarrollo de una ontología de dominio debido a que los portales de gobierno actuales no tienen ontologías que describan sus contenidos, lo cual limitaba la estrategia de recomendación basada en reglas de inferencia la cual necesita de ontologías para realizar el razonamiento semántico. Nuestra metodología considera como primer fase el desarrollo de ontología de gobierno, como segunda fase la selección de atributos de ontología de usuario desarrollada por [Rojas 2009] con el fin de filtrar aquellos atributos que sirvan para perfilar a un usuario en el dominio de e-gobierno, como tercer fase la construcción de un catalogo de reglas de inferencia que se encargan del razonamiento semántico al asociar los contenidos de e- gobierno con el perfil de usuario y como última fase el desarrollo del sistema de personalización de contenidos Web, la metodología para la personalización de contenidos Web se puede observar en la Figura 4-1. Cabe mencionar que en esta sección se describe el proceso que conforma un prototipo para la personalización de contenidos Web, los detalles relativos al prototipo de software se presentan en el capítulo 5. Figura 4-1: Metodología para la personalización de contenidos Web. 24 | P á g i n a
  • 33. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB 4.2 FASE 1: DESARROLLO DE ONTOLOGÍA DE E-GOBIERNO Esta fase consiste en la generación de una ontología de gobierno que represente los contenidos de los portales gubernamentales mexicanos por el motivo que la estrategia de recomendación de contenidos Web se realiza a través de reglas de inferencia que permiten asociar los contenidos de una ontología de dominio con las preferencias del usuario, es decir, las reglas de inferencia seleccionan información de ontologías y no de texto plano. La motivación principal para el desarrollo de ontología de e-gobierno se debió a que los portales de gobierno actuales no tienen ontologías que describan sus contenidos, lo cual limitaba la estrategia de recomendación basada en reglas de inferencia la cual necesita de ontologías para realizar el razonamiento semántico. Para el desarrollo de esta fase se consideraron tres procesos: 1) Selección de portales gubernamentales, dedicado a obtener una muestra de los portales más representativos con respecto a la manera que presenta la información hacia el usuario, 2) Evaluación de portales gubernamentales, dedicado a la evaluación de los portales gubernamentales de acuerdo a la selección del proceso uno con el fin de identificar aquellos portales gubernamentales que cuenten con las características del buen diseño de portales gubernamentales en cuanto estructura y organización, 3) Creación de ontología de e-gobierno, dedicado a la generación de la ontología de e-gobierno partiendo de la iniciativa de los portales gubernamentales seleccionados y evaluados no tienen ontología que representen sus contenidos tomando en cuenta la metodología para la creación de ontologías por [F. Noy 2005]. Los procesos involucrados en la fase 1 se esquematizan en la Figura 4-2. Figura 4-2: Fase 1-Desarrollo de ontología de e-gobierno. 4.2.1 PROCESO 1: SELECCIÓN DE PORTALES GUBERNAMENTALES Este proceso consiste en la selección de portales gubernamentales que presenten su información en la Web de manera que el usuario pueda encontrarla fácilmente con el fin de adquirir una muestra de los portales gubernamentales más representativos de la información y sirvan de base para la generación de la ontología de e-gobierno. Para tal propósito se consideró el índice de Gobierno Electrónico Estatal (IGEE 2009) de los portales gubernamentales de los 31 estados y un Distrito Federal que se presento en el ranking de [Política Digital 2009]. La medición del IGEEE 2009 toman en cuenta las característica de: información, interacción, integración y participación con tales características permiten ofrecer una aproximación integral sobre la utilidad que ofrece el portal gubernamental a los ciudadanos, la evaluación dio un total de 16 mil 992 datos para la consolidación del IGEE 2009, en la Tabla 4-1 se detalla cada una de las características para el ranking con sus atributos y descripción correspondiente. 25 | P á g i n a
  • 34. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB Tabla 4-1: Características evaluadas por ranking de [Política Digital 2009] CARACTERISTICA: 1. Información ATRIBUTO DESCRIPCIÓN Información completa y El portal debe contar con información completa y detallada detallada: sobre fuentes de información, estadísticas, etc., que exista en la página de inicio varios bloques de información relacionados por ejemplo con noticias, trámites o eventos. Información Multimedia: Integración de soporte o de procedimientos que emplean sonidos, imágenes o textos para difundir información, especialmente de forma interactiva. Organización de la Forma en que se encuentra la información dentro del sitio Web. Información: Accesibilidad de la Fácil acceso a la información dentro del portal. Información: Transparencia: Acceso público a una información completa, exacta y clara acerca del gobierno. CARACTERISTICA: 2. Interacción ATRIBUTO DESCRIPCIÓN Contacto con Webmaster El portal debe contar con información completa y detallada y atención ciudadana: sobre fuentes de información, estadísticas, etc., que exista en la página de inicio varios bloques de información relacionados por ejemplo con noticias, trámites o eventos. Obtención de formatos en Obtención de formatos que se puedan bajar y guardar en línea: nuestro equipo para realizar algún trámite o llenarlo en línea. Búsquedas de Realizar búsquedas dentro del portal para encontrar de manera Información: más rápida información. Personalización: Adaptar el portal conforme a preferencias o gustos. Información dinámica: Evaluar la interactividad dentro del portal de gobierno. Obtención de formatos en Obtención de formatos que se puedan bajar y guardar en línea: nuestro equipo para realizar algún trámite o llenarlo en línea. CARACTERISTICA: 3. Transacción ATRIBUTO DESCRIPCIÓN Pagos en línea: Evaluar si dentro del portal se pueden realizar transacciones en línea. Seguridad: Evaluar la seguridad con la que cuenta el portal de gobierno para llevar a cabo transacciones en línea. CARACTERISTICA: 4. Integración ATRIBUTO DESCRIPCIÓN Integración vertical: Existe información de otros gobiernos tanto federal como municipal. Integración horizontal: Evaluar si el portal da información completa sobre el gobierno estatal. Integración transaccional Realizar transacciones en línea de otras dependencias o carrito de compras: gubernamentales y niveles de gobierno. 26 | P á g i n a
  • 35. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB CARACTERISTICA: 5. Participación ATRIBUTO DESCRIPCIÓN Debates en línea de Se llevan a cabo discusiones o debates con funcionarios. asuntos públicos: Voto electrónico: Se lleva a cabo algún tipo de votación electrónica. CARACTERISTICA: 6. Diseño y Estilo DESCRIPCIÓN: Evaluar el diseño y estilo que cuenta el portal gubernamental. En la Figura 4-3 se muestra el producto final de la evaluación de los portales gubernamentales, destacando las puntuaciones de cada característica evaluada: información, interacción, transacción, integración y el número de posición correspondiente a cada estado. Figura 4-3: Índice de gobierno electrónico estatal 2009 [Política digital 09]. 27 | P á g i n a
  • 36. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB 4.2.2 PROCESO 2: EVALUACIÓN DE PORTALES GUBERNAMENTALES Este proceso consiste en la evaluación de portales gubernamentales con las características del buen diseño de portales gubernamentales. Tales características se tomaron en cuenta para evaluar los portales gubernamentales para obtener aquellos que presenten su información de acuerdo a las características consideradas para el buen diseño de portales gubernamentales con el fin de generar una ontología de e-gobierno con la información que muestran los sitios Web gubernamentales pero solo con aquellos que presenten un buen nivel en estructura, organización y facilidad de acceso a la información de interés de los usuarios. El diseño de un portal gubernamental debe tomar en cuenta la experiencia que vivirá el usuario por sus páginas y lograr que encuentre lo que está buscando de manera simple [Aceves 2008]. Por lo que se considera ciertas características como: Diseño y estructura, arquitectura, tramites y servicios, accesibilidad, participación ciudadana y transparencia que determinan si un portal gubernamental tiene una buena estructura y organización en su contenido y diseño. En la Tabla 4-2 se describen las características: diseño y estructura, arquitectura, trámites y servicios, accesibilidad, participación ciudadana y transparencia para el desarrollo de portales gubernamentales centrados en el usuario y en estándares de certificación, cada una con su correspondiente descripción. Tabla 4-2: Características para el desarrollo de portales gubernamentales. CARACTERÍSTICA DESCRIPCIÓN 1. Diseño y estructura Se refiere a los conceptos para determinar la composición visual de un sitio (look and feel). Diseño visual: identidad del portal Estructura: la forma en que será presentada la información. Multimedia: nos permite tener un portal dinámico (animación, audio y video). Imágenes con intención: utilizar imágenes representativas y contar con un texto descriptivo. Estándares de estructura: XHTML, XML. Estándares de presentación: diseño con hojas de estilo CSS. 2. Arquitectura De acuerdo a [Rosenfeld 00], la arquitectura de la información para la Web se compone de cuatro componentes. a) Sistema de organización: Se refiere a las formas en que la información y contenidos de un sitio se catalogan. b) Sistema de navegación: Son los esquemas mediante los cuales el usuario se moverá a través del sitio. 28 | P á g i n a
  • 37. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB c) Sistema de rotulado (labeling): Se refiere a la manera en que se representará la información de un sitio de forma que el usuario comprenda la terminología. d) Sistema de búsqueda: Es la forma en que los usuarios tratarán de localizar la información en el sitio. 3. Trámites y servicios Una de las formas en que el ciudadano percibe la transformación de un gobierno a e-gobierno está en la posibilidad de realizar trámites y servicios en línea. Se deben de cuidar los siguientes aspectos: Facilidad para encontrar y acceder al trámite o servicio. Estado del proceso del trámite. Diseño de formularios. Esquemas de seguridad. Flexibilidad y eficiencia en el uso. 4. Accesibilidad La accesibilidad Web significa que personas con algún tipo de discapacidad pueden hacer uso de la Web, es decir, al hablar de accesibilidad Web se hace referencia a un diseño que va a permitir que estas personas puedan percibir, entender, navegar e interactuar con la Web, independientemente de sus limitantes físicas o técnicas. 5. Participación En cualquier gobierno democrático, la participación ciudadana Ciudadana debe representar uno de los principales objetivos a fomentar. Para lograr la participación ciudadana se debe: o Promover y fomentar la participación a través de la publicación de información dirigida a diferentes sectores de la sociedad (e- Information). o Facilitar consultas vía electrónica donde los ciudadanos pueden enterarse de las acciones de sus autoridades, así como deliberar opiniones sobre éstas (e-Consultation). o Realizar peticiones para convertirse en parte proactiva en las decisiones, o en su caso recibir una respuesta directa sobre algún asunto específico (e-Decisión making). 6. Transparencia La transparencia de la información es una consecuencia de la participación ciudadana. La transparencia de la información comprende: a) La publicación de información relevante para la sociedad relacionada con el hacer y qué hacer de una entidad pública, alineándose generalmente a una ley o regulación de acceso a la información. 29 | P á g i n a
  • 38. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB b) La fácil localización (findability) de datos relacionados con la labor de una dependencia gubernamental por parte de cualquier usuario. Si se requiere información adicional deberá ser solicitada en línea. c) La presentación de información en un lenguaje claro, de manera que cualquier ciudadano pueda comprender el significado de los contenidos, independientemente de su experiencia en el uso de herramientas tecnológicas. De acuerdo en la evaluación de portales gubernamentales en [Política digital 09] se tomaron los primeros ocho portales de gobierno estatales: Nuevo León, Sinaloa, Puebla, Estado de México, Distrito Federal, Yucatán, Veracruz y Guerrero, estos se reevaluaron tomando en cuenta las características del diseño de portales gubernamentales: Diseño y estructura, arquitectura, tramites y servicios, accesibilidad, participación ciudadana y transparencia. Se consideró una ponderación de 0 a 1 tomando en cuenta sí cumplían con todas o algunos de los atributos de evaluación. En la Tabla 4-3 se muestra los resultados obtenidos para cada portal gubernamental estatal. Tabla 4-3: Evaluación de portales gubernamentales de acuerdo a las características de diseño de portales gubernamentales. Distrito Federal Nuevo León Estado de Guerrero Veracruz Yucatán México Sinaloa Puebla Diseño y estructura Diseño visual 1 1 1 1 1 1 1 1 Estructura 1 1 1 1 1 1 1 1 Sistema visual 1 1 1 1 1 1 1 1 Iconografía 1 1 1 .5 .8 0 1 1 Multimedia .5 .5 .5 .8 .8 .5 1 .5 Imágenes con intención 1 1 1 1 1 1 1 1 Estándares de estructura 1 .5 1 1 1 1 1 1 Estándares de presentación 1 1 1 0 1 1 0 1 Arquitectura Sistema de organización 1 .8 .8 1 1 .8 .8 1 Sistemas de navegación 1 1 1 1 1 1 1 1 Sistema de rotulado 1 1 1 1 1 1 1 1 Sistema de búsqueda .8 .8 .5 .8 .5 .5 .3 .5 Trámites y servicios 1 1 .5 1 .8 1 .8 1 30 | P á g i n a
  • 39. «METODOLOGÍA PARA LA PERSONALZIACIÓN DE CONTENIDOS WEB Accesibilidad Nivel A (1 punto) 1 0 0 0 0 0 0 0 Nivel AA (2 puntos) Nivel AAA (3 puntos) Participación ciudadana Civismo 0 0 1 1 1 0 1 0 Audiencias publicas 1 1 1 1 1 1 1 1 Consulta de opiniones 1 1 0 0 1 1 0 1 Interacción sincrónica 1 0 1 1 1 1 0 1 Transparencia 1 1 1 1 1 1 1 1 Puntuación 17.3 14.6 15.3 15.1 16.9 14.8 13.9 16 4.2.3 PROCESO 3: CREACIÓN DE ONTOLOGÍA DE GOBIERNO Este proceso consiste la creación de una ontología de e-gobierno tomando en cuenta una metodología para la creación de ontologías con la iniciativa de que no se encontró una ontología en los portales gubernamentales que se tomaron de la actividad de selección de portales gubernamentales. Con la falta de la ontología se consideró buscar alguna herramienta disponible en la Web para la generación de ontologías, en el anexo A1 se muestran las herramientas utilizadas y el resultado que arrojaron, se usaron tres herramientas Ontogen, TouchGrahp y Web Data Extracto. Sin embargo el resultado propuesto por las herramientas no fue satisfactorio, ya que no generaban una ontología, extraían palabras clave o enlaces de ligas externas, hasta el momento no se encuentran herramientas que generan automáticamente una ontología, necesitan de la intervención de un experto o algún usuario que tenga conocimiento en el área, para generar la base de la ontología. Con esta perspectiva se consideró generar una ontología de dominio para pruebas de la investigación, debido a que el objetivo de la tesis no es construir una ontología de dominio, pero sí utilizar alguna. La ontología cubrirá el dominio de e-gobierno con el fin de realizar recomendaciones a usuarios sobre información de portales gubernamentales, para lo cual fue necesario observar cada portal gubernamental para extraer la guía de contenido que abordan y las categorías que existen en cada contenido para realizar una clasificación, ordenación y búsqueda de relaciones entre los conceptos identificados, para lo cual se utilizo una metodología para la creación de ontologías que se describe en el siguiente punto. 31 | P á g i n a