Este documento presenta una guía de usuario para una aplicación llamada LinkTesApp, la cual mejora la indización y recuperación de información en LinkedIn mediante la implementación de un tesauro. La aplicación actúa durante la creación y edición de perfiles de usuario para la indización, y durante las búsquedas de perfiles, empleos u otros elementos para la recuperación de información. Al crear un perfil nuevo, guía al usuario a través de una estructura jerárquica para seleccionar un sector laboral y subsectores de manera más espec
2. Índice
Introducción .................................................................................................................. 3
Definición de tesauro......................................................................................... 3
Para qué sirve …................................................................................................. 3
Tipos de relaciones ........................................................................................... 4
Explicación de la aplicación ….................................................................................... 8
Breve descripción ….......................................................................................... 8
Explicación del etiquetado en perfil del usuario …..........................................8
Explicación de las búsquedas ….................................................................... 10
Comunicación entre usuarios y moderador ….............................................. 11
Conclusión …............................................................................................................... 12
2
3. Introducción
- ¿Qué es un tesauro? Breve definición
Con esta nueva herramienta usted podrá encontrar todo tipo de empleos, cursos o eventos que
se encuentren disponibles en el mercado de una forma más fácil y directa.
Definición de Tesauro: Un tesauro se puede definir como un vocabulario controlado con el que
se pueden traducir el contenido de los documentos expresados en lenguaje natural a un
lenguaje documental, evitando la ambigüedad del primero y representando los conceptos de
forma unívoca.
Estos tesauros estructuran palabras que representan conceptos de tal manera que los usuarios
puedan consultar y recuperar la información que requieren sin necesidad de ser expertos en un
tema, es decir, utilizando un lenguaje natural.
En concreto para los usuarios de cualquier comunidad, el tesauro que se propone permite que
la comunidad creadora del mismo, a través de una herramienta de comunicación como puede
ser un foro, un chat, etc., pueda establecer términos unívocos para cualquier concepto: tanto
aquellos en los que puede haber discusión como para aquellos en los que está todo el mundo
de acuerdo. Debe tener actualización constante, permitiendo introducir y/o suprimir términos y
servir de nexo de unión entre el documento y el usuario. En el caso de nuestra aplicación, la
única cortapisa que se le pondría a la libre expresión de los usuarios sería la existencia de un
grupo de moderadores que serían los encargados de la elección de una base de términos
dentro de los sectores existentes en la Red LinkedIn. Establecerían igualmente la jerarquía,
asociación, equivalencia o sinonimia de los mismos y serían los encargados de aceptar,
rechazar o modificar los términos propuestos por los usuarios. Tendrían potestad para ello al
tratarse de documentalistas especializados en las diferentes disciplinas. Este grupo de
moderadores o documentalistas estarían en continuo contacto entre ellos para debatir la
adhesión de ciertos términos al tesauro, ya que algunas proposiciones pueden hacer dudar a
los profesionales y por lo tanto las decisiones se tomarían por consenso. En el caso de seguir
existiendo dudas, el grupo de moderadores puede contactar con el usuario para la explicación
del término propuesto, así como la consulta a alguien exterior a la Red que sea especialista en
la materia y que pueda cerciorar el buen uso o no del mismo.
- ¿Para qué sirve?
Un tesauro dentro de una red social tendría varias funcionalidades que en general coinciden
con el tesauro tradicional. Éstas son las siguientes:
La primera misión es eliminar la ambigüedad del lenguaje en la disciplina o área temática a la
que pertenecen los términos que lo componen, es decir, en el mundo laboral
fundamentalmente, (LinkedIn), pero también en el de las relaciones sociales (Facebook,
3
4. Twitter, Tuenti). Pero si esta fuera su única utilidad no estaría justificada su elaboración, pues la
inversión a realizar en tiempo y esfuerzo no estaría compensada, ya que un simple listado
alfabético de términos controlados con establecimiento de sinonimias cumpliría esta misión.
Lo que precisamente define a un Tesauro, es el siguiente paso, es decir la jerarquía construida
con sus términos. Su elaboración se justifica por las ventajas adicionales, tanto en la indización
(etiquetado de documentos) como en la recuperación de documentos que proporciona su
estructura jerárquica.
Dicha estructura jerárquica nos permite contextualizar cada uno de los términos, es decir, la
visualización de la jerarquía posibilita observar con un simple golpe de vista términos de
afinidad relacionados según el grado de generalidad-especificidad de sus significados. Esta
característica ayuda a ampliar la información sobre cada uno de los términos, es decir ayuda al
usuario a tener más información sobre que término es el que quiere usar.
Por otra parte, un Tesauro aporta valores añadidos a la hora de la recuperación de documentos
y es precisamente el uso de la estructura jerárquica lo que va a facilitar dicha recuperación. A
una herramienta documental de este tipo se le saca el máximo rendimiento en una base de
datos informatizada, gestionada con un programa informático que permita la recuperación de
información utilizando su jerarquía. Nuestra empresa visualiza a las redes sociales como bases
de datos donde cada comentario, fotografía o enlace colgado por un usuario conformarían la
base de datos.
Mediante la introducción de una búsqueda sobre cierta área, usted va a obtener una lista de
resultados ordenados por orden alfabético, habiendo descriptores o términos que estén
relacionados con la búsqueda, ya sea de modo jerárquico, de modo equivalente (sinónimos,
antónimos, homónimos, etc.) o de forma asociativa.
¿Pero qué es un descriptor? Es el término o símbolo autorizado y formalizado que figura en un
tesauro, que se utiliza para representar sin ambigüedad los conceptos contenidos en los
documentos y en las peticiones de recuperación de la información.
Los descriptores pueden ser simples o compuestos, y la AFNOR los define como palabra o
grupo de palabras retenidas en tesauro y elegidas entre un grupo de términos equivalentes
para representar sin ambigüedad una noción contenida en un documento o en una condición
de búsqueda documental.
- Relaciones
A continuación le explicamos cada una de las relaciones mencionadas anteriormente:
RELACIONES DE EQUIVALENCIA
Es la relación entre descriptores o términos preferidos y los no descriptores o términos no
usados en la indización referentes a un mismo concepto.
Esta relación cubre dos tipos de términos los sinónimos y los cuasi-sinónimos. Los sinónimos
son términos cuyo significado puede considerarse igual, por lo que son intercambiables, y
tienen diferente origen lingüístico:
4
5. - Términos populares y científicos
- Variantes para conceptos modernos
- Términos de uso actual y anticuado
"Países en vías de desarrollo"
Usado Por "Países subdesarrollados"
- Formas variantes de un término
"Sicología/Psicología"
- Términos originales de distintas culturas
- Abreviaturas y nombres desarrollados
- Forma dividida y no dividida
"Carbón" + "Minería"/ "Minería de carbón"
Se suelen considerar términos preferidos aquellos que más corrientemente son utilizados por
los usuarios
Los Cuasi-sinónimos son términos cuyo significado es considerado diferente en el uso común,
pero son tratados como sinónimos en la indización. Por ejemplo puntos de un continuo
"Humedad y Sequedad", o simplemente el término más genérico
"Ascensión vertical"
Usado por Ascensor
Usado por Montacargas
RELACIONES JERARQUICAS
Es la relación vertical entre todos los descriptores de una misma clase, expresada en términos
de subordinación de los conceptos en un doble sentido:
- Genero/especie
- Todo/parte
Basado en grados de superioridad y de subordinación; donde el término superior representa
una clase o un todo y los subordinados se refieren a las partes o especies de estos.
La reciprocidad se expresa mediante la notación:
TG (Término genérico)
TE (Término específico)
BT (Broad term)
NT (Narrow Term)
Líneas aéreas
TG Servicios de transporte
Servicios de Trasporte
TE Líneas aéreas
5
6. Por lo tanto podemos hablar de una relación asimétrica, en la que si A es inferior a B,
necesariamente B es superior a A. Cuyo descriptor cabeza de jerarquía será el "Top term". Si
un descriptor tiene un solo descriptor por encima de él, este es monojerárquico, si tiene dos o
varios es polijerárquico. Como regla general puede apuntarse que cada término subordinado
debe de referirse al mismo tipo de concepto que el término superior, que puede ser un objeto
del mismo, una acción, una propiedad:
Metales (clase de material)
TE Fundición (acción)
Relación genero/especie
Se aplica a acciones, propiedades y agentes
"Vertebrados"
TE Anfibios
TE Aves
TE Peces
TE Reptiles, etc.
Relación jerárquica todo/parte
En la asociación de ideas el nombre de una parte implica y evoca la del todo poseedor.
De modo que en esta relación la parte del todo funciona como término superior, mientras que la
parte lo hace como término subordinado.
Se aplica a objetos, a lugares geográficos, estructuras sociales, disciplinas y sus partes de
estudio:
Argentina
TGP Buenos Aires
Entrerios
Ejercito
TGP Cuerpos
TGP Divisiones
TGP Batallones
TGP Regimientos
Notación: TGP (Término genérico partitivo)
TEP (Término específico partitivo)
Relaciones de ejemplo
Es la conexión entre una categoría general de objetos expresada por un sustantivo común y un
ejemplo individual, que suele ser un nombre propio que sirve para representar a otros nombres
propios, que no se incluyen en el tesauro para no sobrecargar las categorías.
Regiones montañosas
TE Alpes
Himalaya, etc.
Relaciones polijerárquicas
Un concepto sobre bases lógicas puede pertenecer a más de una categoría, por lo tanto posee
relaciones polijerárquicas
Instrumentos de viento
TE Órganos
Instrumentos de teclado
6
7. TE Órganos
Como conclusión podemos decir que las relaciones jerárquicas se utilizan durante la búsqueda
para enriquecer la formulación de la pregunta, añadiendo a la búsqueda uno o más
descriptores superiores o inferiores para concretar la búsqueda.
RELACIONES ASOCIATIVAS
Indican relación o uniones en la significación de los descriptores. Son relaciones simétricas
entre dos descriptores, que son susceptibles de evocarse mutuamente por asociación de ideas.
Y simétrica pues si A se asocia a B, B se relaciona con A.
La notación utilizada es:
TR (Término relacionado)
RT (Related term)
VB (alemán)
Pueden reunir términos de la misma categoría o de categorías diferentes, los referentes a las
mismas son términos con significados superpuestos, tales como "barcos" y "buques", donde
cada uno de los términos puede ser objeto de una definición exacta. Sin embargo a veces se
les utiliza separadamente y de forma indistinta.
También pueden asociarse términos que tengan una relación de familia o derivativa:
Felinos
TE Tigres
TR León
Para términos pertenecientes a diferentes categorías se puede dar los casos:
- Una disciplina y el campo de estudio
Selvicultura
TR Bosques
Bosques
TR selvicultura
Maquetas de barcos
TR Barcos
Por tanto, facilita la búsqueda por asociación de ideas y distintos puntos de vista.
7
8. Explicación de la aplicación
- Breve descripción.
El principal objetivo de nuestra aplicación es mejorar la indización y recuperación de la
información en la Red profesional LinkedIn. Desde nuestra visión se asemeja a una
base de datos, donde cada documento sería el perfil de cada usuario, el perfil de cada
oferta de trabajo, de cada jornada o congreso, de cada empresa, etc.
Estaríamos hablando por tanto de dos aspectos de la información (indización y
recuperación de la información) que no por estar íntimamente relacionados son la
misma cosa, cada uno se da en la red social a un nivel distinto, es por eso que la
aplicación actúa en dos apartados distintos de la red social: la indización en la creación
y edición de los perfiles de usuario y la recuperación de la información en las
búsquedas de dichos perfiles.
La aplicación mejoraría la indización de los distintos perfiles, es decir de cada
documento, cuando el usuario se registra por primera vez (o se crea un perfil distinto) o
bien cuando el usuario quiere editar su perfil preexistente.
La aplicación mejoraría la recuperación de la información cuando el usuario hace
una búsqueda dentro de la red social, tanto de empleos, cursos, jornadas, usuarios o
empresas.
Como se ha podido observar se ha hecho mención a cursos y jornadas, asuntos que no
tienen un menú específico en la plataforma y creemos conveniente su aparición. Por
ello, se añadiría estos enlaces a los ya existentes (gente, actualizaciones, empleos,
empresas, respuestas, buzón, grupos) en la zona básica de búsqueda. Estas dos
nuevas opciones mejoraría la recuperación por parte del usuario de este tipo de
demanda y crearía así un nuevo elemento en nuestro tesauro.
Una vez explicado cuando actúa y donde actúa la aplicación que se propone, a
continuación en los siguientes dos puntos se explicará el cómo consigue la aplicación
dichos objetivos.
- Explicación del etiquetado en perfil del usuario.
Lo primero que habría que decir es que la aplicación sería de uso opcional. El usuario
es libre de elegir el uso de la misma o no. Es evidente que si decide no utilizarla estará
en desventaja con el resto de la comunidad al no poder disfrutar de los beneficios que
la herramienta le brinda.
Nuevo usuario
Cuando un nuevo usuario accede a registrarse en LinkedIn, tras completar una serie de
pasos relativos a sus datos personales, llega a una pantalla donde se le piden sus
datos profesionales, exigiendo la Red al usuario que escoja un determinado sector
8
9. laboral. Es justamente en este punto donde la aplicación se pondría en marcha. Se
pasaría de un simple menú con una serie de opciones a elegir, en nuestra opinión
bastante generales, a otro estructurado y jerarquizado donde cada opción que se nos
ofrece una vez elegida, nos ofrecería una serie de resultados que lógicamente serían
más específicos que el primero que se ha elegido. De esta forma cada concepto o
rama del saber se subdividiría en varias ramas más específicas, y así continuamente
hasta llegar al concepto más específico o nodo-hoja de lo que sería este árbol de
conocimiento.
El usuario una vez realizado este proceso, se puede encontrar con dos posibilidades:
1º Que quede conforme con las múltiples opciones que se le ofrecen,
2º Que considere que el sector o profesión en la que el se englobaría no exista y por lo
tanto decida crear un nuevo descriptor, o bien modificar las relaciones de equivalencia,
jerarquía o asociación del tesauro.
En el primer caso el usuario no tendría que hacer nada más, de esta manera la
aplicación ha conseguido con un escaso esfuerzo por parte del usuario, que su perfil
estuviese ahora indizado con mayor especificidad y por lo tanto que sea recuperado
más fácilmente por el resto de usuarios.
En este momento puede surgir un problema, que consiste en que el usuario seleccione
mal su descriptor, o bien que exista ambigüedad entre lo que el usuario estima que es
su sector o profesión en la que trabaja y la que consideran el resto de los usuarios. En
este caso sería materialmente imposible que los moderadores fueran modificando y
revisando el perfil de todos y cada uno de los miembros de la red social.
El segundo caso sería que el usuario quiera crear una nueva entrada en el tesauro, es
aquí donde la filosofía de la web 2.0 entra con fuerza en la aplicación, ya que la misma
en un principio consistiría en un tesauro simple y esquemático y serían los usuarios los
que con sus nuevas entradas fuesen conformando y completando el tesauro de
LinkedIn. Sin embargo somos conscientes de que no todos los usuarios serían capaces
de crear descriptores o conjunto de descriptores adecuados y más aún situarlos
exactamente en la rama o subrramas de la ciencia más adecuados. En resumen el
usuario no tiene porque dominar las relaciones jerárquicas, de equivalencia y de
asociación. Aquí es donde entra la labor de los moderadores, en estos casos el usuario
propone los términos, que se quedarían temporalmente en suspenso hasta que el
moderador decida si se añade o no al tesauro y de qué manera. Entran en este
momento conceptos como término admitido o término preferido, de tal forma que puede
ser que el usuario no dé directamente un término admitido del tesauro, sin embargo si
que puede dar un término relacionado. En este caso en los tesauros hay que elegir (lo
haría el moderador) un término admitido o preferido para un concepto determinado y el
resto serían términos relacionados. (Ejemplo: término admitido=arquitecto técnico.
Términos relacionados: perito, aparejador, ingeniero de la edificación.) Ello ayudaría a
eliminar la ambigüedad y obligaría a los usuarios a elegir un mismo término, para las
distintos nombres que hay para una misma profesión.
En relación con lo anteriormente dicho cuando un usuario busca su profesión o sector
profesional dentro del tesauro, en el esquema aparecerían los términos admitidos, pero
9
10. al situar el ratón encima de los mismos, automáticamente la aplicación nos mostraría
los términos relacionados de dicho término.*
Usuario ya registrado en LinkedIn
En la página principal de LinkedIn, cuando accedes a tu cuenta, en la parte superior
izquierda de la misma esta la pestaña de perfil, cuando el ratón sobrevuela por encima
de dicha pestaña la red social nos muestra varias opciones, entre ellas editar perfil,
pinchamos en esta opción y se muestra el perfil del usuario, en la parte superior del
mismo tenemos la foto y el nombre del perfil, justo a su derecha tenemos la opción de
pinchar en editar. Pinchamos y en el apartado ubicación y sector, dentro de sector nos
encontramos con un desplegable con los sectores que ya comentamos anteriormente.
De nuevo aquí se pondría en marcha la aplicación del tesauro como ya explicamos, se
ofrecerían más opciones de las que actualmente proporciona LinkedIn, y aparecerían
los desplegables por cada sector profesional. A partir de aquí el usuario tendría las
opciones que se explicaron para el nuevo usuario de la red social.
- Explicación de las búsquedas.
El usuario que haya instalado en su ordenador nuestra aplicación, tendría acceso a dos
tipos de búsquedas, una búsqueda directa tipo google y un browsing.
En la búsqueda directa se puede encontrar con tres situaciones distintas:
1º El usuario hace una búsqueda con el término que desea encontrar. Si éste se
encuentra en el tesauro se lo mostraría directamente.
2º El usuario hace una búsqueda con el término que desea encontrar. En este caso,
éste no es un término admitido, pero si es un término relacionado. Ejemplo: *el usuarío
busca por perito, el programa lo redireccionaría automáticamente a arquitecto técnico,
señalándole que este último es el término admitido, ya que es éste el que aparecería
en los perfiles de los usuarios.
3º El usuarío pone el término admitido, pero este no se encuentra en ninguna de sus
formas en el tesauro. En este caso, nuestra aplicación antes de no ofrecer ningún
resultado, redireccionaría la búsqueda a la búsqueda normal de LinkedIn y por tanto se
ofrecerían los resultados clásicos que ofrece la red social. También ofrecería la
posibilidad de añadir al tesauro esa necesidad de información en las mismas
condiciones que comentamos anteriormente.
El browsing, que traducido al español sería ojeo, está definido por Xia Lin como “un
proceso interactivo en el que uno puede visualizar grandes cantidades de información,
percibir o encontrar estructuras o relaciones, y seleccionar ítems centrando su atención
visual en ellos". En nuestra aplicación se mostraría al usuario como un árbol, donde
10
11. existirían unos primeros nodos que serían los sectores (mejorados) que la red social
nos proporciona dentro de su búsqueda avanzada hoy día. Sin embargo, cada sector
tendría un menú desplegable al lado con las múltiples opciones más específicas que
estarían dentro de ese término, y así sucesivamente hasta encontrar el que nos
interesa.
Este sistema en nuestra opinión es de gran utilidad cuando los usuarios no están
familiarizados con el contenido de la colección. Resulta útil a quienes tienen dificultad
para expresar su necesidad de información y favorece a los usuarios que buscan
relaciones jerárquicas (por ejemplo en forma de árbol) o bien semánticas o asociativas
a un tipo de información que es más fácil reconocer que describir.
Al igual que como dijimos antes, el usuario en este caso también tendriá la opción de
añadir un descriptor si es que no encuentra el que a él le gustaría en las mismas
condiciones antes descritas.
-Comunicación entre usuarios y moderadores
La comunicación entre los dos universos del tesauro, es decir usuarios y
moderadores, sería directa o indirecta:
1º Directa: esta herramienta permitiría que el usuario se comunicase directamente con
el equipo de moderadores preguntado, proponiendo o pidiendo consejo sobre como
usar la aplicación. En este caso podría proponer un nuevo término como vimos
anteriormente, proponer una nueva jerarquía, equivalencia o asociación de términos.
2º Indirecta: esta herramienta permitiría que el usuario se comunicase indirectamente
con el equipo de moderadores y con el resto de usuarios de la herramienta del tesauro,
dando su opinión sobre la nueva inclusión de términos en el mismo o sobre el cambio
nuevamente de relaciones de jerarquía, equivalencia o asociación de términos. Esto
permitiría una comunicación fluida entre los integrantes de la red social creando
entradas en el foro sobre diversos problemas que pudieran surgir con uno o más
términos del tesauro.
En el caso de la comunicación directa el usuario dentro de las posibilidades del equipo
de moderadores tendría una respuesta a sus preguntas y a sus propuestas, de tal
forma que si su propuesta es admitida se le mandaría un mensaje automático
confirmándole los cambios en el tesauro. Igualmente en el caso de que la propuesta no
sea admitida el moderador debería darle una razón de porque no se ha tenido en
cuenta su opinión.
En el caso del foro se intentaría nuevamente dar respuesta a todas las dudas o
preguntas que se formulasen en el mismo.
En función de las participaciones del usuario en ambos sistemas, y teniendo un
algoritmo que calcularía la cantidad y calidad de los comentarios, además de las veces
11
12. que ha sido tachado de inadecuado, el usuario iría obteniendo una puntuación, un
ránking, para que el resto de los usuarios y el moderador tengan un mayor nivel de
confiabilidad sobre los comentarios de ese usuario.
Conclusión
En resumen podemos decir que un tesauro dentro de una base de datos realiza una:
Reducción de los términos
Eliminación de la redundancia
Eliminación de la ambigüedad del lenguaje natural (sinonimia y polisemia)
Organización sencilla en una estructura predeterminada
De todo ello resulta una lista estructurada de conceptos en la que se explicitan las
relaciones entre ellos.
Por último la finalidad de todo el esfuerzo es conseguir una mayor y mejor recuperación de
todos los documentos que interesan, sin ruido ni silencio.
Esta aplicación conseguiría que los usuarios indizasen su perfiles de una forma más correcta y
específica de tal forma que el resto de usuarios pudiesen localizar sus perfiles con mayor
claridad y rápidez.
La filosofía del universo 2.0 entraría con fuerza en la posibilidad no sólo de escoger entre lo
que ofrece la herramienta, sino también en la capacidad de proponer nuevos términos, a través
de las herramientas de comunicación entre los usuarios y moderadores (foro y comunicación
directa) tanto en la creación de los perfiles como en la herramienta de búsqueda de los
mismos. Cada vez que se produzca una situación de este tipo, estará presente la figura del
moderador controlando todas las nuevas incorporaciones de términos.
De esta manera, usted se convierte en el principal creador de información mediante esta nueva
herramienta, contribuyendo así a formar parte de la gran red social que es LinkedIn.
12