El documento compara la recuperación ideal vs real de información en sistemas de recuperación. La recuperación ideal recupera solo documentos relevantes mientras que la recuperación real puede incluir ruido o silencio documental. También describe los componentes clave de un sistema de recuperación de información y los métodos para evaluar su desempeño.
Recuperación ideal vs. recuperación real en un SRI
1. Tarea N° 7 SRISRI
Recuperación ‘ideal’Recuperación ‘ideal’ vsvs Recuperación ‘real’Recuperación ‘real’Recuperación ideal Recuperación ideal vs.vs. Recuperación realRecuperación real
REPÚBLICA BOLIVARIANA
DE VENEZUELA
UNIVERSIDAD YACAMBÚ
FACULTAD DE HUMANIDADES
INFORMACIÓN Y
DOCUMENTACIÓN
AUTORA: MARTHA JIMÉNEZ
HID‐132‐00217V
É
DOCUMENTACIÓN
DOCENTE: PROF. ALDO MÉNDEZ
ASIGNATURA: PROCESOS
TÉCNICOS EN BIBLIOTECA
Noviembre, 2015
2. EL SISTEMA ‘IDEAL’EL SISTEMA IDEAL
De acuerdo con Rocchio1 “en un
sistema ideal los documentos
relevantes se recuperan antes que
los documentos no relevantes y la
evolución de la exhaustividad de estaevolución de la exhaustividad de esta
operación de búsqueda se puede
representar en un gráfico”.p g
1 Recuperación de información: modelos, sistemas y evaluación / Francisco
Javier Martínez Méndez. – Murcia: KIOSKO JMC, 2004. Disponible en:
https://digitum.um.es/xmlui/bitstream/10201/4316/1/libro-ri.PDF (consultado el
15 de noviembre de 2015).
3. EL SISTEMA ‘IDEAL’EL SISTEMA IDEAL
Un ejemplo de búsqueda “ideal” es
aquella en la que el usuario realiza q q
una búsqueda en la que recupera
diez documentos, de los cuales ,
todos son relevantes y en toda la
base de datos sólo están estos diezbase de datos sólo están estos diez
documentos relevantes.
4. EL SISTEMA ‘IDEAL’
Un modelo de recuperación de informa‐
EL SISTEMA IDEAL
Un modelo de recuperación de informa
ción es una idealización o abstracción del
proceso real de recuperación. Consta de:
• Un modelo de representación de
documentos (datos).
• Un modelo de representación de
consultas de los usuarios (análogo al
lenguaje de consultas de un modelo de
base de datos)
• Un entorno de modelado de las
relaciones entre documentos y consultas.
5. EL SISTEMA ‘REAL’
El ruido y el silencio documental son
EL SISTEMA REAL
El ruido y el silencio documental son
fenómenos que se pueden dar en el
proceso de búsqueda de información. p q
• Silencio documental se produce cuando
la estrategia de búsqueda no recupera g q p
documentos relevantes, los cuales
quedan almacenados en la base de datos.
• Ruido documental se produce cuando
la estrategia de búsqueda devuelve
demasiados resultados no pertinentes,
irrelevantes.
6. EL SISTEMA ‘REAL’
Ejemplos de búsquedas “reales”:
EL SISTEMA REAL
Ejemplos de búsquedas reales :
• El usuario realiza una búsqueda en la
que recupera diez documentos de losque recupera diez documentos, de los
cuales todos son relevantes y la
cantidad de documentos relevantes en
la base de datos es de 20.
• El usuario realiza una búsqueda en laEl usuario realiza una búsqueda en la
que recupera diez documentos, de los
cuales sólo la mitad son relevantes.
7. EL SISTEMA ‘REAL’
Otro ejemplo:
EL SISTEMA REAL
Otro ejemplo:
En la base de datos existen 40 documentos
relevantes para la consulta y el sistemarelevantes para la consulta, y el sistema
obtiene 20 documentos relevantes:
• La exhaustividad es de 0 5 (se obtiene de• La exhaustividad es de 0,5 (se obtiene de
dividir el número de documentos relevantes
recuperados entre el total de relevantes
i t t l l ió )existentes en la colección).
• La precisión es de 1 (se obtiene de dividir el
número de documentos relevantesnúmero de documentos relevantes
recuperados entre el número total de
recuperados).
8. EL SISTEMA ‘REAL’
De acuerdo con Baeza Yates2:
EL SISTEMA REAL
De acuerdo con Baeza‐Yates2:
“La representación y la organización
d b í l d fá ldeberían proveer al usuario de un fácil
acceso a la información en la que se
encuentre interesado Desafortunadaencuentre interesado. Desafortunada‐
mente, la caracterización de la necesidad
informativa de un usuario no es un
problema sencillo de resolver”.
22ESTUDIO Y EVALUACIÓN DE LOS SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN. Nora La
Serna, Ulises Román, Norberto Osorio, Oscar Benito, Jimy Espezúa, Hugo Vega. Facultad de Ingeniería de
Sistemas e Informática, Universidad Nacional Mayor de San Marcos, Lima-Perú. Disponible en:
http://sisbib.unmsm.edu.pe/bibvirtualdata/publicaciones/risi/n1_2004/a07.pdf (consultado el 15 de noviembre
de 2015).
9. SISTEMA DE RECUPERACIÓN
DE INFORMACIÓN (SRI)
Los Sistemas de Recuperación de Informa
DE INFORMACIÓN (SRI)
Los Sistemas de Recuperación de Informa‐
ción son el conjunto de componentes
(software, hardware, personas, procedi‐( , , p , p
mientos, datos, y comunicaciones) que
interactúan, y cuyos objetivos son:
• El almacenamiento óptimo de grandes
volúmenes de información.
• La recuperación eficiente de la
información ante las consultas de los
usuarios.
10. SISTEMA DE RECUPERACIÓN
DE INFORMACIÓN (SRI)
En un SRI habitualmente no se trabaja
DE INFORMACIÓN (SRI)
En un SRI habitualmente no se trabaja
con los documentos propiamente dichos,
sino con una representación más mane‐
jable de los mismos.
La necesidad de información suele estar
expresada con una consulta y, por tanto,
recuperar material que satisfaga esa ne‐
id d d i lcesidad se traduce en encontrar material
que sea lo más parecido posible a los
términos clave indicados en la consultatérminos clave indicados en la consulta.
11. PROCESO DE RECUPERACIÓN
DE INFORMACIÓN
Un proceso de recuperación de informa‐
DE INFORMACIÓN
p p
ción comienza cuando un usuario tiene
necesidad de información y plantea una
consulta al sistema.
Previamente, en dicho sistema ha sido
almacenada la información de manera
estructurada.
El sistema consulta la base de datos bajo
ecuaciones de búsqueda.
Este proceso se lleva a cabo mediante un
lenguaje de interrogación adecuado.
13. EVALUACIÓN DE LOS SRI
Tres tipos de medidas son utilizadas paraTres tipos de medidas son utilizadas para
evaluar los SRI:
• Relevancia Mide la proximidad entre los• Relevancia. Mide la proximidad entre los
documentos recuperados y la formulación
de la necesidad informativa.
• Exhaustividad. Mide la proporción de
documentos relevantes recuperados.documentos relevantes recuperados.
• Precisión. Mide la proporción de docu‐
mentos recuperados que son relevantes.mentos recuperados que son relevantes.
Refleja la eficacia de las búsquedas
14. TOMAR EN CUENTA
El objetivo es encontrar documentos queEl objetivo es encontrar documentos que
se parezcan lo máximo posible a la
consulta formulada.
Para ello es necesario tener en cuenta los
elementos clave que permiten hacer la q p
búsqueda determinando un mayor grado
de pertinencia y precisión, como son:
• Índices
• Palabras clave
• Tesauros
• Ruido y silencio documental
15. REFERENCIAS
• ESTUDIO Y EVALUACIÓN DE LOS SISTEMAS DE RECUPERACIÓN DE INFORMACIÓN. Nora La
Serna, Ulises Román, Norberto Osorio, Oscar Benito, Jimy Espezúa, Hugo Vega. Facultad de
Ingeniería de Sistemas e Informática, Universidad Nacional Mayor de San Marcos, Lima-Perú.
Di ibl htt // i bib d /bib i t ld t / bli i / i i/ 1 2004/ 07 dfDisponible en: http://sisbib.unmsm.edu.pe/bibvirtualdata/publicaciones/risi/n1_2004/a07.pdf
(consultado el 15 de noviembre de 2015).
• TÉCNICAS DE INDEXACIÓN Y RECUPERACIÓN DE DOCUMENTOS UTILIZANDO REFERENCIAS
GEOGRÁFICAS Y TEXTUALES. Diego Seco Naveiras. UNIVERSIDADE DA CORUÑA
DEPARTAMENTO DE COMPUTACIÓN. 2009. Disponible en:
http://lbd udc es/Repository/Thesis/576418076R pdf (consultado el 15 de noviembre de 2015)http://lbd.udc.es/Repository/Thesis/576418076R.pdf (consultado el 15 de noviembre de 2015).
• Rendimiento de 8 sistemas de recuperación de información del espacio web español. Carlos Benito
Amat. El profesional de la información, v. 14, n. 5, septiembre-octubre 2005. Disponible en:
http://www.elprofesionaldelainformacion.com/contenidos/2005/septiembre/3.pdf (consultado el 15 de
noviembre de 2015).
• Sistemas de Recuperación de Información (SRI). Tópicos avanzados de Bases de datos. Cristina
Bender - Claudia Deco. Universidad Nacional de Rosario. Disponible en:
http://escritura.proyectolatin.org/topicos-avanzados-de-bases-de-datos/cap3-sistemas-de-
recuperacion-de-informacion-sri/ (consultado el 15 de noviembre de 2015).
• Recuperación de información: Silencio y ruido documental. Lía González . BibliPos. Disponible en:p y p
http://www.bibliopos.es/recuperacion-de-informacion-silencio-y-ruido-documental/ (consultado el 15 de
noviembre de 2015).
• Recuperación de información: modelos, sistemas y evaluación / Francisco Javier Martínez Méndez. –
Murcia: KIOSKO JMC, 2004. Disponible en: https://digitum.um.es/xmlui/bitstream/10201/4316/1/libro-
ri.PDF (consultado el 15 de noviembre de 2015).
• Fuente de las imágenes: http://psicopsi.com/Humor-Psi-Diferentes-estados-de-animo (consultado el 15
de noviembre de 2015).