3. La importante editorial Elsevier fue la
primera en detectar que existía una nueva
necesidad de información académica en
la Web y que, por tanto, se necesitaba
una nueva clase de sistemas de
Información para la Web.
En concreto, Elsevier concibió un sistema
capaz de indizar páginas web de manera
automática. Ese producto se llamó Scirus.
4.
5. Proponemos la siguiente tipología de
documentos académicos:
Tipo 1: Páginas web y documentos de
todo publicados en sitios de instituciones
académicas o científicas.
Tipo 2: Artículos de publicaciones
científicas tipo peer review .
Tipo 3: Trabajos académicos tales como
tesis doctorales o tesis de licenciatura.
6. Tipo 4: Documentos depositados en
repositorios científicos ya sean pre-prints,
post-prints, materiales didácticos, etc.
Tipo 5: Patentes
Tipo 6: Libros (monografías).
Los seis tipos de documentos anteriores se
solapan entre ellos.
Pese a todo, la distribución anterior nos
será útil aquí para situar en contexto a los
motores de búsqueda académicos.
7.
8. Una creación de la importante editorial
de revistas científicas holandesa Elsevier
que es parte, a su vez, del gigante
editorial anglo-holandés Reed-Elsevier,
editor de libros y revistas y productor de
bases de datos como Lexis-Nexis .
Dispone de otras dos grandes bases de
Datos: Science Direct y Scopus.
9. Scirus fue fundado en el año 2001 y, poco
a poco ha ido ampliando su campo de
acción incorporando sucesivamente
nuevas fuentes hasta convertirse en un
auténtico gigante y en el más completo
sistema de los tres. En un análisis realizado a
finales del año 2006 se constató que contenía
más de 300 millones de documentos. Otros
dos análisis previos confirmaron en su
momento que Scirus era, con mucha
diferencia más completo que Google Scholar
por lo que hacía a repositorios científicos del
tipo American Physical Society o PubMed.
10. Los inputs de Scirus, es decir, el origen de
los documentos que incluye en sus índices
son los siguientes:
Artículos de revistas: principalmente,
publicaciones académicas de la propia
editorial Elsevier más un amplio grupo de
publicaciones de tipo open access.
Son los documentos que Scirus agrupa bajo la
denominación Journal Sources en su página de
resultados y la opción del mismo nombre que se
puede marcar o desmarcar en su formulario de
búsqueda.
11.
Repositorios institucionales o
académicos: hasta un total de 18
repositorios, además el de tesis
doctorales de la red internacional NDLTD
y el de patentes de Lexis-Nexis .Decimos
"en teoría" porque las pruebas
demuestran que en realidad utiliza más
repositorios. Esta clase de documentos
está señala por Scirus bajo la
denominación Preferred Web Sources.
12.
Páginas y documentos publicados en
sitios web: en este caso se trata
exclusivamente de servidores de
universidades, de instituciones
académicas o de departamentos o
institutos de I+D de algunas empresas.
Desde el punto de vista del dominio. Este
grupo se identifica en Scirus como Other
Web Sources.
13.
14. Ha sido la empresa que ha revolucionado
la búsqueda y ha acabado afectando a los
hábitos de navegación. Ha empujado a los
directorios generalistas, como Yahoo o Dmoz.
La influencia de Google se ha dejado sentir
también en el primer modelo de negocio que
ha sido capaz de generar beneficios en la
Web: su sistema de anuncios AdWord y
AdSense, imitado también por sus
competidores.
15. Por último, prácticamente han creado el
análisis de enlaces. Lo cierto es que son
muchas cosas las que Google ha
aportado a la Web. La cuestión es que, en
su búsqueda de nuevas actividades, lanzó
Google Scholar con algunas ideas nuevas.
La más importante, sin duda, la de llevar a
la Web el análisis de citaciones.
16. De acuerdo con la documentación oficial los
inputs de Google Scholar consisten en lo
siguiente:
Artículos de revistas: se trata de artículos de
las editoriales académicas que han
aceptado formar parte del programa de
Google Scholarno, existe una documentación pública que detalle qué editoriales
son en concreto. Es fácil ver que hay una
amplia representación de ellas, esto no
substituye la buena práctica que consistiría
en ir publicando qué editoriales están en el
programa de Google Scholar.
17.
Libros: se trata de editoriales que han
aceptado formar parte de los contenidos
de Google Scholar, en este caso,
editoriales de libros. Tampoco disponemos
de forma pública de una lista de estas
editoriales. La segunda consiste en
acuerdos con bibliotecas para obras. En
general, señala que, en el caso que alguno
de los resultados de Scholar sea un libro, el
sistema nos remitirá a Google Books para su
examen. Entendemos que debemos incluir
aquí esta categoría documental porque
está integrada en las búsquedas de
Scholar.
18.
Sitios Web : Al igual que Scirus, incluye
documentos y páginas de sitios web
vinculados con el mundo académico.
La documentación oficial de Scholar no
explica cómo seleccionan estos sitios. Es
posible deducir, que debe utilizar un
sistema similar al de Scirus, a saber,
indizar sitio del tipo.edu, etc., sin de
partida para analizar y a partir de los
cuales encuentren otros, etc. En esta
categoría, Google Scholar incluye
también repositorios de e-prints como los
mencionados a propósito de Scirus.
19.
20.
21. La lista de inputs es simple: artículos de
revistas académicas procedentes de diversas
editoriales y sociedades científicas . Lo que no
indica Live Academic es cuántos títulos
de estas editoriales incluye, es decir, si incluye
todas sus publicaciones o solamente una parte.
Si Microsoft piensa tomar en serio su nuevo motor
de búsqueda no hay duda que deberá ampliar
su lista de "publishers" a varias bandas: editoriales
de otros países, pero también mayor número de
títulos de cada editorial.
22. Hasta hace poco, la Web había demostrado de sobras su
capacidad para actuar como un agente de primer orden.
Faltaba el elemento de la ciencia y de la información
académica. En esta nueva etapa que está abriendo los
motores ninguno de los tres actores haya considerado incluir
alguno de los aspectos de la Web semántica .Tal vez se trate
de iniciativas ambas demasiado tempranas como para que
puedan pensar en unirse. Será necesario que antes maduren
cada una de ellas por separado antes de que puedan
pensar siquiera en unir esfuerzos. De momento, las evidencias
son muy prometedoras.
23. Este trabajo ha sido financiado por el
Ministerio de Educación y Ciencia
(España) como parte del proyecto
HUM2004-03162/FILO.
24.
Codina, Lluís. (2006). "Motores de búsqueda para usos académicos:
¿Cambio de Paradigma?". ThinkEPI, Enero 2006. [Acceso:
http://www.thinkepi.net/repositorio/motores-de-busqueda-para-usosacademicos- ¿cambio-de-paradigma/]
Doldi, L. M.; Bratengeyer, E. (2005). "The web as a free source for
scientific information: a comparison with fe-based databases". Online
information review, v. 29, n. 4, p. 400-411
Giustini, D.; Barsky, E. (2005). " A look at Google Scholar, PubMed, and
Scirus: comparisons and recommendations" JCHLA/JABSC, 26, 2005, P.
85-89. [Acceso: http://pubs.nrc-cnrc.gc.ca/jchla/jchla26/c05-030.pdf ]
Grupo Digidoc. Web semántica y Sistemas de Información Documental.
Acceso: http://www.semanticaweb.net/
Jacsó, Peter. Péter's Digital Reference Shelf. December, 2006. [Acceso:
http://www.gale.com/reference/peter/ ]
Rovira, Cristòfol; Marcos, Mari-Carmen; Codina, Lluís (2007). "Repositorios
de publicaciones digitales de libre acceso en Europa: análisis y
valoración de la accesibilidad, posicionamiento web y calidad del
código". El Profesional de la Información , v. 16, n. 1, enero-febrero 2007.
[Acceso en: http://eprints.rclis.org/archive/00008668/ ]