SlideShare una empresa de Scribd logo
1 de 13
Descargar para leer sin conexión
Universidad Nacional de La Plata (UNLP)
La Plata - Argentina
Facultad de Informática
Representación de los Recursos dentro de una
Biblioteca Digital
Propuesta Técnica al Doctorado en Ciencias
Informática
Resolución 7ma. - 24/06/2010. Expediente: 3300-2042/10-000
Autor:
Jose Daniel Texier
dantexier@gmail.com
Directora:
Profa. Marisa De Giusti
6 de junio de 2011
1. Tema Principal (Objetivo General)
Representación de los recursos dentro de una biblioteca digital.
2. Introducción
El desarrollo de Internet y de las nuevas tecnologías de la información nos hace
pensar inminentemente en el cambio de época que estamos viviendo hoy en día en la de-
nominada, Era de la Información. Estas transformaciones son una novedad para nuestra
sociedad, la última ocurrió hace aproximadamente más de 200 años cuando la Revolu-
ción Industrial condujo a la humanidad del agrarianismo al industrialismo. La génesis del
cambio actual se puede observar en lo cultural, social, económico y tecnológico. En estos
años se observa que los niños y jóvenes crecen con un computador en sus manos y que los
adultos no, y estos adultos han vivido el antes y el después de la aparición de la Internet.
Por ello hoy se puede decir que quien posee la información tiene el poder. En comScore[1]
se muestran algunas estadísticas importantes:
Un 63.0 % de los usuarios de Internet son menores de 40 años.
Un 15.5 % de la población mundial tiene acceso a Internet, en Argentina está en
48.3 % y en Venezuela 31.1 %.
Los sitios más visitados a nivel mundial en estricto orden son: Google, Facebook y
Youtube.
Un 12.6 % del comercio electrónico que se realiza es el de libros y revistas, convir-
tiéndose éstos en los de mayor consumo.
Sólo el 6.2 % de la consultas en Internet son académicas y/o cientícas.
Estas estadísticas nos comprueban el gran auge de la Internet. Sin embargo, las
bibliotecas tradicionales ofrecen los documentos en soportes físicos que se facilitan a los
usuarios a través de servicios de préstamos y consultas. Esta tradicional política esta ale-
jando a la población de las bibliotecas porque las consultan que realizan de los ejemplares
que a veces no se pueden encontrar y muchas veces si se encuentran no están actual-
izados porque existen ediciones viejas. Por ello, han comenzado a surgir desde hace más
de una década el diseño y la creación de las bibliotecas digitales[2], es decir, se inició la
automatización de las bibliotecas tradicionales convirtiéndolas en bases de datos para ser
procesadas por sistemas o herramientas informáticas, cuyo propósito está dirigido a la
población en general.
Estamos evolucionando con respecto a la búsqueda y transmisión de la información,
puesto que se están sufriendo contracciones económicas, así como también concepciones
2
de vida distintos en el mundo permitiendo generar políticas de conservación del ambiente,
soluciones más económicas, un mejor acceso a la información, etc., lo que conlleva dejar
atrás el paradigma de buscar un libro y solicitarlo en la biblioteca. Una posibilidad que
concita interés en un grupo importante de personas es el acceso a contenidos (libros,
artículos, etc) a través de internet, con las comodidades que esto implica, a la vez que
este tipo de acceso posibilita una mejor preselección del material.
La tecnología ha permitido que el conocimiento se traslade a los soportes digitales
y eso ha permitido la consolidación de las bibliotecas digitales. Para cumplir con su rol
en la sociedad una BD debe:
1. Tener una colección de datos.
2. Poseer un sistema de ordenamiento de documentos.
3. Brindar servicios a una comunidad de usuarios.
El primer elemento consiste en tener una colección de documentos que si están o no
en formato electrónico es otra cosa; segundo se debe contar con un sistema de ordenamien-
to para los documentos, además de un sistema para almacenar y recuperar importantes
cantidades de información. La colección de documentos y el sistema de ordenamiento
pueden estar en forma electrónica pero eso no garantiza la existencia de una biblioteca
digital. Tercero se necesita una comunidad de usuarios a quienes servir, que tengan unas
necesidades y características determinadas. Si se tienen estos tres elementos se reconoce
una biblioteca digital.
Esta propuesta pretende dar un aporte cientíco y académico original para la es-
tandarización y fortalecimiento de las bibliotecas digitales para la sociedad, y aunque
existen numerosos proyectos relacionados con el tema, este estudio se centrará en el al-
macenamiento y recuperación de recursos digitales en repositorios y en la indexación de
la información.
La propuesta se desarrollará bajo la losofía del Open Access[3] porque reeja un
adelanto en el área de las bibliotecas digitales e intenta abrir el acceso a recursos académi-
cos. La importancia radica en la necesidad de: (a) establecer y mantener estándares que
permitan un crecimiento de ellas y (b) evitar redundancia de trabajo e información lo que
representaría un mejor servicio.
Gracias a iniciativas como Open Archives Initiative (OAI)[4], Online Computer Li-
brary Center (OCLC), International Federation of Library Associations (IFLA), Net-
worked Digital Library of Theses and Dissertations (NDLTD) se han logrado establecer:
Estándares de interoperabilidad.
Estándares para la catalogación de recursos.
Estándares para la preservación de los objetos digitales.
3
Este trabajo comenzará con la investigación en el Servicio de Difusión de la Creación
Intelectual (SeDiCI)[5], creado en el 2003, de la Universidad Nacional de la Plata (UNLP)
junto con los cursos del Doctorado que se irán tomando para mi formación académica. En
la actualidad, SeDiCI tiene como objetivo principal socializar el conocimiento generado
en las diferentes áreas académicas de la UNLP con el n devolver a la comunidad sus
esfuerzos mediante la creación de un repositorio institucional que consiste en una base
de datos compuesta por un grupo de servicios destinados a capturar, almacenar, ordenar,
preservar y redistribuir la documentación en formato digital que brinda un acceso abierto
a la documentación académica ofrecida.
SeDiCI está realizando investigaciones y desarrollando herramientas adecuadas en
las siguientes áreas: lenguajes naturales, compresión e indexación de archivos, catalo-
gación de documentos, almacenamiento y recuperación de recursos, repositorios semánti-
cos, gestión de herramientas multidiomas, portales Web, derechos de autor, etc.; lo cual
demuestra que están trabajando constantemente para seguir creciendo con la tecnología y
en acuerdo con la cantidad de información proveniente de los diferentes repositorios exter-
nos (aproximadamente 45 repositorios para abril del 2010) registrados internacionalmente
y la producción académica de la UNLP.
El tema principal de este estudio estará relacionado directamente con los repositorios
y las siguientes áreas: base de datos, modelado de datos, metadatos, almacenamiento e
indexación de los metadatos, XML y datos semiestructurados. La propuesta mejorará
la calidad del funcionamiento sintáctico y estructural del repositorio de SeDiCI lo que
redundará en benecio del usuario a la hora de realizar búsquedas de recursos y por tanto
mejores servicios.
3. Áreas
Bases de Datos (BD) convencionales y no convencionales; BD deductivas, BD Ac-
tivas, BD Objetuales y Objeto-Relacionales, BD Móviles, BD temporales y espaciales;
BD documentales y multimedia; Recuperación de información, Indexación y BD en Web;
Modelado de datos; XML y Datos Semiestructurados; Web Semántica y Ontologías.
4. Objetivos Especícos
1. Analizar el problema de la representación de recursos dentro de una biblioteca di-
gital.
2. Analizar las ventajas y desventajas de los distintos paradigmas de bases de datos
en cuanto a la representación de los recursos.
4
3. Proponer un modelo de datos exible para representar los recursos dentro de una
biblioteca digital, considerando al menos las siguientes características:
distintos formatos de metadatos para distintos tipos de recursos;
varias catalogaciones de un mismo recurso utilizando distintos formatos de
metadatos;
representación de entidades abstractas de forma independiente, permitiendo
identicarlas y reutilizarlas;
relaciones entre recursos;
relaciones entre entidades abstractas;
relaciones entre entidades abstractas y recursos.
4. Proponer una arquitectura en capas simple y clara que provea los niveles de abstra-
cción adecuados según los niveles de acceso requeridos.
5. Analizar las técnicas de preservación digital y determinar cuál es la más adecuada
para garantizar la preservación tanto de los recursos como de los objetos digitales.
6. Determinar la forma de indexación más adecuada para que la recuperación de los
recursos sea eciente y de buen redimiento. El espacio ocupado por el repositorio
debe mantenerse dentro de parámetros aceptables.
7. Desarrollar un prototipo para la representación de los recursos dentro de una bib-
lioteca digital en SeDiCI
5. Metodología de Investigación
La presente investigacion es exploratoria y empírica[6], dado que el tema escogido
ha sido poco estudiado hasta el momento, por ello se realizará una descripción sistemática
del problema para llegar al estado del arte del tema tratado.
Esta investigación permitirá determinar los requerimientos necesarios para hacer el
análisis y diseño respectivo, el cual conducira a la implementación del prototipo. De esta
manera se estará dando aporte original al tema.
Para la construcción del prototipo, se estudiaran las metodologías del Proceso Uni-
cado de Desarrollo de Software[7], del Desarrollo de Software Dirigido por Modelos[8] y
del Modelo para el Diseño de Hipermedia Orientado a Objetos (OOHDM)[9].
Una vez seleccionada la metodología de desarrollo de software, se procederá a la
construcción de cada una de las etapas para luego tener los resultados y conclusiones con
base en los objetivos especícos propuestos y las pruebas realizadas.
5
6. Desarrollo
El trabajo que se realizará consiste en el desarrollo de un prototipo que permita la
representación de los recursos dentro de una biblioteca digital en SeDiCI basado en el
cumplimiento de las siguientes premisas:
Lograr un modelo exible y expandible de representación de los recursos de una
Biblioteca Digital.
Realizar pruebas para determinar el modo óptimo de almacenamiento e indexación
de recursos.
El sistema tendrá un gran impacto en la implementación de búsqueda y recuperación
de información de la UNLP, otras universidades y los miembros de consorcios a los que
pertenece la UNLP.
7. Actividades por Objetivos Especícos
7.1. Analizar el problema de la representación de recursos dentro
de una biblioteca digital
Denir el concepto de recursos dentro de una biblioteca digital.
Estudiar cada una de las características en la representación de recursos.
Clasicar en categorías los problemas en la representación de recursos existentes en
SeDiCI.
Describir los problemas categorizados en la representación de recursos existentes en
SeDiCI.
7.2. Analizar las ventajas y desventajas de los distintos paradig-
mas de bases de datos en cuanto a la representación de los
recursos
Estudiar cada uno de los paradigmas de bases de datos existentes.
Realizar una matriz comparativa sobre la base de las ventajas y desventajas de los
paradigmas relacionados con la representación de los recursos.
Seleccionar el paradigma más idóneo para el dominio tratado.
6
7.3. Proponer un modelo de datos exible para representar los
recursos dentro de una biblioteca digital
Diseñar el modelo de datos para representar los recursos mediante la descripción de
las partes que lo compondrán.
7.4. Proponer una arquitectura en capas simple y clara que
provea los niveles de abstracción adecuados según los niveles
de acceso requeridos
Estudiar las diferentes opciones de arquitectura de capas existentes.
Diseñar un modelo de arquitectura de capas.
7.5. Analizar las técnicas de preservación digital y determinar
cuál es la más adecuada para garantizar la preservación tanto
de los recursos como de los objetos digitales
Estudiar las alternativas y técnicas de almacenamiento para los objetos digitales
(PDF, videos, fotos, etc.)
Exponer las razones de garantia de preservación entre los objetos digitales y los
recursos que los representan.
7.6. Determinar la forma de indexación más adecuada para que
la recuperación de los recursos sea eciente y de buen redi-
miento
Estudiar las diferentes formas de indexación.
Denir los parametros para una correcta recuperación de los recursos.
Seleccionar la forma de indexación adecuada para la propuesta.
7.7. Desarrollar un prototipo para la representación de los recur-
sos dentro de una biblioteca digital en SeDiCI
Seleccionar la metodología para la construccion del prototipo.
Diseñar el prototipo.
7
Implementar el prototipo.
Realizar pruebas con el prototipo.
8. Temas de Investigación
En la investigación, que se estará llevando a cabo para el desarrollo de la tesis
doctoral, se tienen los siguientes temas:
1. Base de Datos (BD):
BD convencionales y no convencionales.
BD deductivas.
BD Activas.
BD Objetuales y Objeto-Relacionales.
BD Móviles.
BD temporales y espaciales.
BD documentales y multimedia.
Modelado de datos.
NoSQL.
2. Bibliotecas Digitales:
Metadatos.
Repositorios.
Indexación.
Catalogación.
Recuperación de información.
Open Access.
Metadatos.
XML y datos semiestructurados.
Sistemas de información federados.
Indexación y BD en Web.
Arquitectura Orientada a Servicios y/o Web Services.
Web semántica y ontologías.
8
9. Posibilidades de Realización en el Ámbito del Tesista
El inicio del Doctorado está planicado, tentativamente, para el 06 de septiembre
del 2010. La propuesta contempla una primer etapa de cursada y obtención de los 45
créditos en dos años. Luego (en los dos años siguientes) desarrollar y culminar la tesis.
Para ello, contaré con mi formación como Ingeniero en Informática en la Universidad
Nacional Experimental del Táchira (UNET) y con una Maestría en Computación de la
Universidad de los Andes (ULA), en la cual trabajé en el área de Lenguajes de Progra-
mación y Compiladores. Asimismo, he trabajado como docente en las áreas de Lenguajes
de Programación de Java y C/C++ en cursos de pregrado.
En esta etapa estaré trabajando en conjunto con las personas que sostienen el SeDiCI
lo que facilitará la realización de investigación y desarrollo en el área de interés y que esto
a posteriori se vuelque para el mejoramiento de otros sistemas similares.
10. Antecedentes de la Dirección
La Ing. De Giusti propuso la creación del Servicio de Difusión de la Creación In-
telectual, SeDiCI a la UNLP en el año 2002, trabajó durante un año con la Comisión
de Interpretación y reglamento para la conguración del proyecto y actualmente dirige
este servicio. Participa en la organización de un repositorio a nivel nacional con el
Ministerio de Ciencia, Tecnología e Innovación Productiva de la Argentina. Las bib-
liotecas digitales son el centro de sus temas de investigación, particularmente en lo
relativo a la puesta en marcha, selección de contenidos y áreas prioritarias. Cuen-
ta con numerosas publicaciones vinculadas a la temática, los cuales pueden verse en:
http://www.sedici.unlp.edu.ar/difusion/difusion.php
La Dra. Silvia Gordillo tiene una gran experiencia en bases de datos que constituyen
un área central a esta propuesta, particularmente en bases de datos relacionales y orien-
tadas a objeto. La Profesora también cuenta con antecedentes profusos en las áreas de
recuperación de información y minería de datos. Cuenta con numerosas publicaciones en
estas áreas y en tópicos marcados como centrales en esta propuesta.
11. Actividades de Formación Propuestas
Los cursos que se realizarán según la oferta presentada por el postgrado y la prop-
uesta de formación planteada por la Directora y Codirectora son:
1. Año 2010:
Curso: Aspectos Legales de Gobierno Electrónico, Facultad de Informática
UNLP.
9
Curso: Monitorización y Optimización de Rendimiento en Sistemas de Cóm-
puto de Altas Prestaciones, Facultad de Informática UNLP.
Curso: Metodología de la Investigación cientíca, Facultad de Informática
UNLP.
Curso: Computación Móvil: Arquitectura y Aplicaciones, Facultad de Infor-
mática UNLP.
Curso: Introducción al Reconocimiento automático de Patrones, Facultad de
Informática UNLP.
2. Año 2011:
Curso: Seminario / Taller de Elaboración de Proyectos y Tesis Técnicas y
Herramientas, Facultad de Informática UNLP.
Curso: Gestión de Calidad según normas ISO. Aplicaciones a Software, Facul-
tad de Informática UNLP.
Curso: Base de Datos, Facultad de Informática UNLP.
Curso: Técnicas de Computación para la Web y Escalabilidad, Facultad de
Informática UNLP.
Curso: Ingeniería del Conocimiento, Facultad de Informática UNLP.
Curso: Administración de Proyectos de Software, Facultad de Informática
UNLP.
Curso: Tópicos de Ingeniería, Facultad de Informática UNLP.
12. Planicación
La investigación se desarrollará, principalmente, en tres momentos, despues de -
nalizados los cursos de formación:
12.1. MOMENTO 1: Estado del Arte
La revisión teórica y de las investigaciones que fundamenten el tema planteado en
la propuesta se hará a partir de la elaboración de un apartado de cada uno sobre la base
de:
El problema de representación de recursos en la biblioteca digital.
Diferentes paradigmas de bases de datos en la biblioteca digital.
Técnicas de preservación digital.
10
Tiempo: 8 meses (desde diciembre 2011 hasta julio 2012) Producto: una publicación
en una revista especializada.
12.2. MOMENTO 2: Desarrollo de Modelos
Los modelos y propuestas de los subproblemas del tema se desarrollarán a través
de:
Un modelo de datos exible para representar los recursos dentro de una biblioteca
digital.
Una arquitectura en capas simple y clara para el manejo de la información digital
de los recursos.
Implementación de la técnica de preservación digital más adecuada para garantizar
la preservación.
Forma de indexación más adecuada para que la recuperación de los recursos sea
eciente.
Para cada uno de las propuestas anteriores se desarrollará un software usando las
técnicas más apropiadas.
Tiempo: 4 meses (desde agosto 2012 hasta noviembre 2012) Producto: una publi-
cación en una revista especializada.
12.3. MOMENTO 3: Prototipo Final
Finalmente, se procede a demostrar a tráves de un desarrollo tecnológico único, la
solucion del problema principal presentado, esto permitirá dar un aporte original al estado
del arte en el tema especíco seleccionado. Por ello se desarrollará un prototipo para la
representación de los recursos dentro de una biblioteca digital en SeDiCI.
Tiempo: 6 meses (desde diciembre 2012 hasta mayo 2013). Producto: una publi-
cación, como mínimo, en una revista especializada.
13. Revistas - Journals
D-Lib Magazine. http://www.dlib.org/.
ALA Tech Source.
El Profesional de la Información (EPI) y ThinkEPI.
Internet Computing Online - IEEE.
11
International Journal on Digital Libraries.
Information Retrieval. ISSN: 1386-4564 (print version) ISSN: 1573-7659 (electron-
ic version). Journal no. 10791. IMPACT FACTOR: 1.841 (2009) Journal Citation
Reports, Thomson Reuters
Journal of Computer Science and Technology (JCST).
Revista Iberoamericana de Tecnología en Educación y Educación en Tecnología
(TEET).
14. Centros de Investigación
Public Knowledge Project (PKP). http://pkp.sfu.ca/research.
DSpace@MIT. http://libraries.mit.edu/dspace-mit/info/dspace-help.html.
OAICat. http://www.oclc.org/research/activities/oaicat/default.htm.
OAIHarvester2. http://www.oclc.org/research/activities/past/orprojects/-
harvester2/harvester2.htm.
SRW/U. http://www.oclc.org/research/activities/srw/default.htm.
12
Referencias
[1] comScore.com. http://www.comscore.com, Abril 2010.
[2] X. Agenjo and F. Hernández, Tendencias internacionales en el desarrollo funcional de
la recuperación de la información: Linked Open Data (LOD), 2010.
[3] Open access initiative. http://www.soros.org/openaccess, Abril 2011.
[4] Open Archives Iniciative. http://www.openarchives.org, Abril 2011.
[5] SeDiCI - Servicio de Difusión de Creación Intelectual. http://sedici.unlp.edu.
ar.
[6] C. Sabino, Como hacer una tesis, 1998.
[7] I. Jacobson, G. Booch, and J. Rumbaugh, El proceso unicado de desarrollo de soft-
ware. Addison Wesley, 2000.
[8] C. Pons, R. Giandini, and G. Pérez, Desarrollo de software dirigido por modelos.
conceptos teóricos y su aplicación práctica, Editorial: EDUNLP and McGraw-Hill
Education, 2010.
[9] D. Schwabe, G. Rossi, and S. Barbosa, Systematic hypermedia application design with
oohdm, in Proceedings of the the seventh ACM conference on Hypertext, pp. 116128,
ACM, 1996.
13

Más contenido relacionado

La actualidad más candente

Los Archivos, Bibliotecas y Museos: desafíos y oportunidades en un mundo glo...
Los Archivos, Bibliotecas y Museos: desafíos y oportunidades en un mundo glo...Los Archivos, Bibliotecas y Museos: desafíos y oportunidades en un mundo glo...
Los Archivos, Bibliotecas y Museos: desafíos y oportunidades en un mundo glo...matitarosas
 
Repositorios digitales institucionales
Repositorios digitales institucionalesRepositorios digitales institucionales
Repositorios digitales institucionalesmarciaescalante
 
La construcción de bibliotecas digitales como solución a la pérdida de inform...
La construcción de bibliotecas digitales como solución a la pérdida de inform...La construcción de bibliotecas digitales como solución a la pérdida de inform...
La construcción de bibliotecas digitales como solución a la pérdida de inform...Hugo Rozo Garcia
 
Repositoriodigital 1207537609098172-9
Repositoriodigital 1207537609098172-9Repositoriodigital 1207537609098172-9
Repositoriodigital 1207537609098172-9itzel03mh
 
Bibliotecas y Makerspaces
Bibliotecas y Makerspaces Bibliotecas y Makerspaces
Bibliotecas y Makerspaces JulioAlonso35
 
Las bibliotecas universitarias ante un presente y un futuro inéditos
Las bibliotecas universitarias ante un presente y un futuro inéditosLas bibliotecas universitarias ante un presente y un futuro inéditos
Las bibliotecas universitarias ante un presente y un futuro inéditosJulioAlonso35
 
Tendencias en biblioteconomía y ciencias de la información
Tendencias en biblioteconomía y ciencias de la informaciónTendencias en biblioteconomía y ciencias de la información
Tendencias en biblioteconomía y ciencias de la informaciónJulioAlonso35
 
La biblioteca del futuro de la biblioteca transaccional a la biblioteca relac...
La biblioteca del futuro de la biblioteca transaccional a la biblioteca relac...La biblioteca del futuro de la biblioteca transaccional a la biblioteca relac...
La biblioteca del futuro de la biblioteca transaccional a la biblioteca relac...Julio Alonso Arévalo
 
Visitas virtuales
Visitas virtualesVisitas virtuales
Visitas virtualesisamaree
 
Calidad en tiempos de la globalización
Calidad en tiempos de la globalizaciónCalidad en tiempos de la globalización
Calidad en tiempos de la globalizaciónabamp
 
Los repositorios digitales, una vía para la difusión del conocimiento
Los repositorios digitales, una vía para la difusión del conocimientoLos repositorios digitales, una vía para la difusión del conocimiento
Los repositorios digitales, una vía para la difusión del conocimientoErnest Abadal
 
Ciencia de la información, bibliotecologia... (1) (4)
Ciencia de la información, bibliotecologia... (1) (4)Ciencia de la información, bibliotecologia... (1) (4)
Ciencia de la información, bibliotecologia... (1) (4)DALOF
 
Ciencia de la información, bibliotecologia, documentación, archivísstica
Ciencia de la información, bibliotecologia, documentación, archivíssticaCiencia de la información, bibliotecologia, documentación, archivísstica
Ciencia de la información, bibliotecologia, documentación, archivíssticaDALOF
 

La actualidad más candente (16)

Los Archivos, Bibliotecas y Museos: desafíos y oportunidades en un mundo glo...
Los Archivos, Bibliotecas y Museos: desafíos y oportunidades en un mundo glo...Los Archivos, Bibliotecas y Museos: desafíos y oportunidades en un mundo glo...
Los Archivos, Bibliotecas y Museos: desafíos y oportunidades en un mundo glo...
 
Repositorios digitales institucionales
Repositorios digitales institucionalesRepositorios digitales institucionales
Repositorios digitales institucionales
 
La construcción de bibliotecas digitales como solución a la pérdida de inform...
La construcción de bibliotecas digitales como solución a la pérdida de inform...La construcción de bibliotecas digitales como solución a la pérdida de inform...
La construcción de bibliotecas digitales como solución a la pérdida de inform...
 
Repositoriodigital 1207537609098172-9
Repositoriodigital 1207537609098172-9Repositoriodigital 1207537609098172-9
Repositoriodigital 1207537609098172-9
 
Bibliotecas y Makerspaces
Bibliotecas y Makerspaces Bibliotecas y Makerspaces
Bibliotecas y Makerspaces
 
Biblioteca Digital Colombiana
Biblioteca Digital ColombianaBiblioteca Digital Colombiana
Biblioteca Digital Colombiana
 
Las bibliotecas universitarias ante un presente y un futuro inéditos
Las bibliotecas universitarias ante un presente y un futuro inéditosLas bibliotecas universitarias ante un presente y un futuro inéditos
Las bibliotecas universitarias ante un presente y un futuro inéditos
 
Tendencias en biblioteconomía y ciencias de la información
Tendencias en biblioteconomía y ciencias de la informaciónTendencias en biblioteconomía y ciencias de la información
Tendencias en biblioteconomía y ciencias de la información
 
La biblioteca del futuro de la biblioteca transaccional a la biblioteca relac...
La biblioteca del futuro de la biblioteca transaccional a la biblioteca relac...La biblioteca del futuro de la biblioteca transaccional a la biblioteca relac...
La biblioteca del futuro de la biblioteca transaccional a la biblioteca relac...
 
Biblioteca digital
Biblioteca digitalBiblioteca digital
Biblioteca digital
 
Visitas virtuales
Visitas virtualesVisitas virtuales
Visitas virtuales
 
Calidad en tiempos de la globalización
Calidad en tiempos de la globalizaciónCalidad en tiempos de la globalización
Calidad en tiempos de la globalización
 
Los repositorios digitales, una vía para la difusión del conocimiento
Los repositorios digitales, una vía para la difusión del conocimientoLos repositorios digitales, una vía para la difusión del conocimiento
Los repositorios digitales, una vía para la difusión del conocimiento
 
Referencia virtual rbu
Referencia virtual rbuReferencia virtual rbu
Referencia virtual rbu
 
Ciencia de la información, bibliotecologia... (1) (4)
Ciencia de la información, bibliotecologia... (1) (4)Ciencia de la información, bibliotecologia... (1) (4)
Ciencia de la información, bibliotecologia... (1) (4)
 
Ciencia de la información, bibliotecologia, documentación, archivísstica
Ciencia de la información, bibliotecologia, documentación, archivíssticaCiencia de la información, bibliotecologia, documentación, archivísstica
Ciencia de la información, bibliotecologia, documentación, archivísstica
 

Similar a Representación de los recursos dentro de una Biblioteca Digital: Propuesta técnica al Doctorado en Ciencias Informáticas

Uso de bibliotecas digitales dentro de la Universidad Técnica de Machala
Uso de bibliotecas digitales dentro de la Universidad Técnica de MachalaUso de bibliotecas digitales dentro de la Universidad Técnica de Machala
Uso de bibliotecas digitales dentro de la Universidad Técnica de MachalaAdrian Morocho
 
Trabajo 3 botero milena acosta diana
Trabajo 3 botero milena  acosta dianaTrabajo 3 botero milena  acosta diana
Trabajo 3 botero milena acosta dianamilebote
 
Objeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt MachaenObjeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt MachaenUdeG
 
Objeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt MachaenObjeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt MachaenUdeG
 
Objeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt MachaenObjeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt MachaenUdeG
 
Repositorios digitales institucionales
Repositorios digitales institucionalesRepositorios digitales institucionales
Repositorios digitales institucionalesnorepulido
 
Biblioteca Electronica
Biblioteca ElectronicaBiblioteca Electronica
Biblioteca ElectronicaJoan Villa
 
Nube Digital SB y la Biblioteca digital
Nube Digital SB y la Biblioteca digitalNube Digital SB y la Biblioteca digital
Nube Digital SB y la Biblioteca digitalNube Digital SB
 
Proyecto Biblioteca Virtual UTMACH
Proyecto Biblioteca Virtual UTMACHProyecto Biblioteca Virtual UTMACH
Proyecto Biblioteca Virtual UTMACHanitalalangui
 
Innovación educativa con recursos abiertos (Portafolio Diagnóstico)
Innovación educativa con recursos abiertos (Portafolio Diagnóstico) Innovación educativa con recursos abiertos (Portafolio Diagnóstico)
Innovación educativa con recursos abiertos (Portafolio Diagnóstico) gil_2403
 
Datos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoDatos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoSocialBiblio
 
Biblioteca virtual formato dicáctico - equipo 1 - paola alvarez
Biblioteca virtual   formato dicáctico - equipo 1 - paola alvarezBiblioteca virtual   formato dicáctico - equipo 1 - paola alvarez
Biblioteca virtual formato dicáctico - equipo 1 - paola alvarezAngie Paola Alvarez González
 

Similar a Representación de los recursos dentro de una Biblioteca Digital: Propuesta técnica al Doctorado en Ciencias Informáticas (20)

Uso de bibliotecas digitales dentro de la Universidad Técnica de Machala
Uso de bibliotecas digitales dentro de la Universidad Técnica de MachalaUso de bibliotecas digitales dentro de la Universidad Técnica de Machala
Uso de bibliotecas digitales dentro de la Universidad Técnica de Machala
 
Trabajo 3 botero milena acosta diana
Trabajo 3 botero milena  acosta dianaTrabajo 3 botero milena  acosta diana
Trabajo 3 botero milena acosta diana
 
Objeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt MachaenObjeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt Machaen
 
Objeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt MachaenObjeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt Machaen
 
Objeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt MachaenObjeto Aprendizaje Salvador Betancourt Machaen
Objeto Aprendizaje Salvador Betancourt Machaen
 
Repositorios digitales institucionales
Repositorios digitales institucionalesRepositorios digitales institucionales
Repositorios digitales institucionales
 
Trabajo1tics
Trabajo1tics Trabajo1tics
Trabajo1tics
 
Biblioteca Electronica
Biblioteca ElectronicaBiblioteca Electronica
Biblioteca Electronica
 
19-ART ORIGINAL 6.pdf
19-ART ORIGINAL 6.pdf19-ART ORIGINAL 6.pdf
19-ART ORIGINAL 6.pdf
 
Nube Digital SB y la Biblioteca digital
Nube Digital SB y la Biblioteca digitalNube Digital SB y la Biblioteca digital
Nube Digital SB y la Biblioteca digital
 
Biblioteca virtual
Biblioteca virtualBiblioteca virtual
Biblioteca virtual
 
Proyecto Biblioteca Virtual UTMACH
Proyecto Biblioteca Virtual UTMACHProyecto Biblioteca Virtual UTMACH
Proyecto Biblioteca Virtual UTMACH
 
Biblioteca virtual
Biblioteca virtualBiblioteca virtual
Biblioteca virtual
 
Proyecto Tesis Uba
Proyecto Tesis UbaProyecto Tesis Uba
Proyecto Tesis Uba
 
Proyecto Tesis Uba
Proyecto Tesis UbaProyecto Tesis Uba
Proyecto Tesis Uba
 
Innovación educativa con recursos abiertos (Portafolio Diagnóstico)
Innovación educativa con recursos abiertos (Portafolio Diagnóstico) Innovación educativa con recursos abiertos (Portafolio Diagnóstico)
Innovación educativa con recursos abiertos (Portafolio Diagnóstico)
 
Universidad técnica de machala
Universidad técnica de machalaUniversidad técnica de machala
Universidad técnica de machala
 
Datos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoDatos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abierto
 
Biblioteca virtual formato dicáctico - equipo 1 - paola alvarez
Biblioteca virtual   formato dicáctico - equipo 1 - paola alvarezBiblioteca virtual   formato dicáctico - equipo 1 - paola alvarez
Biblioteca virtual formato dicáctico - equipo 1 - paola alvarez
 
Esquema metadatos-dublin-core-biblioteca-digital (1)
Esquema metadatos-dublin-core-biblioteca-digital (1)Esquema metadatos-dublin-core-biblioteca-digital (1)
Esquema metadatos-dublin-core-biblioteca-digital (1)
 

Más de Servicio de Difusión de la Creación Intelectual (SEDICI)

Más de Servicio de Difusión de la Creación Intelectual (SEDICI) (20)

Panorama y definiciones sobre acceso abierto y repositorios institucionales: ...
Panorama y definiciones sobre acceso abierto y repositorios institucionales: ...Panorama y definiciones sobre acceso abierto y repositorios institucionales: ...
Panorama y definiciones sobre acceso abierto y repositorios institucionales: ...
 
Un entorno de aprendizaje y una propuesta de enseñanza de Simulación de Event...
Un entorno de aprendizaje y una propuesta de enseñanza de Simulación de Event...Un entorno de aprendizaje y una propuesta de enseñanza de Simulación de Event...
Un entorno de aprendizaje y una propuesta de enseñanza de Simulación de Event...
 
Los beneficios del desarrollo dirigido por modelos en los repositorios instit...
Los beneficios del desarrollo dirigido por modelos en los repositorios instit...Los beneficios del desarrollo dirigido por modelos en los repositorios instit...
Los beneficios del desarrollo dirigido por modelos en los repositorios instit...
 
SeDiCI - Desafíos y experiencias en la vida de un repositorio digital
SeDiCI - Desafíos y experiencias en la vida de un repositorio digitalSeDiCI - Desafíos y experiencias en la vida de un repositorio digital
SeDiCI - Desafíos y experiencias en la vida de un repositorio digital
 
El desarrollo de software dirigido por modelos en los repositorios institucio...
El desarrollo de software dirigido por modelos en los repositorios institucio...El desarrollo de software dirigido por modelos en los repositorios institucio...
El desarrollo de software dirigido por modelos en los repositorios institucio...
 
SeDiCI - Desafíos y experiencias en la vida de un repositorio digital
SeDiCI - Desafíos y experiencias en la vida de un repositorio digitalSeDiCI - Desafíos y experiencias en la vida de un repositorio digital
SeDiCI - Desafíos y experiencias en la vida de un repositorio digital
 
Proyecto Celsius3: software para gestionar pedidos de material bibliográfico ...
Proyecto Celsius3: software para gestionar pedidos de material bibliográfico ...Proyecto Celsius3: software para gestionar pedidos de material bibliográfico ...
Proyecto Celsius3: software para gestionar pedidos de material bibliográfico ...
 
Interoperabilidad entre el Repositorio Institucional y servicios en línea en ...
Interoperabilidad entre el Repositorio Institucional y servicios en línea en ...Interoperabilidad entre el Repositorio Institucional y servicios en línea en ...
Interoperabilidad entre el Repositorio Institucional y servicios en línea en ...
 
Preservación digital: un experimento con SEDICI-DSpace
Preservación digital: un experimento con SEDICI-DSpacePreservación digital: un experimento con SEDICI-DSpace
Preservación digital: un experimento con SEDICI-DSpace
 
LibLink (Library Linkages): Estrategias, proyectos y acciones 2013-2014
LibLink (Library Linkages): Estrategias, proyectos y acciones 2013-2014LibLink (Library Linkages): Estrategias, proyectos y acciones 2013-2014
LibLink (Library Linkages): Estrategias, proyectos y acciones 2013-2014
 
Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...
Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...
Plataforma de recolección en fuentes heterogéneas de la web y su aplicación a...
 
Digitalización y reconocimiento de documentos manuscritos para la preservació...
Digitalización y reconocimiento de documentos manuscritos para la preservació...Digitalización y reconocimiento de documentos manuscritos para la preservació...
Digitalización y reconocimiento de documentos manuscritos para la preservació...
 
Control de integridad y calidad en repositorios DSpace
Control de integridad y calidad en repositorios DSpaceControl de integridad y calidad en repositorios DSpace
Control de integridad y calidad en repositorios DSpace
 
Generación automática de resúmenes de congresos e integración con el Reposito...
Generación automática de resúmenes de congresos e integración con el Reposito...Generación automática de resúmenes de congresos e integración con el Reposito...
Generación automática de resúmenes de congresos e integración con el Reposito...
 
Ibero-American Science and Education Consortium (ISTEC): New challenges in a ...
Ibero-American Science and Education Consortium (ISTEC): New challenges in a ...Ibero-American Science and Education Consortium (ISTEC): New challenges in a ...
Ibero-American Science and Education Consortium (ISTEC): New challenges in a ...
 
Las actividades y el planeamiento de la preservación en un repositorio instit...
Las actividades y el planeamiento de la preservación en un repositorio instit...Las actividades y el planeamiento de la preservación en un repositorio instit...
Las actividades y el planeamiento de la preservación en un repositorio instit...
 
Interoperabilidad con el repositorio institucional
Interoperabilidad con el repositorio institucionalInteroperabilidad con el repositorio institucional
Interoperabilidad con el repositorio institucional
 
SeDiCI (Servicio de Difusión de la Creación Intelectual): un recorrido de exp...
SeDiCI (Servicio de Difusión de la Creación Intelectual): un recorrido de exp...SeDiCI (Servicio de Difusión de la Creación Intelectual): un recorrido de exp...
SeDiCI (Servicio de Difusión de la Creación Intelectual): un recorrido de exp...
 
GPSS interactive learning environment
GPSS interactive learning environmentGPSS interactive learning environment
GPSS interactive learning environment
 
GPSS interactive learning environment
GPSS interactive learning environmentGPSS interactive learning environment
GPSS interactive learning environment
 

Representación de los recursos dentro de una Biblioteca Digital: Propuesta técnica al Doctorado en Ciencias Informáticas

  • 1. Universidad Nacional de La Plata (UNLP) La Plata - Argentina Facultad de Informática Representación de los Recursos dentro de una Biblioteca Digital Propuesta Técnica al Doctorado en Ciencias Informática Resolución 7ma. - 24/06/2010. Expediente: 3300-2042/10-000 Autor: Jose Daniel Texier dantexier@gmail.com Directora: Profa. Marisa De Giusti 6 de junio de 2011
  • 2. 1. Tema Principal (Objetivo General) Representación de los recursos dentro de una biblioteca digital. 2. Introducción El desarrollo de Internet y de las nuevas tecnologías de la información nos hace pensar inminentemente en el cambio de época que estamos viviendo hoy en día en la de- nominada, Era de la Información. Estas transformaciones son una novedad para nuestra sociedad, la última ocurrió hace aproximadamente más de 200 años cuando la Revolu- ción Industrial condujo a la humanidad del agrarianismo al industrialismo. La génesis del cambio actual se puede observar en lo cultural, social, económico y tecnológico. En estos años se observa que los niños y jóvenes crecen con un computador en sus manos y que los adultos no, y estos adultos han vivido el antes y el después de la aparición de la Internet. Por ello hoy se puede decir que quien posee la información tiene el poder. En comScore[1] se muestran algunas estadísticas importantes: Un 63.0 % de los usuarios de Internet son menores de 40 años. Un 15.5 % de la población mundial tiene acceso a Internet, en Argentina está en 48.3 % y en Venezuela 31.1 %. Los sitios más visitados a nivel mundial en estricto orden son: Google, Facebook y Youtube. Un 12.6 % del comercio electrónico que se realiza es el de libros y revistas, convir- tiéndose éstos en los de mayor consumo. Sólo el 6.2 % de la consultas en Internet son académicas y/o cientícas. Estas estadísticas nos comprueban el gran auge de la Internet. Sin embargo, las bibliotecas tradicionales ofrecen los documentos en soportes físicos que se facilitan a los usuarios a través de servicios de préstamos y consultas. Esta tradicional política esta ale- jando a la población de las bibliotecas porque las consultan que realizan de los ejemplares que a veces no se pueden encontrar y muchas veces si se encuentran no están actual- izados porque existen ediciones viejas. Por ello, han comenzado a surgir desde hace más de una década el diseño y la creación de las bibliotecas digitales[2], es decir, se inició la automatización de las bibliotecas tradicionales convirtiéndolas en bases de datos para ser procesadas por sistemas o herramientas informáticas, cuyo propósito está dirigido a la población en general. Estamos evolucionando con respecto a la búsqueda y transmisión de la información, puesto que se están sufriendo contracciones económicas, así como también concepciones 2
  • 3. de vida distintos en el mundo permitiendo generar políticas de conservación del ambiente, soluciones más económicas, un mejor acceso a la información, etc., lo que conlleva dejar atrás el paradigma de buscar un libro y solicitarlo en la biblioteca. Una posibilidad que concita interés en un grupo importante de personas es el acceso a contenidos (libros, artículos, etc) a través de internet, con las comodidades que esto implica, a la vez que este tipo de acceso posibilita una mejor preselección del material. La tecnología ha permitido que el conocimiento se traslade a los soportes digitales y eso ha permitido la consolidación de las bibliotecas digitales. Para cumplir con su rol en la sociedad una BD debe: 1. Tener una colección de datos. 2. Poseer un sistema de ordenamiento de documentos. 3. Brindar servicios a una comunidad de usuarios. El primer elemento consiste en tener una colección de documentos que si están o no en formato electrónico es otra cosa; segundo se debe contar con un sistema de ordenamien- to para los documentos, además de un sistema para almacenar y recuperar importantes cantidades de información. La colección de documentos y el sistema de ordenamiento pueden estar en forma electrónica pero eso no garantiza la existencia de una biblioteca digital. Tercero se necesita una comunidad de usuarios a quienes servir, que tengan unas necesidades y características determinadas. Si se tienen estos tres elementos se reconoce una biblioteca digital. Esta propuesta pretende dar un aporte cientíco y académico original para la es- tandarización y fortalecimiento de las bibliotecas digitales para la sociedad, y aunque existen numerosos proyectos relacionados con el tema, este estudio se centrará en el al- macenamiento y recuperación de recursos digitales en repositorios y en la indexación de la información. La propuesta se desarrollará bajo la losofía del Open Access[3] porque reeja un adelanto en el área de las bibliotecas digitales e intenta abrir el acceso a recursos académi- cos. La importancia radica en la necesidad de: (a) establecer y mantener estándares que permitan un crecimiento de ellas y (b) evitar redundancia de trabajo e información lo que representaría un mejor servicio. Gracias a iniciativas como Open Archives Initiative (OAI)[4], Online Computer Li- brary Center (OCLC), International Federation of Library Associations (IFLA), Net- worked Digital Library of Theses and Dissertations (NDLTD) se han logrado establecer: Estándares de interoperabilidad. Estándares para la catalogación de recursos. Estándares para la preservación de los objetos digitales. 3
  • 4. Este trabajo comenzará con la investigación en el Servicio de Difusión de la Creación Intelectual (SeDiCI)[5], creado en el 2003, de la Universidad Nacional de la Plata (UNLP) junto con los cursos del Doctorado que se irán tomando para mi formación académica. En la actualidad, SeDiCI tiene como objetivo principal socializar el conocimiento generado en las diferentes áreas académicas de la UNLP con el n devolver a la comunidad sus esfuerzos mediante la creación de un repositorio institucional que consiste en una base de datos compuesta por un grupo de servicios destinados a capturar, almacenar, ordenar, preservar y redistribuir la documentación en formato digital que brinda un acceso abierto a la documentación académica ofrecida. SeDiCI está realizando investigaciones y desarrollando herramientas adecuadas en las siguientes áreas: lenguajes naturales, compresión e indexación de archivos, catalo- gación de documentos, almacenamiento y recuperación de recursos, repositorios semánti- cos, gestión de herramientas multidiomas, portales Web, derechos de autor, etc.; lo cual demuestra que están trabajando constantemente para seguir creciendo con la tecnología y en acuerdo con la cantidad de información proveniente de los diferentes repositorios exter- nos (aproximadamente 45 repositorios para abril del 2010) registrados internacionalmente y la producción académica de la UNLP. El tema principal de este estudio estará relacionado directamente con los repositorios y las siguientes áreas: base de datos, modelado de datos, metadatos, almacenamiento e indexación de los metadatos, XML y datos semiestructurados. La propuesta mejorará la calidad del funcionamiento sintáctico y estructural del repositorio de SeDiCI lo que redundará en benecio del usuario a la hora de realizar búsquedas de recursos y por tanto mejores servicios. 3. Áreas Bases de Datos (BD) convencionales y no convencionales; BD deductivas, BD Ac- tivas, BD Objetuales y Objeto-Relacionales, BD Móviles, BD temporales y espaciales; BD documentales y multimedia; Recuperación de información, Indexación y BD en Web; Modelado de datos; XML y Datos Semiestructurados; Web Semántica y Ontologías. 4. Objetivos Especícos 1. Analizar el problema de la representación de recursos dentro de una biblioteca di- gital. 2. Analizar las ventajas y desventajas de los distintos paradigmas de bases de datos en cuanto a la representación de los recursos. 4
  • 5. 3. Proponer un modelo de datos exible para representar los recursos dentro de una biblioteca digital, considerando al menos las siguientes características: distintos formatos de metadatos para distintos tipos de recursos; varias catalogaciones de un mismo recurso utilizando distintos formatos de metadatos; representación de entidades abstractas de forma independiente, permitiendo identicarlas y reutilizarlas; relaciones entre recursos; relaciones entre entidades abstractas; relaciones entre entidades abstractas y recursos. 4. Proponer una arquitectura en capas simple y clara que provea los niveles de abstra- cción adecuados según los niveles de acceso requeridos. 5. Analizar las técnicas de preservación digital y determinar cuál es la más adecuada para garantizar la preservación tanto de los recursos como de los objetos digitales. 6. Determinar la forma de indexación más adecuada para que la recuperación de los recursos sea eciente y de buen redimiento. El espacio ocupado por el repositorio debe mantenerse dentro de parámetros aceptables. 7. Desarrollar un prototipo para la representación de los recursos dentro de una bib- lioteca digital en SeDiCI 5. Metodología de Investigación La presente investigacion es exploratoria y empírica[6], dado que el tema escogido ha sido poco estudiado hasta el momento, por ello se realizará una descripción sistemática del problema para llegar al estado del arte del tema tratado. Esta investigación permitirá determinar los requerimientos necesarios para hacer el análisis y diseño respectivo, el cual conducira a la implementación del prototipo. De esta manera se estará dando aporte original al tema. Para la construcción del prototipo, se estudiaran las metodologías del Proceso Uni- cado de Desarrollo de Software[7], del Desarrollo de Software Dirigido por Modelos[8] y del Modelo para el Diseño de Hipermedia Orientado a Objetos (OOHDM)[9]. Una vez seleccionada la metodología de desarrollo de software, se procederá a la construcción de cada una de las etapas para luego tener los resultados y conclusiones con base en los objetivos especícos propuestos y las pruebas realizadas. 5
  • 6. 6. Desarrollo El trabajo que se realizará consiste en el desarrollo de un prototipo que permita la representación de los recursos dentro de una biblioteca digital en SeDiCI basado en el cumplimiento de las siguientes premisas: Lograr un modelo exible y expandible de representación de los recursos de una Biblioteca Digital. Realizar pruebas para determinar el modo óptimo de almacenamiento e indexación de recursos. El sistema tendrá un gran impacto en la implementación de búsqueda y recuperación de información de la UNLP, otras universidades y los miembros de consorcios a los que pertenece la UNLP. 7. Actividades por Objetivos Especícos 7.1. Analizar el problema de la representación de recursos dentro de una biblioteca digital Denir el concepto de recursos dentro de una biblioteca digital. Estudiar cada una de las características en la representación de recursos. Clasicar en categorías los problemas en la representación de recursos existentes en SeDiCI. Describir los problemas categorizados en la representación de recursos existentes en SeDiCI. 7.2. Analizar las ventajas y desventajas de los distintos paradig- mas de bases de datos en cuanto a la representación de los recursos Estudiar cada uno de los paradigmas de bases de datos existentes. Realizar una matriz comparativa sobre la base de las ventajas y desventajas de los paradigmas relacionados con la representación de los recursos. Seleccionar el paradigma más idóneo para el dominio tratado. 6
  • 7. 7.3. Proponer un modelo de datos exible para representar los recursos dentro de una biblioteca digital Diseñar el modelo de datos para representar los recursos mediante la descripción de las partes que lo compondrán. 7.4. Proponer una arquitectura en capas simple y clara que provea los niveles de abstracción adecuados según los niveles de acceso requeridos Estudiar las diferentes opciones de arquitectura de capas existentes. Diseñar un modelo de arquitectura de capas. 7.5. Analizar las técnicas de preservación digital y determinar cuál es la más adecuada para garantizar la preservación tanto de los recursos como de los objetos digitales Estudiar las alternativas y técnicas de almacenamiento para los objetos digitales (PDF, videos, fotos, etc.) Exponer las razones de garantia de preservación entre los objetos digitales y los recursos que los representan. 7.6. Determinar la forma de indexación más adecuada para que la recuperación de los recursos sea eciente y de buen redi- miento Estudiar las diferentes formas de indexación. Denir los parametros para una correcta recuperación de los recursos. Seleccionar la forma de indexación adecuada para la propuesta. 7.7. Desarrollar un prototipo para la representación de los recur- sos dentro de una biblioteca digital en SeDiCI Seleccionar la metodología para la construccion del prototipo. Diseñar el prototipo. 7
  • 8. Implementar el prototipo. Realizar pruebas con el prototipo. 8. Temas de Investigación En la investigación, que se estará llevando a cabo para el desarrollo de la tesis doctoral, se tienen los siguientes temas: 1. Base de Datos (BD): BD convencionales y no convencionales. BD deductivas. BD Activas. BD Objetuales y Objeto-Relacionales. BD Móviles. BD temporales y espaciales. BD documentales y multimedia. Modelado de datos. NoSQL. 2. Bibliotecas Digitales: Metadatos. Repositorios. Indexación. Catalogación. Recuperación de información. Open Access. Metadatos. XML y datos semiestructurados. Sistemas de información federados. Indexación y BD en Web. Arquitectura Orientada a Servicios y/o Web Services. Web semántica y ontologías. 8
  • 9. 9. Posibilidades de Realización en el Ámbito del Tesista El inicio del Doctorado está planicado, tentativamente, para el 06 de septiembre del 2010. La propuesta contempla una primer etapa de cursada y obtención de los 45 créditos en dos años. Luego (en los dos años siguientes) desarrollar y culminar la tesis. Para ello, contaré con mi formación como Ingeniero en Informática en la Universidad Nacional Experimental del Táchira (UNET) y con una Maestría en Computación de la Universidad de los Andes (ULA), en la cual trabajé en el área de Lenguajes de Progra- mación y Compiladores. Asimismo, he trabajado como docente en las áreas de Lenguajes de Programación de Java y C/C++ en cursos de pregrado. En esta etapa estaré trabajando en conjunto con las personas que sostienen el SeDiCI lo que facilitará la realización de investigación y desarrollo en el área de interés y que esto a posteriori se vuelque para el mejoramiento de otros sistemas similares. 10. Antecedentes de la Dirección La Ing. De Giusti propuso la creación del Servicio de Difusión de la Creación In- telectual, SeDiCI a la UNLP en el año 2002, trabajó durante un año con la Comisión de Interpretación y reglamento para la conguración del proyecto y actualmente dirige este servicio. Participa en la organización de un repositorio a nivel nacional con el Ministerio de Ciencia, Tecnología e Innovación Productiva de la Argentina. Las bib- liotecas digitales son el centro de sus temas de investigación, particularmente en lo relativo a la puesta en marcha, selección de contenidos y áreas prioritarias. Cuen- ta con numerosas publicaciones vinculadas a la temática, los cuales pueden verse en: http://www.sedici.unlp.edu.ar/difusion/difusion.php La Dra. Silvia Gordillo tiene una gran experiencia en bases de datos que constituyen un área central a esta propuesta, particularmente en bases de datos relacionales y orien- tadas a objeto. La Profesora también cuenta con antecedentes profusos en las áreas de recuperación de información y minería de datos. Cuenta con numerosas publicaciones en estas áreas y en tópicos marcados como centrales en esta propuesta. 11. Actividades de Formación Propuestas Los cursos que se realizarán según la oferta presentada por el postgrado y la prop- uesta de formación planteada por la Directora y Codirectora son: 1. Año 2010: Curso: Aspectos Legales de Gobierno Electrónico, Facultad de Informática UNLP. 9
  • 10. Curso: Monitorización y Optimización de Rendimiento en Sistemas de Cóm- puto de Altas Prestaciones, Facultad de Informática UNLP. Curso: Metodología de la Investigación cientíca, Facultad de Informática UNLP. Curso: Computación Móvil: Arquitectura y Aplicaciones, Facultad de Infor- mática UNLP. Curso: Introducción al Reconocimiento automático de Patrones, Facultad de Informática UNLP. 2. Año 2011: Curso: Seminario / Taller de Elaboración de Proyectos y Tesis Técnicas y Herramientas, Facultad de Informática UNLP. Curso: Gestión de Calidad según normas ISO. Aplicaciones a Software, Facul- tad de Informática UNLP. Curso: Base de Datos, Facultad de Informática UNLP. Curso: Técnicas de Computación para la Web y Escalabilidad, Facultad de Informática UNLP. Curso: Ingeniería del Conocimiento, Facultad de Informática UNLP. Curso: Administración de Proyectos de Software, Facultad de Informática UNLP. Curso: Tópicos de Ingeniería, Facultad de Informática UNLP. 12. Planicación La investigación se desarrollará, principalmente, en tres momentos, despues de - nalizados los cursos de formación: 12.1. MOMENTO 1: Estado del Arte La revisión teórica y de las investigaciones que fundamenten el tema planteado en la propuesta se hará a partir de la elaboración de un apartado de cada uno sobre la base de: El problema de representación de recursos en la biblioteca digital. Diferentes paradigmas de bases de datos en la biblioteca digital. Técnicas de preservación digital. 10
  • 11. Tiempo: 8 meses (desde diciembre 2011 hasta julio 2012) Producto: una publicación en una revista especializada. 12.2. MOMENTO 2: Desarrollo de Modelos Los modelos y propuestas de los subproblemas del tema se desarrollarán a través de: Un modelo de datos exible para representar los recursos dentro de una biblioteca digital. Una arquitectura en capas simple y clara para el manejo de la información digital de los recursos. Implementación de la técnica de preservación digital más adecuada para garantizar la preservación. Forma de indexación más adecuada para que la recuperación de los recursos sea eciente. Para cada uno de las propuestas anteriores se desarrollará un software usando las técnicas más apropiadas. Tiempo: 4 meses (desde agosto 2012 hasta noviembre 2012) Producto: una publi- cación en una revista especializada. 12.3. MOMENTO 3: Prototipo Final Finalmente, se procede a demostrar a tráves de un desarrollo tecnológico único, la solucion del problema principal presentado, esto permitirá dar un aporte original al estado del arte en el tema especíco seleccionado. Por ello se desarrollará un prototipo para la representación de los recursos dentro de una biblioteca digital en SeDiCI. Tiempo: 6 meses (desde diciembre 2012 hasta mayo 2013). Producto: una publi- cación, como mínimo, en una revista especializada. 13. Revistas - Journals D-Lib Magazine. http://www.dlib.org/. ALA Tech Source. El Profesional de la Información (EPI) y ThinkEPI. Internet Computing Online - IEEE. 11
  • 12. International Journal on Digital Libraries. Information Retrieval. ISSN: 1386-4564 (print version) ISSN: 1573-7659 (electron- ic version). Journal no. 10791. IMPACT FACTOR: 1.841 (2009) Journal Citation Reports, Thomson Reuters Journal of Computer Science and Technology (JCST). Revista Iberoamericana de Tecnología en Educación y Educación en Tecnología (TEET). 14. Centros de Investigación Public Knowledge Project (PKP). http://pkp.sfu.ca/research. DSpace@MIT. http://libraries.mit.edu/dspace-mit/info/dspace-help.html. OAICat. http://www.oclc.org/research/activities/oaicat/default.htm. OAIHarvester2. http://www.oclc.org/research/activities/past/orprojects/- harvester2/harvester2.htm. SRW/U. http://www.oclc.org/research/activities/srw/default.htm. 12
  • 13. Referencias [1] comScore.com. http://www.comscore.com, Abril 2010. [2] X. Agenjo and F. Hernández, Tendencias internacionales en el desarrollo funcional de la recuperación de la información: Linked Open Data (LOD), 2010. [3] Open access initiative. http://www.soros.org/openaccess, Abril 2011. [4] Open Archives Iniciative. http://www.openarchives.org, Abril 2011. [5] SeDiCI - Servicio de Difusión de Creación Intelectual. http://sedici.unlp.edu. ar. [6] C. Sabino, Como hacer una tesis, 1998. [7] I. Jacobson, G. Booch, and J. Rumbaugh, El proceso unicado de desarrollo de soft- ware. Addison Wesley, 2000. [8] C. Pons, R. Giandini, and G. Pérez, Desarrollo de software dirigido por modelos. conceptos teóricos y su aplicación práctica, Editorial: EDUNLP and McGraw-Hill Education, 2010. [9] D. Schwabe, G. Rossi, and S. Barbosa, Systematic hypermedia application design with oohdm, in Proceedings of the the seventh ACM conference on Hypertext, pp. 116128, ACM, 1996. 13