1. Depósitos de
datos de investigación
Fernanda Peset
Universidad Politécnica de Valencia
Agradecimientos a Vicenta Gay Lacueva
Seminario sobre Gestión de datos de investigación
Mesa redonda Infraestructuras y aspectos legales
Universitat de Barcelona. Facultat de Biblioteconomia i Documentació. Aula Valverde
http://bd.ub.edu/grups/ccd/seminari_maredata
19 de enero 2016. 12 h.
2. Indice
Fundamentos: el ecosistema openscience y ruta a
escoger
¿Qué tipo de datos tenemos (sueltos, de un proyecto…)
y qué repositorios hay?
¿Cómo encontrarlos?
Casos de éxito
3. Fundamentos
¿Qué datos tenemos y qué repositorios hay?
¿Cómo encontrar dónde depositar?
Casos de éxito
5. Preservación
La ruta verde de los repositorios/bancos de datos
RESPONSABLES a futuro es la única que considero que
garantiza la preservación
DCC Digital Curation Centre (2004), años generando
materiales
6. Fundamentos
¿Qué datos tenemos y qué repositorios hay?
¿Cómo encontrar dónde depositar?
Casos de éxito
7. 1. Individuales
2. Proyecto en proceso
3. Financiados
4. Publicados
La generación de datos como proceso
Guía DATASEA para el investigador
http
://www.datasea.es/dt/index.php?option=com_content&view=artic
8. 1 Datos “individuales”,
sueltos Figshare
orientada a quien deposita la información, el
investigador e instituciones: reconocimiento de su
trabajo, Welcome trust.
iniciado por un estudiante de doctorado y ahora apoyado
por Digital Science–Macmillan Publishers Company. Se va
posicionando en el mercado de las aplicaciones, estando
presente en el Forum establecido por Thomson Reuters,
es tomada en cuenta su opinión en el DCC, mejoras.
licencias : publica todo bajo la licencia CC-BY, pero
distribuye los datasets con la CC0. Asociado a CLOCKSS.
Si los ficheros se depositan en abierto, el espacio
disponible es ilimitado; en caso contrario proporciona un
1 Gb. Interopera con ORCID. Escasos metadatos, sin
validación posterior
9.
10. 2 ELN: datos en producción
Data during the research life-cycle.
http://www.nhmrc.gov.au/grants-funding/policy/nhmrc-statement-data-shar
11. Almacenamiento, gestión del ciclo de vida y la
preservación de los objetos de investigación. LabArchives
http://www.labarchives.com/ y Labguru
http://www.labguru.com/ de empresas privadas de
servicios para laboratorios en la nube: LabArchives LCC y
Biodata, de Digital Science. ROHub se define como un
prototipo de biblioteca digital para RO. El modelo se ha
construido en torno a una ontología (semántica) que
proporciona la estructura básica para la descripción de los
recursos y sus anotaciones, además de unas extensiones
para describir la evolución de los objetos (Palma et al.,
2014)
12. Proyecto en proceso:
colecciones en Dataverse
Institute for Quantitative Social Science (IQSS) de la
Universidad de Harvard. 1987 comienza. En 2006 se abre.
Puede servirse en la institución o en Harvard.
Protocolos estandarizados. Se organiza por colecciones de
numerosas instituciones y revistas (65 11enero 16). Un
investigador individual puede tener su comunidad siempre que
los contenidos queden en abierto.
Roles y privilegios de colaboradores, curators y
administradores. Ofrece flujos para trabajar de manera
regular, abierta y en modo wiki, versiones...
Destacan algunos servicios adicionales como la tabulación del
datasets subido en otros sistemas estadísticos, su análisis y
mediciones. También, Dataverse genera una citación formal de
datos con un identificador persistente, URL y UNF (Universal
Numerical Fingerprint) para la verificación del dataset.
DATAVERSE IFPRI https://www.youtube.com/watch?
v=nnL3LaIuT0k
13.
14. 3 Datos financiados: Horizon2020 (UE)
En el artículo 29.3 del Agreement de los socios aparece
Open access to research data, con las condiciones
Es voluntario, en una nueva iniciativa transversal, Open
Research Data Pilot orientada a mejorar el acceso y
reutilización. Las áreas que participan recibirán (2014-
2015) sobre 3.000 millones de euros (Vlaeminck, 2013).
Los beneficiarios deben:
(a) depositar en un repositorio abierto de datos de
investigación: los datos necesarios para validar las
publicaciones de investigación, con sus metadados, tan
pronto como sea posible; y otros datos, con sus metadatos,
dentro del plazo previsto en sus planes de gestión de datos
así como el momento de liberación que indicaron;
(b) ofrecer información en el repositorio sobre las
herramientas para validar la investigación e incluso, si es
posible, proporcionarlas
15. Zenodo
desarrollado como repositorio huérfano por el
CERN sobre Invenio.
OpenAIREplus y probado con datasets del
Wellcome Trust (Príncipe, 2013).
Conectado con Dropbox para el proceso de subida.
Admite todo tipo de ficheros
Destacado: verifica que los ficheros estén
relacionados con una investigación; asegura un
control descentralizado de los datos; y por último
permite crear comunidades de usuarios finales.
16.
17. 4 Datos publicados: he hecho
un experimento
catalonia or catalunya 18/12/15
Solo 6 o 7 revistas aceptan material suplementario
(según ODiSEA)
Source Titles records% of 33973odisea
LECTURE NOTES IN COMPUTER SCIENCE 837 2.464n
PLOS ONE 2640.777 n
MEDICINA CLINICA 2130.627 n
PHYSICAL REVIEW B 1980.583 n
LECTURE NOTES IN ARTIFICIAL INTELLIGENCE 1790.527 n
PHYSICAL REVIEW E 1750.515 la B y D
JOURNAL OF THE AMERICAN CHEMICAL SOCIETY 1740.512 n
CHEMISTRY A EUROPEAN JOURNAL 1710.503 n
PROCEEDINGS OF THE SOCIETY OF PHOTO OPTICAL INSTRUMENTATION ENGINEERS
SPIE 1620.477 n
ASTRONOMY ASTROPHYSICS 1590.468 s
ASTROPHYSICAL JOURNAL 1360.400 s
JOURNAL OF CHEMICAL PHYSICS 1320.389 s
ANGEWANDTE CHEMIE INTERNATIONAL EDITION 1300.383 s
ABSTRACTS OF PAPERS OF THE AMERICAN CHEMICAL SOCIETY 1110.327 n
JOURNAL OF ORGANIC CHEMISTRY 1080.318 n
CHEMICAL COMMUNICATIONS 1050.309 n
APPLIED PHYSICS LETTERS 1050.309 s
PHYSICAL REVIEW LETTERS 1030.303 s
FRONTIERS IN ARTIFICIAL INTELLIGENCE AND APPLICATIONS 1020.300 n
JOURNAL OF APPLIED PHYSICS 980.288
18. Dryad, sobre Dspace
500 revistas (11000 regs.)
Miembros dic.15
American Association for the Advancement of Science *
American Society of Naturalists *
The American Genetic Association *
Botanical Society of America
British Ecological Society *
BMJ Publishing Group, Ltd. *
The Biological Journal of the Linnean Society (Linnean Society of
London) *
BioMed Central *
Cambridge University Press
Ecology Letters *
Ecological Society of America *
Elementa: Science of the Anthropocene
European Society for Evolutionary Biology *
Evolutionary Applications *
The Genetics Society *
German National Libary of Medicine
HighWire
Molecular Ecology *
Molecular Ecology Resources *
Molecular Phylogenetics and Evolution *
Oikos *
Oxford University Press *
The Paleontological Society *
Pensoft Publishers *
PLOS *
The Royal Society
Society for Molecular Biology and Evolution *
Society for the Study of Evolution *
Society of Systematic Biologists *
United States Fish and Wildlife Service *
Wiley *
19. admite datos relacionados con publicaciones,
incluso durante la fase de revisión si la revista
está asociada a Dryad. Se trata de un proyecto
colaborativo en Dspace, que comenzó en el área
de salud vinculado con el mundo de las
bibliotecas, sociedades científicas y editores.
Admite textos, hojas de cálculo, video,
fotografías, código de software. Es de uso gratuito
hasta 10Gb por fichero y asigna como DOI el del
artículo. Garantiza la preservación de los datos al
participar en CLOCKSS. Destaca la corrección de la
cita bibliográfica, algo muy apreciado por los
investigadores, y que cuenta con un proceso de
validación adicional.
20. Fundamentos
¿Qué datos tenemos y qué repositorios hay?
¿Cómo encontrar dónde depositar?
Casos de éxito
26. Consejo final
Monash University “adopta, adapta
y en último término desarrolla”
“Developing a new product may be
expensive, costly to support, and
could split researchers from their
community.” La lealtad de los
científicos con su comunidad es
mayor que con su institución.
27. Vengo a hablar de mi libro…
Bibliografía:
Peset, Fernanda; González, Luis-Millán (2016). Ciencia abierta
y gestión de datos de investigación. Gijón: TREA. ISBN 978-84-
9704-907-8
Peset, Fernanda; González, Luis-Millán (2016). Manejar lo
inmanejable. Thinkepi
Nina-Alcocer, Victor; Blasco-Gil, Yolanda; Peset, Fernanda
(2013). Los inicios del datasharing: guía práctica para
compartir datos de investigación. El profesional de la
información, noviembre-diciembre, v. 22, n. 6, pp. 562-568.
http://eprints.rclis.org/20907/1/datasharing.pdf
Ferrer-Sapena, A., Peset, F., Aleixandre-Benavent, R.
(2015). Guía para gestionar y compartir datos de
investigación. http://www.datasea.es/dt/index.php?
option=com_content&view=article&id=52&Itemid=134
Couto, F (2016). Gestión de datos de investigación. EPI-UOC
Fuentes para revistas:
Callaghan, Sarah. A list of Data Journals,
2013 http://proj.badc.rl.ac.uk/preparde/blog/DataJournalsList [Consult
ado: 17 diciembre 2014]
CODATA-ICSU. 2014. CODATA New Task Group Form 2014. New Task
Group Proposal for Presentation to the 29th
CODATA General Assembly.
DATASEA Group. ODiSEA: International registry on Research data
2015http://odisea.ciepi.org [Consultado: 17 diciembre 2014]
JISC. JoRD PROJECT. Social Science Journals that have a research
data policyhttps://jordproject.wordpress.com/project-data/social-
science-journals-that-have-a-research-data-policy/
Reilly, Susan; Schallier, Wouter; Schrimpf, Sabine; Smit, Eefke;
Wilkinson, Max. (2011) Report on Integration of Data and Publications,
17 October, 2011, http://www.alliancepermanentaccess.org/wp-
content/uploads/downloads/2011/11/ODE-
ReportOnIntegrationOfDataAndPublications-1_1.pdf