Comunicação apresentada à CONFOA 2013 (Universidade de São Paulo, São Paulo, Brasil, de 06 a 08 de outubro de 2013) em Comunicações III - Tecnologias aplicadas a repositórios científicos - Cristina Ribeiro, João Rocha da Silva e João Correia Lopes
UPBox e DataNotes: ferramentas colaborativas para dados de investigação em domínios diversos
1. UPBox e DataNotes:
Ferramentas colaborativas para dados
de investigação em domínios diversos
Cristina Ribeiro DEI- FEUP/ INESC TEC
João Rocha da Silva DEI- FEUP/ INESC TEC
João Correia Lopes DEI- FEUP/ INESC TEC
2. Conteúdo
•
•
•
•
•
Motivação e objetivos
A prática corrente na curadoria de dados
Proposta de um workflow de gestão de dados
Proposta de uma arquitetura de ferramentas
Conclusões e trabalhos em curso
3. Os repositórios de dados
✓
Reposit órios de dados
- Partilha de conjuntos de dados
- Prova/Evidência da produção científica
- Publicações com dados-base associados são mais citadas
4. Os repositórios de dados
!
A probabilidade dos dados
serem deposit ados cai após a
publicação dos r esult ados
- O esforço de preparação de dados por vezes não garante
recompensa a curto prazo
- Falta de financiamento para curadoria
- Elementos dos projectos saem das equipas
- Os curadores podem tornam-se um " bottleneck" do processo
devido ao processo manual de curadoria
6. Proposta de workflow
!" #$%'( ) * +, $%
&
1
!" #$%'( ) * +, &
. /& " +
$,
Partilha transparente com
investigadores autorizados
Permite partilha mais rápida
de dados
Suporta colaboração entre
diferentes instituições
Depósito e
anotação
colaborativa dos
dados
2
01, ) * +,
! "#$%'( )&
& $
Validação de datasets
e anotações
com vista ao seu depósito
7. Arquitetura da solução
Upload e Download
de ficheiros e pastas
Anotação de
estruturas de
directórios
Hierarquia de directórios
1
UPBox
Dat aNot es
Exportação
RDF
- Metadados
- Controlo
de acessos
- Apresentação de
estruturas de directórios
- Formuários de
descrição
- Estruturas de
directórios
Semantic
MediaWiki
2
- Controlo
de Acessos
- Colaboração
Jena
MySQL
MySQL Storage
- Metadados
de descrição
Workflow de
depósito,
3
embargos...
Repositório
METS SIP
METS SIP
8. UPBox
Upload e Download
de ficheiros e pastas
Anotação de
estruturas de
directórios
- Apresentação d
estruturas de dire
- Formuários de
descrição
Hierarquia de directórios
1
UPBox
Dat aNot es
Exportação
RDF
- Metadados
- Controlo
de acessos
- Estruturas de
directórios
MySQL Storage
2
Semantic
MediaWiki
- Controlo
de Acessos
- Colaboração
MySQL
- Metadados
de descrição
Workflow de
Jena
9. DataNotes
Upload e Download
de ficheiros e pastas
Anotação de
estruturas de
directórios
- Apresentação de
estruturas de directórios
- Formuários de
descrição
Hierarquia de directórios
1
UPBox
Dat aNot es
Exportação
RDF
Metadados
Controlo
de acessos
- Estruturas de
directórios
MySQL Storage
3
2
Semantic
MediaWiki
- Controlo
de Acessos
- Colaboração
MySQL
- Metadados
de descrição
Workflow de
depósito,
embargos...
Jena
10. Depósito de dados em repositórios
Upload e Download
de ficheiros e pastas
Anotação de
estruturas de
directórios
Hierarquia de directórios
1
UPBox
Dat aNot es
Exportação
RDF
- Metadados
- Controlo
de acessos
- Apresentação de
estruturas de directórios
- Formuários de
descrição
- Estruturas de
directórios
Semantic
MediaWiki
2
- Controlo
de Acessos
- Colaboração
Jena
MySQL
MySQL Storage
- Metadados
de descrição
Workflow de
depósito,
3
embargos...
Repositório
METS SIP
METS SIP
11. Conclusões e Trabalho em curso
• Ferramentas foram testadas com investigadores de diversos
domínios
– Boa aceitação
– Alguma necessidade de apoio na escolha de modelos de
metadados para anotação
• Passagem de protótipo a serviço é problemática
• Ferramentas são para apoio aos investigadores, não
preparam ingestão no repositório
• Dados preparados com as ferramentas ficam disponíveis e
com descrição já preparada
12. Contactos e ligações
Cristina Ribeiro
mcr@fe.up.pt
João Rocha da Silva
joaorosilva@gmail.com
João Correia Lopes
jlopes@fe.up.pt
Mais informação: http://dendro.fe.up.pt/