3. Co byste si dnes měli odnést
1. Více jistoty v práci s vědeckými daty a v jejich organizaci
2. Základní návody na DMP
3. Odkazy na existující zdroje informací o této oblasti
Odkaz na prezentaci:
http://bit.ly/dataDMPVUT2
5. Co můžou být data
Výzkumná data jsou zaznamenané informace (bez ohledu na formu a médium)
nezbytné pro podporu nebo validaci pozorování, závěrů nebo výstupů výzkumu.
Efektivní a účinná správa výzkumných dat je základem vědecké a
akademické integrity. (Engineering and Physical Sciences Research Council:
policy framework on research data)
Za vědecká data se dají považovat:
• Primární data získaná z přístrojů
• Sekundární data: dokumenty, tabulky, databáze,
laboratorní protokoly, vizualisace, modely, software,
obrázky, videa, dotazníky, měření, výpočty aj.
6. Data management - definice
Je aktivní správa a zhodnocení dat během jejich životního cyklu.
(Engineering and Physical Sciences Research Council policy framework
on research data).
Pod pojmem si představíme všechny praktiky, manipulace,
vylepšení a procesy, které zajistí vysokou kvalitu vědeckých dat,
která jsou dobře zorganizována, zdokumentována, uložena, udržitelně
uchovávána, dostupná a znovuvyužitelná.(Corti, 2014)
Zahrnuje aktivity: plánování a popisu práce s daty, popis dat, uložení během
výzkumu a po jeho uzavření, případné zveřejnění dat a prolinkování na
publikace vztahující se k výzkumu.
7. DMP - definice
DMPlanning - je proces plánování, popisu a informování o
životním cyklu dat a činností spojených s jejich správou
v průběhu výzkumu.
DMPlan – je dokument, který popisuje tyto činnosti.
Dokumenty často vyžadují poskytovatelé dotací či grantů.
8. Open data - definice
Otevřená výzkumná data jsou zejména data v digitální podobě
pocházející z výzkumných projektů (z experimentů, šetření a měření,
to včetně tzv. metadat [dat, která poskytují informaci o jiných datech]
a podrobností o zpracování dat) dostupná bez omezení online všem potenciálním
uživatelům. Otevřený přístup k výzkumným datům zahrnuje možnost data
volně používat, upravovat a sdílet kýmkoli k jakémukoli účelu.
(NÁRODNÍ STRATEGIE OTEVŘENÉHO PŘÍSTUPU ČR K VĚDECKÝM INFORMACÍM
NA LÉTA 2017–2020)
• Navazuje na tradici Open Access
• Hlavní oblasti: data veřejného sektoru a vědecká data
• Nové využití tzv. citizen science (např. Zooniverse)
10. Data management – Proč?
• Efektivita
• Řízení rizika
• Transparentnost
• Uchování
• Splnění grantových požadavků
11. Data management – Proč?
Také pro vás!
• Organizace dat
• Fluktuace zaměstnanců/vědců
• Neduplikování činnosti
Video - Jak předejít chybám
Zdroj: Peter Murray-Rust, http://blogs.ch.cam.ac.uk/pmr/2011/08/01/why-you-need-a-data-management-plan/, August 2011, CC-BY
12. Data management – Co?
Je třeba si ujasnit jaká vědecká data:
• data produkovaná během výzkumu
• data pro krátkodobé uložení
• data pro dlouhodobé uložení
Pomůcka: http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-
what-data-keep
13. Data management – krátkodobé uchování
Bezpečnost a uchování
(kde se budou data ukládat, jaká forma ukládání, je možné data uložit i
mimo instituci, jak je zajištěna jejich bezpečnost)
Přidělení rolí
(kdo má za co odpovědnost, kdo ukládá, kontroluje zálohy, kdo
kontroluje jejich kvalitu, kdo zajišťuje zveřejnění)
14. Krátkodobé uchování– kde
• Institucionální uložiště – projektové servery, fakultní, ústavu, laboratoře
apod.
• Externí disky – osobní externí disk, projektový apod.
• Cloud uložiště na VUT (neomezené)
Google Apps https://sites.google.com/a/vutbr.cz/help/napovedy/drive Office365 disk
OneDrive https://www.vutbr.cz/cvis/office-365/disk-(onedrive)
• Cloud uložiště mimo VUT
CESNET https://www.cesnet.cz/sluzby/owncloud/ (100GB)
Dropbox https://www.dropbox.com (3TB)
Nejméně dvě uložiště na dvou různých místech!
Nutné hlídat aktualizace!
15. Data management – dlouhodobé uchovávání
• Která data jsou vhodná pro dlouhodobé uchování?
(http://www.dcc.ac.uk/resources/how-guides/appraise-select-data)
16. Data management – metadata, dokumentace,
kontrola kvality
• Jak budete data uchovávat, jak popsat?
(strojově čitelná podoba metadat, linkování, přílohové materiály ke správné
správné interpretaci)
• Jaké standardy a metodologie bude třeba použít při sběru dat?
(má instituce nějaké standardy, poskytovatel, metadatové standardy apod.)
17. Data management – formát
https://www.ukdataservice.ac.uk/manage-data/format/recommended-formats
18. Data management – pojmenování
• Použijte všeobecně srozumitelná pojmenování, která popisují obsah
souboru – ne moc dlouhá
• Konzistentní velká a malá písmena (temp, Temp, TEMP)
• Standardizované zkratky (států, oborů apod.)
• Použijte datum nebo verzi
https://www.data.cam.ac.uk/files/gdl_tilsdocnaming_v1_20090612.pdf
19. Sdílení open research dat– Proč a Co?
• Validace vašich výsledků – případ
• Možnosti nových objevů - případ
• Vyšší citovanost – studie
Zvážit:
Kdo a pro jaké účely využije vaše data?
Jak data zpřístupníte?
Kde, jak budou vyhledatelná, kdy je zpřístupníte?
20. Sdílení open research dat – kdo?
• Vědci –tvůrci dat
• IT – technické zajištění sběru a uchování
• Právníci – etické a právní otázky
• Knihovníci – popis dat, uchování, sdílení
• Projektový manažeři – podmínky daných projektů
• Nakladatelé a poskytovatelé grantů – dávají požadavky
21. Sdílení open research dat – etické standardy a
právo
• Ochrana osobních dat, GDPR
• Bezpečnost (utajované informace)
• Dodržování základních lidských práv
• Komerční a průmyslové využití dat
• Autorské a majetkové právo
Další info.:
http://www.h2020.cz/cs/storage/e38c919be0564a5290b5b0d84db1a977c175d51c?uid=e38c919be
0564a5290b5b0d84db1a977c175d51c
nebo
https://www.fosteropenscience.eu/node/2330
22. Sdílení open research dat – autorské právo
Jak budete data licencovat?
Za jakých podmínek je může někdo využít.
• http://www.dcc.ac.uk/resources/how-guides/license-research-data
• licence Creative Commons
23. Sdílení open research dat – kde?
Registr repozitářů:
Registry of research data repozitories:http://www.re3data.org/
Velké datové repozitáře:
Dryard: http://datadryad.org/
GitHub: https://github.com/
Zenodo: https://zenodo.org/
Figshare: https://figshare.com/
Oborové:
http://oad.simmons.edu/oadwiki/Data_repositories
https://www.libraries.psu.edu/psul/researchguides/pubcur/data_resources.html#open
-data
24. Data management plan
Krátký dokument, který popisuje:
• jaká data budou v projektu vznikat a jak
• jak s nimi budete zacházet
• plány na způsob sdílení a uchování
U každého poskytovatele může být odlišné zadání.
Základ by však měl být stejný.
25. Data management plan – 5 obvyklých témat
1. Popis dat, která se budou sbírat/vznikat (obsah, formát, objem …)
2. Standardy/metodologie pro sběr dat a jejich management
3. Etické standardy a právo
4. Plány na sdílení a zpřístupnění
5. Strategie na dlouhodobé uchování
http://www.dcc.ac.uk/resources/data-management-plans/checklist
26. Data management plan – tipy
1. Piště jednoduše, krátce a konkrétně
2. Jasně vymezte role kdo, kdy a jak
3. Hledejte standardy/metodologie pro sběr dat a jejich management
4. Konzultujte a spolupracujte
5. Obhajujte svá rozhodnutí
27. DMP – Horizon 2020
Vzor DMP pro Horizon 2020 – Annex 1 -
http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf
Jednotlivé informace v DMP pro každý dataset:
• Data set reference and name: základní popis a jméno datasetu
• Data set description: popis dat, jejich původu, kde budou generována a sbírána. Kdo by je v budoucnu mohl využívat.
Informace o tom zda existují nebo neexistují podobná data a možnosti je znovu využít.
• Standards and metadata: odkazy na existující využitelné standardy popisu dat, pokud neexistují, návrh jak budou data
metadatově popisována.
• Data sharing: jak budou data sdílena – otevřeně nebo s nějakou restrikcí pro specifickou skupinu. Důvod proč popřípadě
nemohou být sdílena. Popis přístupu k datům. Uvedené embargo, pokud existuje. Popsané technické mechanismy
přístupu k datům, popřípadě speciální software.
• Archiving and preservation (including storage and backup): kde budou data uložena, archivována a ochráněna (repozitář).
Jak dlouho budou data uložena, jak se zařídí dlouhodobé uchování. Finální objem dat. Popis finančního a personálního
zajištění.
Humbolt University: https://www.cms.hu-berlin.de/ueberblick/projekte/dataman/dmp-anleitung/view
28. DMP – zajištění zdrojů
• finančních
• personálních
Pomůcka pro vytváření rozpočtu: http://www.data-
archive.ac.uk/media/247429/costingtool.pdf
29. DMP – příklady
Life Sciences: https://riojournal.com/article/11624/
Social Sciences:
https://library.leeds.ac.uk/download/downloads/id/87/data_management_p
lan_example_esrc.pdf
Další: http://www.dcc.ac.uk/resources/data-management-plans/guidance-
examples
30. DPM - požadavky poskytovatelů
Zdroj: https://www.slideshare.net/sjDCC/dmp-dmponline
31. DPM - požadavky poskytovatelů
Zdroj: http://www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies
32. DPM - požadavky poskytovatelů
• Nakladatelé: Plos, BioMed Central, Nature publishing, Elsevier a další
34. DMP – kurzy
Foster: https://www.fosteropenscience.eu/node/2328
Univerzity of Edinburgh: http://datalib.edina.ac.uk/mantra/
University of Minnesota: https://sites.google.com/a/umn.edu/data-
management-course_structures/home-1
35. Situace na VUT
Horizon2020
• základní informace k této oblasti lze nalézt na Portálu
knihoven: https://www.vutbr.cz/knihovny/openaccess/projekty-eu
Školení
• je možné domluvit při účasti 5 a více účastníků na VUT
• pro h2020, 10 a více účastníků školení od TC AVČR – Jiří Kotouček kotoucek@tc.cz
Individuální konzultace
Nebojte se na nás obrátit! - dedicova@lib.vutbr.cz
VUT strategie pro Open Data
• je nutné provést průzkum mezi jednotlivými zainteresovanými
• vzhledem k plánovanému Akčnímu plánu pro OA v ČR je nutné zvolit strategii pro OA
na VUT