SlideShare una empresa de Scribd logo
1 de 23
Descargar para leer sin conexión
Datová úložiště CESNET
David Antoš
21. 10. 2013
Přehled
proč má smysl budovat národní datová úložiště pro
vědecká data
budovaná infrastruktura
jak úložiště použít
přístupové mechanismy
správa uživatelů na úložištích
použití pro náročnější uživatele
speciální aplikace
Smysl externího úložiště
uživatelé raději drží data na vlastním zařízení. . .
to ale nedává rozumné garance dlouhodobého uchovávání
používají se nevhodná média, chybí systematická péče
data je lépe uchovávat v živém systému

konsolidace zdrojů – národní úložiště vědeckých dat
umožňuje pořídit zařízení dostatečné velikosti
spravované specializovaným týmem
s možností sdílení dat mezi skupinami uživatelů
Cíl: dlouhodobé uchování dat
potřeba dlouhodobě uchovávat vědecká data vzrůstá
uchování primárních dat z experimentů a výpočtů
s ohledem na potenciál jejich dalšího využití
k návratu a revizi publikovaných výsledků

uchování zajišťujeme na úrovni zachování binárních dat
(bitstream)
správce úložiště nerozumí odborné povaze dat
ani nemůže rozhodovat o smysluplnosti jejich archivace

proto neděláme LTP (Long-Term Preservation)
bitstream je nicméně předpokladem pro uchování dat
další kopie, geografické repliky, redundance v systému
Možnosti využití datových úložišť
zálohy
uživatelé mají primární data u sebe
na úložiště odkládají zálohu pro případ havárie

archivace
uživatelé na úložiště odkládají cenná primární data
data nejsou často využívána
uživatelé nemají prostředky pro jejich uchovávání

sdílení dat
distribuovaný tým potřebuje společně pracovat nad
většími objemy dat, případně je zveřejňovat

„něco jiného“
distribuce obsahu, jiné speciální aplikace
Možnosti využití datových úložišť
a naopak: na co se vzdálené úložiště příliš nehodí
interaktivní práce zejména s velkým množstvím malých
souborů
ukládání dat s potřebou přístupu v reálném čase
prioritou je spolehlivost uložení

přímý provoz systémů s nutností 24/7 přístupu
„toto není úložiště pod váš SAP“
na to je obecně vzdálené úložiště nevhodné

vhodné použití pro podobné scénáře
primární 24/7 data u uživatele, na CESNET
zálohy/repliky
rozdělení životně důležitých dat vs. „nice to have“ dat
Infrastruktura
Děčín

Liberec

PIONIER

Hradec Králové
Praha

Pardubice
Opava

Plzeň

Karviná

Ostrava
Olomouc

AMS-IX

NIX

Jihlava

Zlín
Brno

České Budějovice
GÉANT
Internet

ACONET

SANET
Infrastruktura
trojice úložišť: Plzeň, Jihlava, Brno
celková hrubá kapacita cca 16 PB + 5 PB(∗ )
Plzeň v pilotním provozu od května 2012
v areálu ZČU
cca 500 TB disků + 3300 TB pásek
SGI Data Migration Facility, CXFS
pásková knihovna Infinite Storage
doplňujeme SGI COPAN a pásky(∗ )

Jihlava a Brno
dodáno v květnu 2013
probíhá uvádění do zkušebního provozu, testovací
uživatelé
řešení IBM založené na GPFS
Knihovna v Plzni
Infrastruktura – další složky
aneb úložiště „mimo ta naše“
disková pole zapojená v MetaCentru
hierarchické úložiště a disková pole CERIT-SC
pro vlastní potřebu projektů: CEITEC

obvykle jsou nebo budou spojena systémem správy
uživatelských účtů
používají obdobné protokoly
Úložiště jsou hierarchická
vrstvy médií různé kapacity a rychlosti
rychlé disky/pomalejší disky/MAID/pásky
drahý provoz → levnější provoz

a automatizovaný systém pro přesuny dat mezi nimi
déle nepoužívaná data do pomalejších vrstev
pro uživatele transparentní, resp. téměř transparentní
přístup k dlouho nepoužitému souboru trvá déle
uživatelům to obvykle nevadí
Zaplnění pásek v Plzni
Jak na úložiště přenášet data –
motivace
většina software předpokládá použití lokálních disků
vzdálené síťové disky se chovají jako lokální
byť nemají vysoký výkon při práci s malými soubory

je nutno podporovat škálu přístupových protokolů
pro různé případy použití
držíme se nicméně spíše klasických protokolů
Přenos dat na úložiště
souborové
NFSv4 (známé uživatelům MetaCentra)
rsync, scp, FTPS
obvykle autentizované systémem Kerberos
existují GUI klienti i nástroje pro příkazovou řádku pro
hlavní platformy
Globus Online – vysokorychlostní přenosy
výhledově CIFS (známý „síťový disk“ z Windows)

speciální
gridové úložiště v systému dCache
FileSender
připravujeme ownCloud

bloková zařízení (není preferováno)
FileSender
webová služba pro jednorázový přenos (velkých) souborů
velkých: aktuálně 500 GB

přispíváme i k jeho vývoji
http://filesender.cesnet.cz
alespoň jedna strana komunikace musí být oprávněný
uživatel infrastruktury
autentizace federací eduID.cz

oprávněný uživatel může nahrát soubor a poslat mu
oznámení
lze poslat komukoli pozvánku
testovací verze na http://filesender2.cesnet.cz
Speciální protokoly/aplikace
GlobusOnline
„klikací FTP na steroidech“
kopírování velkého objemu dat
řízené pomocí webového rozhraní
mezi „koncovými body“ – úložišti podporujícími
GlobusOnline nebo lokálním strojem

ownCloud
cloudové úložiště, synchronizace souborů

dCache
jeden ze systémů správy dat vyvinutých pro CERN
pro ukládání PB objemů
Jak se stát uživatelem – snadno
pokud
chcete využívat souborově orientované protokoly
dostačuje prefabrikovaná politika migrací dat
ukládáte jen individuální data
potřebujete ukládat nejvýše jednotky TB

tak se jen zaregistrujte na http://du.cesnet.cz
vyžaduje to ověření uživatele z akademické instituce

členství se po roce prodlužuje
jako indikace, že uživatel „ ještě ví o svých datech“

kódové označení: VO Storage
jestli to nestačí, tak. . .
Jak se stát uživatelem – snadno
pokud
chcete využívat souborově orientované protokoly
dostačuje prefabrikovaná politika migrací dat
ukládáte jen individuální data
potřebujete ukládat nejvýše jednotky TB

tak se jen zaregistrujte na http://du.cesnet.cz
vyžaduje to ověření uživatele z akademické instituce

členství se po roce prodlužuje
jako indikace, že uživatel „ ještě ví o svých datech“

kódové označení: VO Storage
jestli to nestačí, tak. . . ale až za chvilku
Správa uživatelských účtů
jednotná správa uživatelských účtů v infrastruktuře
systém Perun
proč to? zodpovídáme v projektu za to, komu služby
poskytujeme (akademické komunitě), řídíme mnoho
různých služeb

identita uživatele je podchycena centrálně
ověřena proti federaci eduID.cz
alternativní mechanismus pro nečleny federace je
k dispozici

na identitu uživatele jsou navázány jednotlivé mechanismy
přístupu k datům
uživatel má jednotné webové rozhraní pro správu účtu
Úložiště pro náročnější
nestačí VO Storage? založíme vám virtuální organizaci!
VO je skupina uživatelů se společným zájmem, kteří
vystupují jako celek
VO má správce, který
jedná s poskytovatelem zdrojů
rozhoduje o podmínkách členství jednotlivých uživatelů

dohoda o poskytování zdrojů mezi VO a správcem zdroje
popisuje nastavení technických parametrů
velikost poskytovaného prostoru
použité přístupové protokoly
politika ukládání dat, počty kopií/replik

VO může využívat různé typy zdrojů
Založení VO prakticky
napište nám na du-support@cesnet.cz
domluvíme se, co potřebujete
opravdu to potřebujeme pochopit
kolik dat máte, jak s nimi pracujete, . . .

připravíme konfiguraci úložiště
založíme virtuální organizaci
pozveme vás do ní a povýšíme na administrátora
dál si uživatele spravujete sami, vytváříte skupiny, . . .
ukládáte data přes FTP/rsync/NFSv4/...
my se staráme, aby na se vytvářely jejich repliky, . . .
Aktuální stav
úložiště v Plzni v pilotním provozu
přichází na něj uživatelé
individuální se mohou přihlásit do VO Storage
připojeno do MetaCentra
přímo pro uživatele z MetaCentra

FileSender v provozu
postupně obsluhujeme zájemce o náročnější využívání
vždy vyžaduje komunikaci
pro velká data (desítky TB+): nezbytná technická
znalost uživatelů

úložiště v Brně a Jihlavě – testovací uživatelé
Kontakty
http://du.cesnet.cz
uživatelská podpora: du-support@cesnet.cz

Más contenido relacionado

Destacado

FLAB: Forenzní laboratoř
FLAB: Forenzní laboratořFLAB: Forenzní laboratoř
FLAB: Forenzní laboratořCESNET
 
SABU: Sdílení a analýza bezpečnostních událostí
SABU: Sdílení a analýza bezpečnostních událostíSABU: Sdílení a analýza bezpečnostních událostí
SABU: Sdílení a analýza bezpečnostních událostíCESNET
 
Bezpečnost síťové části e-Infrastruktury CESNET
Bezpečnost síťové části e-Infrastruktury CESNETBezpečnost síťové části e-Infrastruktury CESNET
Bezpečnost síťové části e-Infrastruktury CESNETCESNET
 
Mentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojů
Mentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojůMentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojů
Mentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojůCESNET
 
PRedikce a Ochrana před Kybernetickými Incidenty
PRedikce a Ochrana před Kybernetickými IncidentyPRedikce a Ochrana před Kybernetickými Incidenty
PRedikce a Ochrana před Kybernetickými IncidentyCESNET
 
Analýza dat z Wardenu
Analýza dat z WardenuAnalýza dat z Wardenu
Analýza dat z WardenuCESNET
 
Útoky na DNS
Útoky na DNSÚtoky na DNS
Útoky na DNSCESNET
 
Malware Houdiny
Malware HoudinyMalware Houdiny
Malware HoudinyCESNET
 
Ten Reasons Why You Should Prefer PostgreSQL to MySQL
Ten Reasons Why You Should Prefer PostgreSQL to MySQLTen Reasons Why You Should Prefer PostgreSQL to MySQL
Ten Reasons Why You Should Prefer PostgreSQL to MySQLanandology
 

Destacado (9)

FLAB: Forenzní laboratoř
FLAB: Forenzní laboratořFLAB: Forenzní laboratoř
FLAB: Forenzní laboratoř
 
SABU: Sdílení a analýza bezpečnostních událostí
SABU: Sdílení a analýza bezpečnostních událostíSABU: Sdílení a analýza bezpečnostních událostí
SABU: Sdílení a analýza bezpečnostních událostí
 
Bezpečnost síťové části e-Infrastruktury CESNET
Bezpečnost síťové části e-Infrastruktury CESNETBezpečnost síťové části e-Infrastruktury CESNET
Bezpečnost síťové části e-Infrastruktury CESNET
 
Mentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojů
Mentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojůMentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojů
Mentat a Warden: Sběr a zpracování dat z bezpečnostních nástrojů
 
PRedikce a Ochrana před Kybernetickými Incidenty
PRedikce a Ochrana před Kybernetickými IncidentyPRedikce a Ochrana před Kybernetickými Incidenty
PRedikce a Ochrana před Kybernetickými Incidenty
 
Analýza dat z Wardenu
Analýza dat z WardenuAnalýza dat z Wardenu
Analýza dat z Wardenu
 
Útoky na DNS
Útoky na DNSÚtoky na DNS
Útoky na DNS
 
Malware Houdiny
Malware HoudinyMalware Houdiny
Malware Houdiny
 
Ten Reasons Why You Should Prefer PostgreSQL to MySQL
Ten Reasons Why You Should Prefer PostgreSQL to MySQLTen Reasons Why You Should Prefer PostgreSQL to MySQL
Ten Reasons Why You Should Prefer PostgreSQL to MySQL
 

Similar a Datová úložiště CESNET

Michal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNETMichal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNETLTP-portal-cz
 
Zkušenosti se systémem Archivematica
Zkušenosti se systémem ArchivematicaZkušenosti se systémem Archivematica
Zkušenosti se systémem Archivematicadp-blog-cz
 
Webinář: Co nového přináší verze 9 jedničky v zálohování Veeam Backup & Repli...
Webinář: Co nového přináší verze 9 jedničky v zálohování Veeam Backup & Repli...Webinář: Co nového přináší verze 9 jedničky v zálohování Veeam Backup & Repli...
Webinář: Co nového přináší verze 9 jedničky v zálohování Veeam Backup & Repli...Jaroslav Prodelal
 
Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2MarketingArrowECS_CZ
 
Revoluce v cloudu: první autonomně řízená databáze na světě
Revoluce v cloudu: první autonomně řízená databáze na světěRevoluce v cloudu: první autonomně řízená databáze na světě
Revoluce v cloudu: první autonomně řízená databáze na světěMarketingArrowECS_CZ
 
View5 technicka 2011
View5 technicka 2011View5 technicka 2011
View5 technicka 2011Vladan Laxa
 
Webinář: Vylepšete ochranu virtuální infrastruktury - Veeam Backup & Replication
Webinář: Vylepšete ochranu virtuální infrastruktury - Veeam Backup & ReplicationWebinář: Vylepšete ochranu virtuální infrastruktury - Veeam Backup & Replication
Webinář: Vylepšete ochranu virtuální infrastruktury - Veeam Backup & ReplicationJaroslav Prodelal
 
Geoportál „pro každého“
Geoportál „pro každého“Geoportál „pro každého“
Geoportál „pro každého“Karel Charvat
 
ECM-information system
ECM-information systemECM-information system
ECM-information systemTereza Dvorska
 
Semináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních datSemináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních datJaroslav Prodelal
 
Microsoft Azure – Směr, jak změnit pohled na IT
Microsoft Azure – Směr, jak změnit pohled na ITMicrosoft Azure – Směr, jak změnit pohled na IT
Microsoft Azure – Směr, jak změnit pohled na ITMarketingArrowECS_CZ
 
Michal Konečný - Systém Archivematica z pohledu uživatele
Michal Konečný - Systém Archivematica z pohledu uživateleMichal Konečný - Systém Archivematica z pohledu uživatele
Michal Konečný - Systém Archivematica z pohledu uživateleLTP-portal-cz
 
Webinář: Ovládněte umění správy dokumentů ve vaší organizaci
Webinář: Ovládněte umění správy dokumentů ve vaší organizaciWebinář: Ovládněte umění správy dokumentů ve vaší organizaci
Webinář: Ovládněte umění správy dokumentů ve vaší organizaciJaroslav Prodelal
 
Závěrečný úkol KPI
Závěrečný  úkol KPIZávěrečný  úkol KPI
Závěrečný úkol KPIJan Lysý
 

Similar a Datová úložiště CESNET (20)

02 Funkční model OAIS.pptx
02 Funkční model OAIS.pptx02 Funkční model OAIS.pptx
02 Funkční model OAIS.pptx
 
Michal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNETMichal Růžička - Napojení systému Archivematica na úložiště CESNET
Michal Růžička - Napojení systému Archivematica na úložiště CESNET
 
Zkušenosti se systémem Archivematica
Zkušenosti se systémem ArchivematicaZkušenosti se systémem Archivematica
Zkušenosti se systémem Archivematica
 
Webinář: Co nového přináší verze 9 jedničky v zálohování Veeam Backup & Repli...
Webinář: Co nového přináší verze 9 jedničky v zálohování Veeam Backup & Repli...Webinář: Co nového přináší verze 9 jedničky v zálohování Veeam Backup & Repli...
Webinář: Co nového přináší verze 9 jedničky v zálohování Veeam Backup & Repli...
 
Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2
 
05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx05 Standardy a nástroje.pptx
05 Standardy a nástroje.pptx
 
Revoluce v cloudu: první autonomně řízená databáze na světě
Revoluce v cloudu: první autonomně řízená databáze na světěRevoluce v cloudu: první autonomně řízená databáze na světě
Revoluce v cloudu: první autonomně řízená databáze na světě
 
View5 technicka 2011
View5 technicka 2011View5 technicka 2011
View5 technicka 2011
 
02 OAIS.pptx
02 OAIS.pptx02 OAIS.pptx
02 OAIS.pptx
 
Webinář: Vylepšete ochranu virtuální infrastruktury - Veeam Backup & Replication
Webinář: Vylepšete ochranu virtuální infrastruktury - Veeam Backup & ReplicationWebinář: Vylepšete ochranu virtuální infrastruktury - Veeam Backup & Replication
Webinář: Vylepšete ochranu virtuální infrastruktury - Veeam Backup & Replication
 
Geoportál „pro každého“
Geoportál „pro každého“Geoportál „pro každého“
Geoportál „pro každého“
 
ECM-information system
ECM-information systemECM-information system
ECM-information system
 
Semináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních datSemináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních dat
 
Microsoft Azure – Směr, jak změnit pohled na IT
Microsoft Azure – Směr, jak změnit pohled na ITMicrosoft Azure – Směr, jak změnit pohled na IT
Microsoft Azure – Směr, jak změnit pohled na IT
 
LTP-workshop
LTP-workshopLTP-workshop
LTP-workshop
 
Lotus Notes 7
Lotus Notes 7Lotus Notes 7
Lotus Notes 7
 
Michal Konečný - Systém Archivematica z pohledu uživatele
Michal Konečný - Systém Archivematica z pohledu uživateleMichal Konečný - Systém Archivematica z pohledu uživatele
Michal Konečný - Systém Archivematica z pohledu uživatele
 
Webinář: Ovládněte umění správy dokumentů ve vaší organizaci
Webinář: Ovládněte umění správy dokumentů ve vaší organizaciWebinář: Ovládněte umění správy dokumentů ve vaší organizaci
Webinář: Ovládněte umění správy dokumentů ve vaší organizaci
 
Závěrečný úkol KPI
Závěrečný  úkol KPIZávěrečný  úkol KPI
Závěrečný úkol KPI
 
TNPW2-2011-10
TNPW2-2011-10TNPW2-2011-10
TNPW2-2011-10
 

Más de CESNET

Cef 2014 opening
Cef 2014 openingCef 2014 opening
Cef 2014 openingCESNET
 
Strategy and innovation_in_cef_networks
Strategy and innovation_in_cef_networksStrategy and innovation_in_cef_networks
Strategy and innovation_in_cef_networksCESNET
 
Fibre footprint-for-research-infrastructures
Fibre footprint-for-research-infrastructuresFibre footprint-for-research-infrastructures
Fibre footprint-for-research-infrastructuresCESNET
 
Fibre spectrum sharing_for_rd_networks
Fibre spectrum sharing_for_rd_networksFibre spectrum sharing_for_rd_networks
Fibre spectrum sharing_for_rd_networksCESNET
 
A little talk_about_sane_progress
A little talk_about_sane_progressA little talk_about_sane_progress
A little talk_about_sane_progressCESNET
 
Představení e-Infrastruktury CESNET
Představení e-Infrastruktury CESNETPředstavení e-Infrastruktury CESNET
Představení e-Infrastruktury CESNETCESNET
 
Živé přenosy videa na konference, semináře, kulturní představení, apod. v tuz...
Živé přenosy videa na konference, semináře, kulturní představení, apod. v tuz...Živé přenosy videa na konference, semináře, kulturní představení, apod. v tuz...
Živé přenosy videa na konference, semináře, kulturní představení, apod. v tuz...CESNET
 
Prostředky spolupráce v reálném čase
Prostředky spolupráce v reálném časeProstředky spolupráce v reálném čase
Prostředky spolupráce v reálném časeCESNET
 
Forenzní laboratoř
Forenzní laboratořForenzní laboratoř
Forenzní laboratořCESNET
 
PKI služby CESNETu
PKI služby CESNETuPKI služby CESNETu
PKI služby CESNETuCESNET
 
Antispam Gateway – pračka elektronické pošty
Antispam Gateway – pračka elektronické poštyAntispam Gateway – pračka elektronické pošty
Antispam Gateway – pračka elektronické poštyCESNET
 
Základní funkce MetaCentra a jejich využití
Základní funkce MetaCentra a jejich využitíZákladní funkce MetaCentra a jejich využití
Základní funkce MetaCentra a jejich využitíCESNET
 
Bezpečnost sítě CESNET2
Bezpečnost sítě CESNET2Bezpečnost sítě CESNET2
Bezpečnost sítě CESNET2CESNET
 
Komunikační infrastruktura - síť CESNET2
Komunikační infrastruktura - síť CESNET2Komunikační infrastruktura - síť CESNET2
Komunikační infrastruktura - síť CESNET2CESNET
 
Služby e-infrastruktury CESNET
Služby e-infrastruktury CESNETSlužby e-infrastruktury CESNET
Služby e-infrastruktury CESNETCESNET
 
Uživatelská péče a podpora
Uživatelská péče a podporaUživatelská péče a podpora
Uživatelská péče a podporaCESNET
 

Más de CESNET (16)

Cef 2014 opening
Cef 2014 openingCef 2014 opening
Cef 2014 opening
 
Strategy and innovation_in_cef_networks
Strategy and innovation_in_cef_networksStrategy and innovation_in_cef_networks
Strategy and innovation_in_cef_networks
 
Fibre footprint-for-research-infrastructures
Fibre footprint-for-research-infrastructuresFibre footprint-for-research-infrastructures
Fibre footprint-for-research-infrastructures
 
Fibre spectrum sharing_for_rd_networks
Fibre spectrum sharing_for_rd_networksFibre spectrum sharing_for_rd_networks
Fibre spectrum sharing_for_rd_networks
 
A little talk_about_sane_progress
A little talk_about_sane_progressA little talk_about_sane_progress
A little talk_about_sane_progress
 
Představení e-Infrastruktury CESNET
Představení e-Infrastruktury CESNETPředstavení e-Infrastruktury CESNET
Představení e-Infrastruktury CESNET
 
Živé přenosy videa na konference, semináře, kulturní představení, apod. v tuz...
Živé přenosy videa na konference, semináře, kulturní představení, apod. v tuz...Živé přenosy videa na konference, semináře, kulturní představení, apod. v tuz...
Živé přenosy videa na konference, semináře, kulturní představení, apod. v tuz...
 
Prostředky spolupráce v reálném čase
Prostředky spolupráce v reálném časeProstředky spolupráce v reálném čase
Prostředky spolupráce v reálném čase
 
Forenzní laboratoř
Forenzní laboratořForenzní laboratoř
Forenzní laboratoř
 
PKI služby CESNETu
PKI služby CESNETuPKI služby CESNETu
PKI služby CESNETu
 
Antispam Gateway – pračka elektronické pošty
Antispam Gateway – pračka elektronické poštyAntispam Gateway – pračka elektronické pošty
Antispam Gateway – pračka elektronické pošty
 
Základní funkce MetaCentra a jejich využití
Základní funkce MetaCentra a jejich využitíZákladní funkce MetaCentra a jejich využití
Základní funkce MetaCentra a jejich využití
 
Bezpečnost sítě CESNET2
Bezpečnost sítě CESNET2Bezpečnost sítě CESNET2
Bezpečnost sítě CESNET2
 
Komunikační infrastruktura - síť CESNET2
Komunikační infrastruktura - síť CESNET2Komunikační infrastruktura - síť CESNET2
Komunikační infrastruktura - síť CESNET2
 
Služby e-infrastruktury CESNET
Služby e-infrastruktury CESNETSlužby e-infrastruktury CESNET
Služby e-infrastruktury CESNET
 
Uživatelská péče a podpora
Uživatelská péče a podporaUživatelská péče a podpora
Uživatelská péče a podpora
 

Datová úložiště CESNET

  • 1. Datová úložiště CESNET David Antoš 21. 10. 2013
  • 2. Přehled proč má smysl budovat národní datová úložiště pro vědecká data budovaná infrastruktura jak úložiště použít přístupové mechanismy správa uživatelů na úložištích použití pro náročnější uživatele speciální aplikace
  • 3. Smysl externího úložiště uživatelé raději drží data na vlastním zařízení. . . to ale nedává rozumné garance dlouhodobého uchovávání používají se nevhodná média, chybí systematická péče data je lépe uchovávat v živém systému konsolidace zdrojů – národní úložiště vědeckých dat umožňuje pořídit zařízení dostatečné velikosti spravované specializovaným týmem s možností sdílení dat mezi skupinami uživatelů
  • 4. Cíl: dlouhodobé uchování dat potřeba dlouhodobě uchovávat vědecká data vzrůstá uchování primárních dat z experimentů a výpočtů s ohledem na potenciál jejich dalšího využití k návratu a revizi publikovaných výsledků uchování zajišťujeme na úrovni zachování binárních dat (bitstream) správce úložiště nerozumí odborné povaze dat ani nemůže rozhodovat o smysluplnosti jejich archivace proto neděláme LTP (Long-Term Preservation) bitstream je nicméně předpokladem pro uchování dat další kopie, geografické repliky, redundance v systému
  • 5. Možnosti využití datových úložišť zálohy uživatelé mají primární data u sebe na úložiště odkládají zálohu pro případ havárie archivace uživatelé na úložiště odkládají cenná primární data data nejsou často využívána uživatelé nemají prostředky pro jejich uchovávání sdílení dat distribuovaný tým potřebuje společně pracovat nad většími objemy dat, případně je zveřejňovat „něco jiného“ distribuce obsahu, jiné speciální aplikace
  • 6. Možnosti využití datových úložišť a naopak: na co se vzdálené úložiště příliš nehodí interaktivní práce zejména s velkým množstvím malých souborů ukládání dat s potřebou přístupu v reálném čase prioritou je spolehlivost uložení přímý provoz systémů s nutností 24/7 přístupu „toto není úložiště pod váš SAP“ na to je obecně vzdálené úložiště nevhodné vhodné použití pro podobné scénáře primární 24/7 data u uživatele, na CESNET zálohy/repliky rozdělení životně důležitých dat vs. „nice to have“ dat
  • 8. Infrastruktura trojice úložišť: Plzeň, Jihlava, Brno celková hrubá kapacita cca 16 PB + 5 PB(∗ ) Plzeň v pilotním provozu od května 2012 v areálu ZČU cca 500 TB disků + 3300 TB pásek SGI Data Migration Facility, CXFS pásková knihovna Infinite Storage doplňujeme SGI COPAN a pásky(∗ ) Jihlava a Brno dodáno v květnu 2013 probíhá uvádění do zkušebního provozu, testovací uživatelé řešení IBM založené na GPFS
  • 10. Infrastruktura – další složky aneb úložiště „mimo ta naše“ disková pole zapojená v MetaCentru hierarchické úložiště a disková pole CERIT-SC pro vlastní potřebu projektů: CEITEC obvykle jsou nebo budou spojena systémem správy uživatelských účtů používají obdobné protokoly
  • 11. Úložiště jsou hierarchická vrstvy médií různé kapacity a rychlosti rychlé disky/pomalejší disky/MAID/pásky drahý provoz → levnější provoz a automatizovaný systém pro přesuny dat mezi nimi déle nepoužívaná data do pomalejších vrstev pro uživatele transparentní, resp. téměř transparentní přístup k dlouho nepoužitému souboru trvá déle uživatelům to obvykle nevadí
  • 13. Jak na úložiště přenášet data – motivace většina software předpokládá použití lokálních disků vzdálené síťové disky se chovají jako lokální byť nemají vysoký výkon při práci s malými soubory je nutno podporovat škálu přístupových protokolů pro různé případy použití držíme se nicméně spíše klasických protokolů
  • 14. Přenos dat na úložiště souborové NFSv4 (známé uživatelům MetaCentra) rsync, scp, FTPS obvykle autentizované systémem Kerberos existují GUI klienti i nástroje pro příkazovou řádku pro hlavní platformy Globus Online – vysokorychlostní přenosy výhledově CIFS (známý „síťový disk“ z Windows) speciální gridové úložiště v systému dCache FileSender připravujeme ownCloud bloková zařízení (není preferováno)
  • 15. FileSender webová služba pro jednorázový přenos (velkých) souborů velkých: aktuálně 500 GB přispíváme i k jeho vývoji http://filesender.cesnet.cz alespoň jedna strana komunikace musí být oprávněný uživatel infrastruktury autentizace federací eduID.cz oprávněný uživatel může nahrát soubor a poslat mu oznámení lze poslat komukoli pozvánku testovací verze na http://filesender2.cesnet.cz
  • 16. Speciální protokoly/aplikace GlobusOnline „klikací FTP na steroidech“ kopírování velkého objemu dat řízené pomocí webového rozhraní mezi „koncovými body“ – úložišti podporujícími GlobusOnline nebo lokálním strojem ownCloud cloudové úložiště, synchronizace souborů dCache jeden ze systémů správy dat vyvinutých pro CERN pro ukládání PB objemů
  • 17. Jak se stát uživatelem – snadno pokud chcete využívat souborově orientované protokoly dostačuje prefabrikovaná politika migrací dat ukládáte jen individuální data potřebujete ukládat nejvýše jednotky TB tak se jen zaregistrujte na http://du.cesnet.cz vyžaduje to ověření uživatele z akademické instituce členství se po roce prodlužuje jako indikace, že uživatel „ ještě ví o svých datech“ kódové označení: VO Storage jestli to nestačí, tak. . .
  • 18. Jak se stát uživatelem – snadno pokud chcete využívat souborově orientované protokoly dostačuje prefabrikovaná politika migrací dat ukládáte jen individuální data potřebujete ukládat nejvýše jednotky TB tak se jen zaregistrujte na http://du.cesnet.cz vyžaduje to ověření uživatele z akademické instituce členství se po roce prodlužuje jako indikace, že uživatel „ ještě ví o svých datech“ kódové označení: VO Storage jestli to nestačí, tak. . . ale až za chvilku
  • 19. Správa uživatelských účtů jednotná správa uživatelských účtů v infrastruktuře systém Perun proč to? zodpovídáme v projektu za to, komu služby poskytujeme (akademické komunitě), řídíme mnoho různých služeb identita uživatele je podchycena centrálně ověřena proti federaci eduID.cz alternativní mechanismus pro nečleny federace je k dispozici na identitu uživatele jsou navázány jednotlivé mechanismy přístupu k datům uživatel má jednotné webové rozhraní pro správu účtu
  • 20. Úložiště pro náročnější nestačí VO Storage? založíme vám virtuální organizaci! VO je skupina uživatelů se společným zájmem, kteří vystupují jako celek VO má správce, který jedná s poskytovatelem zdrojů rozhoduje o podmínkách členství jednotlivých uživatelů dohoda o poskytování zdrojů mezi VO a správcem zdroje popisuje nastavení technických parametrů velikost poskytovaného prostoru použité přístupové protokoly politika ukládání dat, počty kopií/replik VO může využívat různé typy zdrojů
  • 21. Založení VO prakticky napište nám na du-support@cesnet.cz domluvíme se, co potřebujete opravdu to potřebujeme pochopit kolik dat máte, jak s nimi pracujete, . . . připravíme konfiguraci úložiště založíme virtuální organizaci pozveme vás do ní a povýšíme na administrátora dál si uživatele spravujete sami, vytváříte skupiny, . . . ukládáte data přes FTP/rsync/NFSv4/... my se staráme, aby na se vytvářely jejich repliky, . . .
  • 22. Aktuální stav úložiště v Plzni v pilotním provozu přichází na něj uživatelé individuální se mohou přihlásit do VO Storage připojeno do MetaCentra přímo pro uživatele z MetaCentra FileSender v provozu postupně obsluhujeme zájemce o náročnější využívání vždy vyžaduje komunikaci pro velká data (desítky TB+): nezbytná technická znalost uživatelů úložiště v Brně a Jihlavě – testovací uživatelé