Strukturní biologie se zabývá molekulární strukturou hlavně nukleových kyselin a proteinů a vlivu různých konformací na fyzikálně chemické vlastnosti. Rychlost a množství popsaných struktur je daleko za odhadovaným množstvím proteinů vyskytujících se v živých organismech a nové metody kombinují různé biofyzikální postupy.Příspěvek shrnuje nároky a výzvy různých metod strukturní biologie na IT infrastrukturu a možnosti souvisejícího výzkumu jako je fyziologie člověka a objevování léku. Na příkladu vlastní zkušenosti z projektu pro tzv. integra-tivní strukturní biologii, jsou vyčteny metody pro sdílení výpočetních metod, dat, autentizaci, autorizaci a podpory řízení procesu experimentu pro jeho účastníky.
Význam a nároky strukturní biologie pro fungování procesů v lidském těle a objevování léčiv
1. Význam a nároky strukturní biologie
pro výzkum fungování procesů v
lidském těle a objevování léčiv
Mgr. Tomáš Kulhánek, Ph.D.
1,2
1STFC, UK
2E-Science Data Factory, FR
2. STFC
Multidisciplinární
výzkumná organizace
£678 mil. 2017-2018,
90% rozpočtu z
národních zdrojů
1934 zaměstnanců
Podpora asi 800 PhD
studentů
E-Science Data Factory
Startup, SME sídlo v
Paříži
2 zaměstnanci
Zaměření na vývoj a
využití technologie pro
vědecké anotace dat
3. Obsah
Metody strukturní biologie
nároky na IT infrastrukturu
Nároky integrativního přístupu (kombinace
výsledků více metod)
Význam pro další aplikace
5. Metody strukturní biologie
3D struktura (sekundární, terciární a
quaternální) nelze jednoduše odvodit z primární
struktury
Přímé pozorování
Mikroskopie (Cryo-EM)
Nepřímé metody
Rentgenová krystalografie
Nukleární magnetická rezonance
...
9. Vědecké zařízení pro uživatele
Instruct-ERIC – sdružení výzkumných
infrastruktur v Evropě pro strukturní biologii
10. Nároky na IT infrastrukturu
X-Ray
experiment - 1-10 GB
Procesing – spojení
intenzit difrakčních
bodů a sloučení
shodných odrazů,
redukce dat 1-10 MB
Analýza – určení
struktury (objemy, při
dostatečném rozlišení
struktura na úrovni
atomů
11. Nároky na IT infrastrukturu
NMR
experiment – 100MB-1
GB
Procesing –
Fourierova
transformace1-10 GB
Analýza – určení
struktury (objemy, při
dostatečném rozlišení
struktura na úrovni
atomů – srovnání
podobných struktur)
12. Nároky na IT infrastrukturu
Cryo-EM
experiment – 10GB
- 1 TB
Procesing –
extrakce vybraných
částí, redukce dat
10-100 MB
Analýza – určení
struktury (objemy,
při dostatečném
rozlišení struktura
na úrovni atomů
13. Databáze
Protein database (PDB,
www.pdb.org, www.pdbe.org,
www.pdbj.org)
Uniprot (uniprot.org) –
databáze pro proteinové
sekvence a funkční informace
EMDataBank – cryoEM raw
data database, …
Zenodo – general db for
scientific datasets
14. Znovupoužití dat
Použití dat
Kopie PDB pro specifické
účely – MetalPDB
PDB-REDO – znovu
vylepšení struktury dle již
uložených hrubých dat
…
15. Hybridní metody
Použití více
experimentálních metod v
rámci projektu
Sdílení dat mezi vědeckými
centry
Sdílení software pro post-
procesing a analýzu
Sdílení výpočetní capacity
Znovupoužití dat
19. Objevování léčiv
Bigger is better in virtual drug screens, Nature 566, 193-194 (2019) doi:
10.1038/d41586-019-00145-6
Ultra-large library docking for discovering new chemotypes, Nature 566, pages224–
229 (2019) doi:10.1038/s41586-019-0917-9
20. Systémová biologie
Systems biology of the structural proteome, BMC Systems
BiologyBMC series – open, inclusive and trusted201610:26
https://doi.org/10.1186/s12918-016-0271-6