SlideShare a Scribd company logo
1 of 16
Infrastrutture	
  di	
  Grid	
  e	
  
Cloud	
  per	
  la	
  ricerca	
  
Bioinformatica	
  
Giacinto	
  DONVITO	
  
INFN-­‐Bari	
  
Agenda	
  
Ê  Supporto	
  alle	
  applicazioni	
  scientifiche	
  
Ê  Progetti	
  e	
  attività	
  del	
  gruppo	
  
Ê  Grid	
  Computing	
  
Ê  Cloud	
  Computing	
  orientato	
  all’infrastruttura	
  
Ê  PRISMA	
  
Ê  Cloud	
  Computing	
  orientata	
  ai	
  servizi	
  
Ê  BioVeL	
  
Ê  Conclusioni	
  
2	
  
Supporto	
  alle	
  applicazioni	
  
scientifiche	
  
Ê  Il	
  gruppo	
  INFN-­‐Bari	
  ha	
  un	
  focus	
  specifico	
  nel	
  supporto	
  alle	
  

attività	
  di	
  data	
  analisi	
  in	
  vari	
  contesti	
  scientifici	
  

Ê  Partendo	
  dall’esperienza	
  degli	
  esperimenti	
  di	
  LHC	
  
Ê  Ma	
  con	
  l’attenzione	
  alla	
  multidisciplinarietà:	
  
Ê  Bioinformatica,	
  Analisi	
  immagini	
  mediche,	
  Chimica	
  computazionale,	
  
Cristallografia,	
  analisi	
  immagini	
  da	
  satellite,	
  etc	
  
Ê  Partecipazione	
  alla	
  JRU-­‐ELIXIR	
  

Ê  Dal	
  2004	
  è	
  coinvolto	
  in	
  attività	
  di	
  supporto	
  al	
  calcolo	
  della	
  

bioinformatica	
  con	
  vari	
  progetti:	
  

Ê  FIRB	
  LIBI	
  (12/9/2005	
  all’11/9/2011)	
  	
  
Ê  Bioinfogrid	
  (1/1/2006	
  al	
  31/12/2007)	
  	
  
Ê  BioVeL	
  (1/09/2011	
  al	
  30/08/2014)	
  

	
  

3	
  
Grid	
  Computing	
  
Ê  Esperienza	
  di	
  grid	
  computing	
  per	
  l’uso	
  di	
  risorse	
  distribuite	
  

geograficamente	
  per	
  il	
  supporto	
  all’analisi	
  dati	
  scientifici	
  
Ê  Supporto	
  agli	
  esperimenti	
  LHC	
  

Ê  Esperienza	
  di	
  supporto	
  alle	
  analisi	
  di	
  bioinformatica	
  che	
  

necessitano	
  di	
  calcoli	
  complessi	
  (Blast,	
  MrBayes,	
  CSTminer,	
  etc)	
  
Ê  Supporto	
  per	
  grandi	
  challenge	
  che	
  hanno	
  

richiesto	
  decine	
  o	
  anche	
  centinaia	
  di	
  anni	
  
di	
  CPU	
  

Ê  Attività	
  svolta	
  sia	
  nell’ambito	
  dei	
  progetti	
  

nazionali	
  che	
  europei	
  
Ê  Collaborazione	
  con	
  HmtDB	
  (prof.	
  
Attimonelli)	
  
Ê  Attività	
  legate	
  a	
  NGS	
  

4	
  
Davide Salomoni

Hype in the Cloud, Stacks in the Ground

8
Evoluzione	
  delle	
  piattaforme	
  di	
  
calcolo	
  

5	
  
Cloud	
  Computing:	
  PRISMA	
  
Ê  PRISMA	
  è	
  un	
  progetto	
  PON	
  Smart	
  Cities	
  che	
  si	
  pone	
  l’obiettivo	
  di	
  

sviluppare	
  una	
  piattaforma	
  innovativa	
  aperta	
  e	
  interoperabile	
  di	
  
cloud	
  computing.	
  

Ê  Il	
  progetto	
  nasce	
  nel	
  contesto	
  della	
  call	
  del	
  Programma	
  Operativo	
  

Nazionale	
  Ricerca	
  e	
  Compatibilità	
  2007-­‐2013	
  

Budget	
  complessivo	
  
27.500.000	
  euro	
  	
  
Budget	
  INFN+UNIBA	
  
UNIBA:	
  2.402.539	
  euro	
  +	
  
INFN:	
  2.231.915	
  euro	
  

6	
  
Cloud	
  Computing:	
  PRISMA	
  
Ê  PRISMA è un progetto che comprende sia Università, Enti pubblici di ricerca, ma

anche aziende private
Ê  Enti pubblici di ricerca:
Ê 
Ê 
Ê 

CNR, Istituto di Acustica e sensoristica “O. Corbino”,
L’Istituto di Scienze e Tecnologie della Cognizione del CNR (ISTC)
Istituto Nazionale di Fisica, Bari, Catania and Napoli

Ê  Organizazione non-profit :
Ê 

EUCENTRE

Ê  Università:
Ê 

Università degli Studi di Bari, Enna Unikore, Catania

Ê  Centri di calcolo
Ê 

CINECA (ex CILEA)

Ê  Aziende private:
Ê 
Ê 
Ê 
Ê 
Ê 

Sielte Spa
Santer Reply
Cooperativa EDP La Traccia
InnovaPuglia
ATS - Advanced Technology Solutions Srl
7	
  
Cloud	
  Computing:	
  PRISMA	
  

8	
  
Cloud	
  Computing:	
  PRISMA	
  (IaaS)	
  
Interface
Layer

OpenNebula$
Market$Place$

9

Horizon$
Web$
FrontEnd$

Swift Storage
Service
Network$
Modified
Manager$
Quantum Server

Glance
Server

S3$

General
Services

ProgrammaHc$API$
CDMI$
OCCI$

Management Layer
NOVA+WNoDeS
Computing
Manager

EC2$

Keystone$AAI$
service$

Cinder Device
Storage

Meetering$

Abstraction Layer
KVM$

XEN$
XCP$

VMWare$

Virtualizzatori

CPU$
CPU$

SDN$

HyperV$

Progr. Net

CEPH/Lustre/GlusterFS/GPFS$

File Systems
Disk$
Disk$
Disk$

Network$
Network$

Network$
9	
  

Disk$
Disk$
Disk$

Hardware layer

Monitoring$

RDBMS$
Cloud	
  Computing:	
  PRISMA	
  (PaaS)	
  
AR 2.1 / OR 1.7

HTML5/JQuery portal

API
pubblic
access

Horizon – PRISMA portal interface
ORM

Database

Application server

MVC

Horizon - PRISMA Adapter layer
REST/
SOAP

REST/
SOAP

API set (IAAS+PAAS) (OCCI Standard)
OR1

Monitor

MSMQ
system

API IaaS
standard
EC2/S3/OCCI

REST/
SOAP

QoS

adapter
API

EC2?

openstack
ceilometer

API

BPM

WorkFlow
engine

API

API
adapter

API

Security

Ecommerce
/Billing

Accounting

Auth

AR 2.3

Openstack
Native API

REST/
SOAP

AR 2.2

adapter

API
adapter

API
adapter

API

API

API

HPC

Messaging
(SMTP/sms)

Interoperability

API

STORAGE

App Store

NETWORK

API

AR 2.4

AR 2.6

AR 2.5

10	
  

Infrastructure
COMPUTE

API

Image service

adapter

Template

API

IAAS

Runtime

API

API
EC2?

openstack TROVE

API
adapter

Storage
Service

adapter

Database

AR 2.1

AR 2.1 AR 2.7 AR 2.8
API
adapter

AR 1.5

STORAGE

orchestrator
Cloud	
  Computing:	
  PRISMA	
  (SaaS)	
  
Data	
  input	
   da	
  utente

SCENARIO	
  REAL	
  TIME

Scenario	
  rischio	
  sismico	
  
DB	
  Scenario
Dati:
Magnitudo,	
  epicentro,	
  meccanismo	
  di	
  
faglia,	
  traccia	
  di	
  faglia

OpenQuake

(ID	
  del	
  poligono	
  
città	
  /	
  
ID	
  edificio)
ID	
  scenario

DB	
  Vulnerabilità
ID	
  del	
  poligono	
  
città

Dati:
N	
  edifici	
  x	
  tipologia

ID	
  edificio	
  /
ID	
  tipologia

Dati:
λ a	
  ξ curve	
  fragilità	
  
da	
  D1	
  a	
  D5

Dati:
-­‐ Probabilità	
  di	
  
superamento	
  (D1,	
  D2,	
  
D3,	
  D4,	
  D5)
-­‐ Dati	
  evento	
  
(Magnitudo,	
  
epicentro,	
  
meccanismo	
  di	
  faglia,	
  
traccia	
  di	
  faglia)

Scenari	
  e-­‐Governement	
  

Scenario	
  Sanità	
  

11	
  
Testbed	
  di	
  PRISMA	
  
Ê  HTC	
  

Ê  Risorse	
  del	
  testbed:	
  	
  

Ê  Webdav	
  

Ê  28	
  server	
  
Ê  700	
  CPU/Core	
  

Ê  EGI	
  Cloud	
  Task	
  Force	
  

Ê  ~5TB	
  di	
  RAM	
  

Ê  Rischio	
  Sismico:	
  	
  	
  	
  

Ê  400TB	
  di	
  spazio	
  disco	
  

Ê  PostgreSQL	
  
Ê  Tomcat	
  

Ê  Utenti	
  già	
  supportati	
  o	
  in	
  fase	
  di	
  

Ê  HTC/HPC	
  

set-­‐up:	
  	
  	
  	
  

Ê  Supporto	
  all’attività	
  di	
  didattica	
  e	
  

Ê  Astrofisica	
  

a	
  tutorial:	
  	
  	
  

Ê  Aleph	
  

Ê  	
  Macchine	
  virtuali	
  on	
  demand	
  per	
  

esercitazioni	
  

Ê  Data	
  preservation	
  (data	
  analisys)	
  

Ê  Supporto	
  all’attività	
  di	
  ricerca	
  
scientifica	
  dei	
  dottorandi	
  

Ê  BioVeL	
  /	
  Biomed	
  /	
  Medical	
  

Imaging	
  	
  	
  	
  

Ê  Tomcat	
  
12	
  
Cloud	
  computing	
  orientato	
  ai	
  
servizi	
  scientifici:	
  BioVeL	
  
Ê  Biodiversity Virtual e-Laboratory
Ê  È	
  un	
  progetto	
  che	
  ha	
  l’obbiettivo	
  di	
  costruire	
  un	
  laboratorio	
  virtuale	
  in	
  cui	
  

ricercatori	
  nel	
  campo	
  della	
  biodiversità	
  ed	
  esperti	
  di	
  del	
  mondo	
  IT	
  possono	
  
collaborare	
  per	
  costruire	
  servizi	
  e	
  workflow	
  per	
  l’analisi	
  dati	
  
Ê  Il	
  laboratorio	
  mette	
  a	
  disposizione	
  dei	
  ricercatori	
  alcuni	
  workflow	
  che	
  possono	
  

essere	
  eseguiti	
  in	
  Taverna	
  o	
  nel	
  Taverna	
  Portal	
  in	
  modo	
  semplice	
  e	
  intuitivo.	
  
Ê  Gli	
  utenti	
  possono	
  o	
  comporre	
  nuovi	
  workflow	
  dai	
  servizi	
  messi	
  a	
  
disposizione	
  dai	
  service	
  provider,	
  oppure	
  eseguire	
  i	
  workflow	
  creati	
  dai	
  
ricercatori	
  più	
  esperti	
  
Ê  Applicazioni	
  già	
  disponibili:	
  
Ê  Hmmer,	
  MrBayes,	
  Blast,	
  PAML,	
  MUSCLE,	
  EMBOSS,	
  Biopython,	
  AmpliconNoise,	
  

ABCtool,	
  Bowtie,	
  BayeSSC,	
  GeoKS,	
  hyphy,	
  raxmlHPC,	
  phylocom,	
  consensus_xml,	
  
Matlab,	
  etc…	
  	
  
13	
  
Cloud	
  computing	
  orientato	
  ai	
  
servizi	
  scientifici:	
  BioVeL	
  
EGI Grid Infrastructure
WebDav & ownCloud
storage
Web Service
Frontends

Local Batch Cluster

Backend
submission
DB Server
Dedicated
execution
host
14	
  
Cloud	
  computing	
  orientato	
  ai	
  
servizi	
  scientifici:	
  BioVeL	
  
Upload'the'user s'inputs'
Run'MrBayes:'a'MPI'applica8on'
that'could'run'for'several'hours'
Pass'the'output'to'the'next'services''
Check'the'convergence'of'the'
model'
Retrieving'the'output'and'
parsing'the'XML''
calculate'the'consensus'tree'of'the'
posterior'distribu8on'of'MrBayes''
output'
Graphical'view'of'the'tree'
15	
  

25!
Conclusioni	
  
Ê  Il	
  gruppo	
  di	
  INFN-­‐Bari/Uniba	
  del	
  dipartimento	
  di	
  Fisica	
  è	
  in	
  

grado	
  di	
  mettere	
  a	
  disposizione	
  le	
  più	
  moderne	
  tecnologie	
  
di	
  Grid	
  e	
  Cloud	
  Computing	
  per	
  vari	
  scopi	
  

Ê  Ricerca	
  Scientifica,	
  Amministrazioni	
  Pubbliche	
  Locali,	
  Piccole	
  

e	
  Medie	
  Imprese	
  

Ê  In	
  base	
  agli	
  use-­‐case	
  possiamo	
  offrire	
  servizi	
  di	
  cloud	
  

computing	
  di	
  vari	
  livelli:	
  

Ê  IaaS	
  per	
  la	
  gestione	
  delle	
  macchine	
  virtuali	
  	
  
Ê  PaaS	
  per	
  il	
  supporto	
  allo	
  sviluppo	
  di	
  applicazioni	
  evolute	
  
Ê  SaaS	
  per	
  la	
  gestione	
  semplificata	
  di	
  complessi	
  algoritmi	
  di	
  

analisi	
  
16	
  

More Related Content

Similar to Giacinto Donvito – Infrastrutture di Grid e Cloud per la ricerca Bioinformatica

OpenQuake: scienza aperta per il rischio sismico
OpenQuake: scienza aperta per il rischio sismicoOpenQuake: scienza aperta per il rischio sismico
OpenQuake: scienza aperta per il rischio sismicoPaul Henshaw
 
Progetto Concerto
Progetto ConcertoProgetto Concerto
Progetto ConcertoEsalab srl
 
Cavallo csipiemonte 29_06_2015
Cavallo csipiemonte 29_06_2015Cavallo csipiemonte 29_06_2015
Cavallo csipiemonte 29_06_2015CSI Piemonte
 
Smart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsSmart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsCSI Piemonte
 
Metropolitan eGovernment Application LABoratory
Metropolitan eGovernment Application LABoratory Metropolitan eGovernment Application LABoratory
Metropolitan eGovernment Application LABoratory DAElocal_IT
 
Cloud computing & ICT for development
Cloud computing & ICT for developmentCloud computing & ICT for development
Cloud computing & ICT for developmentRoberto Polillo
 
Il Distretto Tecnologico ICT “Sardegna DistrICT” (19 aprile 2007)
Il Distretto Tecnologico ICT “Sardegna DistrICT” (19 aprile 2007)Il Distretto Tecnologico ICT “Sardegna DistrICT” (19 aprile 2007)
Il Distretto Tecnologico ICT “Sardegna DistrICT” (19 aprile 2007)Pietro Zanarini
 
Seminario Cloud computing Ordine di latina - cloud computing
Seminario Cloud computing Ordine di latina - cloud computingSeminario Cloud computing Ordine di latina - cloud computing
Seminario Cloud computing Ordine di latina - cloud computingClaudio Pontili
 
PROSSIMO - Progettazione, sviluppo e ottimizzazione di sistemi intelligenti m...
PROSSIMO - Progettazione, sviluppo e ottimizzazione di sistemi intelligenti m...PROSSIMO - Progettazione, sviluppo e ottimizzazione di sistemi intelligenti m...
PROSSIMO - Progettazione, sviluppo e ottimizzazione di sistemi intelligenti m...Sardegna Ricerche
 
Conservazione digitale: Workshop organizzato dal Progetto DPE
Conservazione digitale: Workshop organizzato dal Progetto DPEConservazione digitale: Workshop organizzato dal Progetto DPE
Conservazione digitale: Workshop organizzato dal Progetto DPEMaurizio Messina
 
Web e ICT for development
Web e ICT for developmentWeb e ICT for development
Web e ICT for developmentRoberto Polillo
 
ODISI, Open Data Infrastructure for Spatial Interaction
ODISI, Open Data Infrastructure for Spatial Interaction ODISI, Open Data Infrastructure for Spatial Interaction
ODISI, Open Data Infrastructure for Spatial Interaction ostemi
 
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...Data Driven Innovation
 
Progetto PROSSIMO: presentazione di Luca Pulina in occasione di Sinnova 2019
Progetto PROSSIMO: presentazione di Luca Pulina in occasione di Sinnova 2019Progetto PROSSIMO: presentazione di Luca Pulina in occasione di Sinnova 2019
Progetto PROSSIMO: presentazione di Luca Pulina in occasione di Sinnova 2019Sardegna Ricerche
 
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"GIDIF-RBM
 

Similar to Giacinto Donvito – Infrastrutture di Grid e Cloud per la ricerca Bioinformatica (20)

OpenQuake: scienza aperta per il rischio sismico
OpenQuake: scienza aperta per il rischio sismicoOpenQuake: scienza aperta per il rischio sismico
OpenQuake: scienza aperta per il rischio sismico
 
OpenQuake: scienza aperta per il rischio sismico
OpenQuake: scienza aperta per il rischio sismicoOpenQuake: scienza aperta per il rischio sismico
OpenQuake: scienza aperta per il rischio sismico
 
Progetto Concerto
Progetto ConcertoProgetto Concerto
Progetto Concerto
 
Cavallo csipiemonte 29_06_2015
Cavallo csipiemonte 29_06_2015Cavallo csipiemonte 29_06_2015
Cavallo csipiemonte 29_06_2015
 
Smart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of ThingsSmart Data Platform: dagli open data all'Internet Of Things
Smart Data Platform: dagli open data all'Internet Of Things
 
Metropolitan eGovernment Application LABoratory
Metropolitan eGovernment Application LABoratory Metropolitan eGovernment Application LABoratory
Metropolitan eGovernment Application LABoratory
 
Cloud computing & ICT for development
Cloud computing & ICT for developmentCloud computing & ICT for development
Cloud computing & ICT for development
 
Il Distretto Tecnologico ICT “Sardegna DistrICT” (19 aprile 2007)
Il Distretto Tecnologico ICT “Sardegna DistrICT” (19 aprile 2007)Il Distretto Tecnologico ICT “Sardegna DistrICT” (19 aprile 2007)
Il Distretto Tecnologico ICT “Sardegna DistrICT” (19 aprile 2007)
 
Seminario Cloud computing Ordine di latina - cloud computing
Seminario Cloud computing Ordine di latina - cloud computingSeminario Cloud computing Ordine di latina - cloud computing
Seminario Cloud computing Ordine di latina - cloud computing
 
PROSSIMO - Progettazione, sviluppo e ottimizzazione di sistemi intelligenti m...
PROSSIMO - Progettazione, sviluppo e ottimizzazione di sistemi intelligenti m...PROSSIMO - Progettazione, sviluppo e ottimizzazione di sistemi intelligenti m...
PROSSIMO - Progettazione, sviluppo e ottimizzazione di sistemi intelligenti m...
 
Conservazione digitale: Workshop organizzato dal Progetto DPE
Conservazione digitale: Workshop organizzato dal Progetto DPEConservazione digitale: Workshop organizzato dal Progetto DPE
Conservazione digitale: Workshop organizzato dal Progetto DPE
 
Web e ICT for development
Web e ICT for developmentWeb e ICT for development
Web e ICT for development
 
Web & ICT4D by Roberto Polillo
Web & ICT4D by Roberto PolilloWeb & ICT4D by Roberto Polillo
Web & ICT4D by Roberto Polillo
 
Iuavcamp presentazione
Iuavcamp presentazioneIuavcamp presentazione
Iuavcamp presentazione
 
ODISI, Open Data Infrastructure for Spatial Interaction
ODISI, Open Data Infrastructure for Spatial Interaction ODISI, Open Data Infrastructure for Spatial Interaction
ODISI, Open Data Infrastructure for Spatial Interaction
 
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
CHNet-DHLab: Servizi Cloud a supporto dei beni culturali (Fabio Proietti, INF...
 
Progetto PROSSIMO: presentazione di Luca Pulina in occasione di Sinnova 2019
Progetto PROSSIMO: presentazione di Luca Pulina in occasione di Sinnova 2019Progetto PROSSIMO: presentazione di Luca Pulina in occasione di Sinnova 2019
Progetto PROSSIMO: presentazione di Luca Pulina in occasione di Sinnova 2019
 
XClima europe
XClima europeXClima europe
XClima europe
 
X clima europe
X clima europeX clima europe
X clima europe
 
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
Andrea Gazzarini "Linked Data in Practice: risorse, strumenti ed utilizzi"
 

More from eventi-ITBbari

BiPday 2014 -- Vicario Saverio
BiPday 2014 -- Vicario SaverioBiPday 2014 -- Vicario Saverio
BiPday 2014 -- Vicario Saverioeventi-ITBbari
 
BiPday 2014 -- Tulipano Angelica
BiPday 2014 -- Tulipano AngelicaBiPday 2014 -- Tulipano Angelica
BiPday 2014 -- Tulipano Angelicaeventi-ITBbari
 
BiPday 2014 -- Pesole Graziano
BiPday 2014 -- Pesole GrazianoBiPday 2014 -- Pesole Graziano
BiPday 2014 -- Pesole Grazianoeventi-ITBbari
 
BiPday 2014 -- Santorsola Mariangela
BiPday 2014 -- Santorsola MariangelaBiPday 2014 -- Santorsola Mariangela
BiPday 2014 -- Santorsola Mariangelaeventi-ITBbari
 
BiPday 2014 -- Donvito Giacinto
BiPday 2014 -- Donvito GiacintoBiPday 2014 -- Donvito Giacinto
BiPday 2014 -- Donvito Giacintoeventi-ITBbari
 
BiPday 2014 -- De Molfetta Rita
BiPday 2014 -- De Molfetta RitaBiPday 2014 -- De Molfetta Rita
BiPday 2014 -- De Molfetta Ritaeventi-ITBbari
 
BiPday 2014 -- Ceci Michelangelo
BiPday 2014 -- Ceci MichelangeloBiPday 2014 -- Ceci Michelangelo
BiPday 2014 -- Ceci Michelangeloeventi-ITBbari
 
BiPday 2014 -- Clima Rosanna
BiPday 2014 -- Clima RosannaBiPday 2014 -- Clima Rosanna
BiPday 2014 -- Clima Rosannaeventi-ITBbari
 
BiPday 2014 --Creanza Teresa
BiPday 2014 --Creanza TeresaBiPday 2014 --Creanza Teresa
BiPday 2014 --Creanza Teresaeventi-ITBbari
 
IBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
IBM Italia, Bari – La Bioinformatica nelle prospettive della BioeconomyIBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
IBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomyeventi-ITBbari
 
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...eventi-ITBbari
 
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...eventi-ITBbari
 
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...eventi-ITBbari
 
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...eventi-ITBbari
 
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems MedicineNicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicineeventi-ITBbari
 
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...eventi-ITBbari
 
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...eventi-ITBbari
 
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...eventi-ITBbari
 
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...eventi-ITBbari
 
Piero Larizza – “La Robotica nella Bioinformatica”
Piero Larizza – “La Robotica nella Bioinformatica”Piero Larizza – “La Robotica nella Bioinformatica”
Piero Larizza – “La Robotica nella Bioinformatica”eventi-ITBbari
 

More from eventi-ITBbari (20)

BiPday 2014 -- Vicario Saverio
BiPday 2014 -- Vicario SaverioBiPday 2014 -- Vicario Saverio
BiPday 2014 -- Vicario Saverio
 
BiPday 2014 -- Tulipano Angelica
BiPday 2014 -- Tulipano AngelicaBiPday 2014 -- Tulipano Angelica
BiPday 2014 -- Tulipano Angelica
 
BiPday 2014 -- Pesole Graziano
BiPday 2014 -- Pesole GrazianoBiPday 2014 -- Pesole Graziano
BiPday 2014 -- Pesole Graziano
 
BiPday 2014 -- Santorsola Mariangela
BiPday 2014 -- Santorsola MariangelaBiPday 2014 -- Santorsola Mariangela
BiPday 2014 -- Santorsola Mariangela
 
BiPday 2014 -- Donvito Giacinto
BiPday 2014 -- Donvito GiacintoBiPday 2014 -- Donvito Giacinto
BiPday 2014 -- Donvito Giacinto
 
BiPday 2014 -- De Molfetta Rita
BiPday 2014 -- De Molfetta RitaBiPday 2014 -- De Molfetta Rita
BiPday 2014 -- De Molfetta Rita
 
BiPday 2014 -- Ceci Michelangelo
BiPday 2014 -- Ceci MichelangeloBiPday 2014 -- Ceci Michelangelo
BiPday 2014 -- Ceci Michelangelo
 
BiPday 2014 -- Clima Rosanna
BiPday 2014 -- Clima RosannaBiPday 2014 -- Clima Rosanna
BiPday 2014 -- Clima Rosanna
 
BiPday 2014 --Creanza Teresa
BiPday 2014 --Creanza TeresaBiPday 2014 --Creanza Teresa
BiPday 2014 --Creanza Teresa
 
IBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
IBM Italia, Bari – La Bioinformatica nelle prospettive della BioeconomyIBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
IBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
 
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
 
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
 
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
 
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
 
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems MedicineNicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
 
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
 
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
 
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
 
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
 
Piero Larizza – “La Robotica nella Bioinformatica”
Piero Larizza – “La Robotica nella Bioinformatica”Piero Larizza – “La Robotica nella Bioinformatica”
Piero Larizza – “La Robotica nella Bioinformatica”
 

Giacinto Donvito – Infrastrutture di Grid e Cloud per la ricerca Bioinformatica

  • 1. Infrastrutture  di  Grid  e   Cloud  per  la  ricerca   Bioinformatica   Giacinto  DONVITO   INFN-­‐Bari  
  • 2. Agenda   Ê  Supporto  alle  applicazioni  scientifiche   Ê  Progetti  e  attività  del  gruppo   Ê  Grid  Computing   Ê  Cloud  Computing  orientato  all’infrastruttura   Ê  PRISMA   Ê  Cloud  Computing  orientata  ai  servizi   Ê  BioVeL   Ê  Conclusioni   2  
  • 3. Supporto  alle  applicazioni   scientifiche   Ê  Il  gruppo  INFN-­‐Bari  ha  un  focus  specifico  nel  supporto  alle   attività  di  data  analisi  in  vari  contesti  scientifici   Ê  Partendo  dall’esperienza  degli  esperimenti  di  LHC   Ê  Ma  con  l’attenzione  alla  multidisciplinarietà:   Ê  Bioinformatica,  Analisi  immagini  mediche,  Chimica  computazionale,   Cristallografia,  analisi  immagini  da  satellite,  etc   Ê  Partecipazione  alla  JRU-­‐ELIXIR   Ê  Dal  2004  è  coinvolto  in  attività  di  supporto  al  calcolo  della   bioinformatica  con  vari  progetti:   Ê  FIRB  LIBI  (12/9/2005  all’11/9/2011)     Ê  Bioinfogrid  (1/1/2006  al  31/12/2007)     Ê  BioVeL  (1/09/2011  al  30/08/2014)     3  
  • 4. Grid  Computing   Ê  Esperienza  di  grid  computing  per  l’uso  di  risorse  distribuite   geograficamente  per  il  supporto  all’analisi  dati  scientifici   Ê  Supporto  agli  esperimenti  LHC   Ê  Esperienza  di  supporto  alle  analisi  di  bioinformatica  che   necessitano  di  calcoli  complessi  (Blast,  MrBayes,  CSTminer,  etc)   Ê  Supporto  per  grandi  challenge  che  hanno   richiesto  decine  o  anche  centinaia  di  anni   di  CPU   Ê  Attività  svolta  sia  nell’ambito  dei  progetti   nazionali  che  europei   Ê  Collaborazione  con  HmtDB  (prof.   Attimonelli)   Ê  Attività  legate  a  NGS   4   Davide Salomoni Hype in the Cloud, Stacks in the Ground 8
  • 5. Evoluzione  delle  piattaforme  di   calcolo   5  
  • 6. Cloud  Computing:  PRISMA   Ê  PRISMA  è  un  progetto  PON  Smart  Cities  che  si  pone  l’obiettivo  di   sviluppare  una  piattaforma  innovativa  aperta  e  interoperabile  di   cloud  computing.   Ê  Il  progetto  nasce  nel  contesto  della  call  del  Programma  Operativo   Nazionale  Ricerca  e  Compatibilità  2007-­‐2013   Budget  complessivo   27.500.000  euro     Budget  INFN+UNIBA   UNIBA:  2.402.539  euro  +   INFN:  2.231.915  euro   6  
  • 7. Cloud  Computing:  PRISMA   Ê  PRISMA è un progetto che comprende sia Università, Enti pubblici di ricerca, ma anche aziende private Ê  Enti pubblici di ricerca: Ê  Ê  Ê  CNR, Istituto di Acustica e sensoristica “O. Corbino”, L’Istituto di Scienze e Tecnologie della Cognizione del CNR (ISTC) Istituto Nazionale di Fisica, Bari, Catania and Napoli Ê  Organizazione non-profit : Ê  EUCENTRE Ê  Università: Ê  Università degli Studi di Bari, Enna Unikore, Catania Ê  Centri di calcolo Ê  CINECA (ex CILEA) Ê  Aziende private: Ê  Ê  Ê  Ê  Ê  Sielte Spa Santer Reply Cooperativa EDP La Traccia InnovaPuglia ATS - Advanced Technology Solutions Srl 7  
  • 9. Cloud  Computing:  PRISMA  (IaaS)   Interface Layer OpenNebula$ Market$Place$ 9 Horizon$ Web$ FrontEnd$ Swift Storage Service Network$ Modified Manager$ Quantum Server Glance Server S3$ General Services ProgrammaHc$API$ CDMI$ OCCI$ Management Layer NOVA+WNoDeS Computing Manager EC2$ Keystone$AAI$ service$ Cinder Device Storage Meetering$ Abstraction Layer KVM$ XEN$ XCP$ VMWare$ Virtualizzatori CPU$ CPU$ SDN$ HyperV$ Progr. Net CEPH/Lustre/GlusterFS/GPFS$ File Systems Disk$ Disk$ Disk$ Network$ Network$ Network$ 9   Disk$ Disk$ Disk$ Hardware layer Monitoring$ RDBMS$
  • 10. Cloud  Computing:  PRISMA  (PaaS)   AR 2.1 / OR 1.7 HTML5/JQuery portal API pubblic access Horizon – PRISMA portal interface ORM Database Application server MVC Horizon - PRISMA Adapter layer REST/ SOAP REST/ SOAP API set (IAAS+PAAS) (OCCI Standard) OR1 Monitor MSMQ system API IaaS standard EC2/S3/OCCI REST/ SOAP QoS adapter API EC2? openstack ceilometer API BPM WorkFlow engine API API adapter API Security Ecommerce /Billing Accounting Auth AR 2.3 Openstack Native API REST/ SOAP AR 2.2 adapter API adapter API adapter API API API HPC Messaging (SMTP/sms) Interoperability API STORAGE App Store NETWORK API AR 2.4 AR 2.6 AR 2.5 10   Infrastructure COMPUTE API Image service adapter Template API IAAS Runtime API API EC2? openstack TROVE API adapter Storage Service adapter Database AR 2.1 AR 2.1 AR 2.7 AR 2.8 API adapter AR 1.5 STORAGE orchestrator
  • 11. Cloud  Computing:  PRISMA  (SaaS)   Data  input   da  utente SCENARIO  REAL  TIME Scenario  rischio  sismico   DB  Scenario Dati: Magnitudo,  epicentro,  meccanismo  di   faglia,  traccia  di  faglia OpenQuake (ID  del  poligono   città  /   ID  edificio) ID  scenario DB  Vulnerabilità ID  del  poligono   città Dati: N  edifici  x  tipologia ID  edificio  / ID  tipologia Dati: λ a  ξ curve  fragilità   da  D1  a  D5 Dati: -­‐ Probabilità  di   superamento  (D1,  D2,   D3,  D4,  D5) -­‐ Dati  evento   (Magnitudo,   epicentro,   meccanismo  di  faglia,   traccia  di  faglia) Scenari  e-­‐Governement   Scenario  Sanità   11  
  • 12. Testbed  di  PRISMA   Ê  HTC   Ê  Risorse  del  testbed:     Ê  Webdav   Ê  28  server   Ê  700  CPU/Core   Ê  EGI  Cloud  Task  Force   Ê  ~5TB  di  RAM   Ê  Rischio  Sismico:         Ê  400TB  di  spazio  disco   Ê  PostgreSQL   Ê  Tomcat   Ê  Utenti  già  supportati  o  in  fase  di   Ê  HTC/HPC   set-­‐up:         Ê  Supporto  all’attività  di  didattica  e   Ê  Astrofisica   a  tutorial:       Ê  Aleph   Ê   Macchine  virtuali  on  demand  per   esercitazioni   Ê  Data  preservation  (data  analisys)   Ê  Supporto  all’attività  di  ricerca   scientifica  dei  dottorandi   Ê  BioVeL  /  Biomed  /  Medical   Imaging         Ê  Tomcat   12  
  • 13. Cloud  computing  orientato  ai   servizi  scientifici:  BioVeL   Ê  Biodiversity Virtual e-Laboratory Ê  È  un  progetto  che  ha  l’obbiettivo  di  costruire  un  laboratorio  virtuale  in  cui   ricercatori  nel  campo  della  biodiversità  ed  esperti  di  del  mondo  IT  possono   collaborare  per  costruire  servizi  e  workflow  per  l’analisi  dati   Ê  Il  laboratorio  mette  a  disposizione  dei  ricercatori  alcuni  workflow  che  possono   essere  eseguiti  in  Taverna  o  nel  Taverna  Portal  in  modo  semplice  e  intuitivo.   Ê  Gli  utenti  possono  o  comporre  nuovi  workflow  dai  servizi  messi  a   disposizione  dai  service  provider,  oppure  eseguire  i  workflow  creati  dai   ricercatori  più  esperti   Ê  Applicazioni  già  disponibili:   Ê  Hmmer,  MrBayes,  Blast,  PAML,  MUSCLE,  EMBOSS,  Biopython,  AmpliconNoise,   ABCtool,  Bowtie,  BayeSSC,  GeoKS,  hyphy,  raxmlHPC,  phylocom,  consensus_xml,   Matlab,  etc…     13  
  • 14. Cloud  computing  orientato  ai   servizi  scientifici:  BioVeL   EGI Grid Infrastructure WebDav & ownCloud storage Web Service Frontends Local Batch Cluster Backend submission DB Server Dedicated execution host 14  
  • 15. Cloud  computing  orientato  ai   servizi  scientifici:  BioVeL   Upload'the'user s'inputs' Run'MrBayes:'a'MPI'applica8on' that'could'run'for'several'hours' Pass'the'output'to'the'next'services'' Check'the'convergence'of'the' model' Retrieving'the'output'and' parsing'the'XML'' calculate'the'consensus'tree'of'the' posterior'distribu8on'of'MrBayes'' output' Graphical'view'of'the'tree' 15   25!
  • 16. Conclusioni   Ê  Il  gruppo  di  INFN-­‐Bari/Uniba  del  dipartimento  di  Fisica  è  in   grado  di  mettere  a  disposizione  le  più  moderne  tecnologie   di  Grid  e  Cloud  Computing  per  vari  scopi   Ê  Ricerca  Scientifica,  Amministrazioni  Pubbliche  Locali,  Piccole   e  Medie  Imprese   Ê  In  base  agli  use-­‐case  possiamo  offrire  servizi  di  cloud   computing  di  vari  livelli:   Ê  IaaS  per  la  gestione  delle  macchine  virtuali     Ê  PaaS  per  il  supporto  allo  sviluppo  di  applicazioni  evolute   Ê  SaaS  per  la  gestione  semplificata  di  complessi  algoritmi  di   analisi   16