IBM Cloud Paris Meetup - 20180911 - Smart Citizen Bot
20190520 - IBM Cloud Paris-Saclay Meetup - Hardis Group
1. 2 0 1 9 – V 1 – O F F R E P O W E R A I
P O W E R A I B Y H A R D I S C L O U D O P E R A T I O N S
No AI/Artificial Intelligence
without IA/Information Architecture
2. o IBM et HCO (Hardis Cloud Operations) ont créé une proposition de valeur sur la base des
machines Power AI afin de permettre un accès simplifié au plus grand nombre.
o HCO, hébergeur et infogéreur depuis de nombreuses années, est en mesure de proposer
une capacité d’hébergement et de supervision des machines Power AI au travers de ses
Datacenters Lyonnais sécurisés.
o L’exploitation et l’administration des serveurs restent sous contrôle exclusif de HCO.
o Infrastructure hardware
o Réseau (VPN, firewall)
o Supervision
o Sauvegarde
o L’exploitation et l’administration applicative restent sous contrôle exclusif de l’école.
o Jeux de données utilisateurs, Environnement de développement et de compilation
o Packages applicatifs (Anaconda, Python)
o Suite logicielle IBM Power AI : Caffe, Torch, TensorFlow, Theano, Chainer…
PROPOSITION DE VALEUR HCO & IBM
3. o Permettre aux écoles d’ingénieurs ou clients de bénéficier des toutes dernières avancées
technologiques des infrastructures (matérielles et logicielles) pensées pour et dédiées à l’IA.
o Donner la capacité de réaliser des Travaux Pratiques sans avoir à se préoccuper de la disponibilité des
infrastructures. L’offre choisie :
Standard : dimensionnée pour 1 groupe de 40 étudiants, traitements de 40 jobs par LSF
è 1GPU/ 8cores/128gb ram sur compute node / 0,1 proc / 2 pv / 32Gb ram sur frontal
Premium : dimensionnée pour 2 groupes de 40 étudiants, traitements de 80 jobs par LSF
è 2 GPU/16 cores / 256GB ram sur compute node / 0,1 proc / 2 pv / 32Gb ram sur frontal
o Bénéficier d’un stockage minimum de 1 TB intégré dans un serveur frontal de connexion au service.
Stockage utilisateur modulable.
Initialisation des données possible par copie physique sur place chez Hardis.
o Connexion VPN & SSH avec intégration du LDAP de l’école ou client au processus de connexion.
o Brique élémentaire de l’infrastructure, un nœud de calcul accessible en mode supervision H24 7J/7 :
ü Un serveur POWER9 AC922 avec 4 cartes GPU NVIDIA Volta100 à 16 GB et 2x16 cœurs et 512 GB de mémoire
ü Avec le stack logiciel : Redhat 7.5 - PowerAI Standard 1.5.1 - LSF 10.2 (1000 jobs // MAX)
ü pour les écoles, possibilité de LSF sans frais pour la formation via le programme éducation d'IBM. Attention, cette
license ne permet pas de faire de la recherche
ü pour les clients ou les écoles qui souhaitent faire de la recherche, LSF est facturable en sus
ENJEUX ET CARACTÉRISTIQUES DE L’OFFRE CLOUD ON POWER FOR AI
4. SOLUTION TECHNIQUE
AC922 :
AC922 serveur segmenté au niveau des ressources (CPU, mem, GPU) avec
Nvidia-Docker
Image Docker avec :
• PowerAI SW
• LSF daemons
Chaque container Docker de l’AC922 est vu par LSF comme un compute
node à part entière.
Les Nvidia-Dockers sont démarrés avec les options suivantes:
• Variable NV_GPU positionnée pour le partage des GPUs
• Accès aux socket UNIX docker et Nvidia-Docker (Docker in Docker)
• Accès au filesystem (/home & /usr/share/lsf)
LSF :
Les queues LSF (batch+interactive) sont configurées pour accéder au split
AC922 correspondant
Frontaux :
Frontaux fournies en Virtual Machine (Red Hat 7,5 PPC S922)
1 frontal par client.
Chaque frontal accède au LDAP de l’école (+proxy LDAP)
LSF master :
LSF master gère le cluster LSF
Le LSF master peut également servir de registry Docker et de serveur NFS
LDAP :
Accès sécurisé au LDAPs des clients via VPN IPSEC
5. STEPHANE COTET
@GroupeHardis
www.hardis-group.com
+33 (6) 32 79 21 74
Stéphane.cotet@hardis.fr
HCO Director Pre sales Consultant Power and Storage
+33 (0) 6 37 17 60 39
laurent.mermet@hardis.fr
LAURENT MERMET
No AI/Artificial Intelligence
without IA/Information Architecture