Continuous cloud costs testing [Fr] - DevoxxFR - 2013-03

Continuous

(Cloud) Costs Testing

10h40 - 11h30 - Salle E. Fitzgerald & L. Armstrong

Continuous Cloud Costs Testing

Nicolas Fonrose

Teevity Cloud Costs Analytics – Founder / CEO

@nfonrose / @teevity

27 au 29 mars 2013

Nicolas Fonrose

•  Cloud geek, Startuper

•  Pas mal d’années employé d’une boîte de conseil IT. Deux petites
boites de conseil, créées ensuite.

•  Et ensuite, « l’aventure startup » J

•  Teevity Cloud Costs Analytics

•  Objectif – aider les boites à utiliser le Cloud sans avoir à se soucier des
complexités liées aux coûts (variables et complexes à optimiser)

•  Fonctionne sur AWS/AppEngine/Google BigQuery

(Petit) lexique du cloud

•  Instance (une VM)

•  Zone (approx. == datacenter)

•  Region (1 ensemble de 2 à 5 zones dans une partie du monde)

•  Europe, Asie, US-east, US-west

•  Web-storage (S3, Google Cloud Storage, Azure Blob Storage)

AVEC LE CLOUD, ESTIMER LES
COÛTS, C’EST COMPLIQUÉ !

Les grilles de prix sont publiques

Une grille de prix Cloud, ça
ressemble à quoi ?

Pas assez de place sur un slide pour montrer celle d’AWS. Loin s’en faut !
Des 10k de lignes de JSON juste pour les prix AWS !

Estimation

Tout bouge. Et tout le temps

!
La grille de prix varie (très souvent – compétition entre CSP)
Des nouveaux services apparaissent
De nouveaux concepts tarifaires apparaissent
Le comportement du service fourni par le CSP varie

War stories

QUELQUES HISTOIRES DE COÛTS

Quand la théorie devient réalité …

Violent changement de prix
pour AppEngine en 2011

Largement expliqué et justifié par Google, mais ça fait mal quand même !
Certains utilisateurs ont vu leur facture faire *20. Il a fallu sacrément optimiser

Des fois, de très bonnes nouvelles

AWS S3 price change (-15%, merci Google)

AWS Glacier (10* moins cher; enﬁn presque)

AWS DynamoDB price change (-85% !)

Super nouvelles ! Mais aussi des hypothèses à revoir !

D’autre fois, des moins bonnes

Une région AWS, ça crache

Et en entier (toutes les AZ)

On doit faire du multi-région pour avoir une très haute disponibilité

Des services qui changent

Le DataStore AppEngine
passe en HDR

Hello « eventual consistency » on reads

Impact sur l’architecture de certaines applications

Des « non-conformités »

Heroku / RapGenius

Class action lancée contre Heroku

!
Non seulement pas bon pour les porte-monnaies des clients Heroku
Mais mauvais de manière générale pour le PaaS

Cloud Costs Savings Tips
LES 4 CATÉGORIES

Architectes, Développeurs, Devops, vos actions ont
un impact important sur le coût !

27 au 29 mars 2013

Categories

•  « Software architecture » tips

•  « Automation » tips (devops et scripting)

•  « Buying strategies »

•  « Right-sizing » (allocated vs consumed)

SOFTWARE ARCHITECTURES
COST DRIVEN DESIGN

Architecture logicielle

L’élément le plus important !

Impossible de proﬁter des options qui
rendent « cost-efﬁcient » vos applications
sans une architecture logicielle adaptée

Les clés du « cost driven » - 1/2

Modularité

Séparer les problématiques

Pour pouvoir allouer les différents traitements à l’endroit le plus pertinent

Les clés du « cost driven » - 2/2

Elastic-driven

Instances == Resources (!= Serveurs)

Compatibilité de l’architecture avec l’apparition/disparition (violente) de hardware

Et le « hardware »

Le choix du « Hardware » (virtuel)
est bien sûr toujours important

Mais c’est le software qui prend le lead. Le Hardware est juste là pour servir les besoins du soft.
Et on peut maintenant changer de « Hardware » comme on change de chemise.

Cost-driven architectures (et auto-scaling driven architectures)

ARCHITECTURES CLOUD-COSTS
EFFICIENTS : DES EXEMPLES !

Architecture logicielle et coûts cloud

Exemple 1

Site Web sans serveurs

Ex 1 - Site Web sans aucun serveur !

Site Web entièrement hébergés
sur un Web-Storage

JS côté Client /

Des batch qui updatent le contenu (lancés
périodiquement) /

Discuss pour les commentaires

Ex 1 - Site Web sans aucun serveur !

Le DNS masque totalement le Web storage

Compatible avec les CDN

Aussi applicable à certaines API de ces sites Web


Exemple 2

Une application SaaS au régime

Ex 2 - Application SaaS au régime

Une application SaaS avec
beaucoup de requêtes en
lecture par les clients

Application Web/Destkop/Mobile


Régime minceur

On pousse des copies des données
statiques vers un Web store

Adapter le rythme en fonction de la nature de l’application


Compute
Instances

on
update

Web Storage

Integrated
web servers


Ça marche aussi pas mal pour
tout ou partie d’applications « métier »
plus classiques (pas que pour les Dropbox like)

Ca dépend de leur nature transactionnelle,
et de la durée acceptable des copies de données côté client

Raisonnement applicable aux API

Ex 2 - Et la sécurité ?

Comment on gère les
autorisations d’accès ?
S3 Bucket Policy / adresse IP cliente ? Bof … L
S3 Bucket Policy / headers HTTP ? Mieux J
Auto-signed URLs ? Fabuleux J

Ex 2 - Et la sécurité ?

Auth
+
GET signed URL Compute
Instances

on
update

Web Storage

Integrated
web servers

Ex 2 – Cadeau «bonux» orienté Média

Amazon S3 supporte Bittorrent !
Permet de fortement réduire la facture si beaucoup
de personnes chargent les mêmes données
Streaming de musique par exemple


Exemple 3

Communication B2B au régime

Ex 3 - Application SaaS et upload

Application SaaS avec gros
volume de données en upload

Classique en scénario B2B


Donc là aussi, zéro serveur (ou presque),
c’est possible. Et c’est même mieux (sécurité,
scalabilité, …) !

Il faut quand même souvent des serveurs en batch
pour traiter le contenu en asynchrone

Ex 3 - Intégration Amazon / IMDB


Exemple 4

Application avec des traitements asynchrones
lourds

Ex 4 – Traitements asynchrones

Beaucoup de traitements
asynchrones lourds ?

Des batchs classiques

Du processing de photos (vignettes)

De l’analyse de données (big data)


Actions périodiques ?

Même pas besoin de laisser tourner une
instance avec un CRON !

On peut déﬁnir des « scheduled-actions » directement dans AWS (CRON interne)


Un contre-exemple maintenant !

Malgré l’architecture, dans certains cas, on
peut quand même arriver à tourner « cheap »

Ex 5 – Le contre-exemple

« Web-cache / CDN » en frontal

Fonctionne aussi pour les applications
(quelque soit leur architecture)

Evidemment pas applicable à toutes les applications (nécessite Web+REST). Ne marche que
pour les Reads, pas pour les Writes (pour l’instant)

Solution externe à l’application : le cache peut être chez un fournisseur (AWS) et
l’application chez un autre (AppEngine) !

Ex 5 – « Web-cache/CDN » frontal

Indispensables pour pouvoir expérimenter les différentes stratégies

AUTOMATION, SCRIPTING
DEVOPS

Ne pas « pétriﬁer » son infrastructure

Création infra cloud « à la main »
== infra cloud statique

Ça prend du temps, sujet aux erreurs. Donc on la modifie rarement.

Fluide comme du code

Scripting == infrastructure ﬂuide

Infrastructure As Code

Tester une nouvelle configuration d’infrastructure ==
Changer des paramètres dans des fichiers de conf / scripts

Vous êtes libre d’expérimenter car « pas risqué » et « rapide »

Facilite le changement de CSP

Important y compris pour pouvoir
changer/tester d’autres CSP

Scripting avec une meta API (Scalr/RightScale par exemple) pour pouvoir
porter sur un autre fournisseur très rapidement (AWS - GCE)

Corrélations « action-to-cost »

Intégration des actions sur
l’infrastructure dans la boucle de
cost-feedback

Systématise la traçabilité des changements de configuration d’infra
Permet de faire des corrélations entre changements
dans l’infrastructure et impact sur les coûts

« Right-sizer »

Ne pas allouer plus que
ce dont on a besoin

Ça paraît évident …

Et pourtant, la source d’économie la plus grosse constatée chez les utilisateurs IaaS.
Les freins au right-sizing ? Architecture non elastic-driven / Infrastructure statique
= Il faut scripter !

« Right-sizer » avec les PaaS

Normalement transparent
avec les PaaS

Finalement pas si trivial que ça même en PaaS

Voir les fameuses histoires de coûts du début de la présentation

Les stratégies d’achats de resources Cloud

BUYING STRATEGIES

Pas encore très développé

Disponible pour AWS uniquement

Pour l’instant

AWS Reserved Instances (RI)

« Acheter les soldes »

Pour 150€, vous avez -30% sur les
« t-shirts noirs tailles 38 pour femme »
pendant 1 an

Attention ! Ne s’applique pas aux t-shirts gris

Instances réservées – break even

6 mois 16 mois

(light)

9 mois

(heavy)

(medium)

AWS Spot instances

« Acheter aux enchères »

Spot Instances

Stratégies proches du trading : Bid, Outbid, …

Les machines peuvent être reprises à tout moment par AWS !

Pas uniquement réservé aux batchs.

Ex : Ajouter des instances derrière un load-balancer pour améliorer les perfs à faible coût

Qui se charge des stratégies d’achat ?

Pas vraiment un truc de
développeur et d’architecte

Pas encore clair dans les entreprises de savoir à qui revient ce rôle

Equipes DevOps / DSI / Direction ﬁnancière ?

Comme pour les performances, la qualité, c’est la seule manière de s’améliorer

COST FEEDBACK

Cost feedback

On ne peut améliorer que ce
qu’on mesure

Les Dev/Architectes ont rarement le nez sur la facture (quand ils y ont accès)
Pas de feedback == on travaille dans le noir

Cost feedback loop

Netﬂix pousse vers ses équipes
de Dev leur « consommé de la
semaine précédente »

Pas forcément pour améliorer la « cost efficiency » de l’application au runtime

Cost feedback loop

Naturel d’avoir la même chose
en prod/integration/qualif/…

Surveillance de la marge par tenant, …
Notion de ‘cost optimization’ continue
Surveillance des changements tarifaires non anticipés
Surveillance du right-sizing

Le feedback, en continue et de manière industrielle

CONTINUOUS COST TESTING

Objectif

Donner aux équipes du feedback en
continu sur « l’efﬁcacité coût » du
système qu’elles créent/déploient

Pour éviter les dérives liées aux évolutions du code / de l’archi
Pour éviter les dérives liées aux évolutions de l’infrastructure du fournisseur

Exemple de dérive – true story

Un développeur déplace quelques lignes
de code qui implique des boucles

è L’application envoie 10.000* plus de
messages dans une file pour le même
traitement. Oups !
Gros changement dans la facture en fin de mois

« Last run » vs « Previous run »

Je veux ça dans
mon inbox tous
les matins !

En bleu : Last run
En rose : Previous run
Unité : $ (USD)
Echelle : peu importe/

Comment on fait ça ?

De quelles informations
a-t-on-besoin ?

Le coût du dernier « tir »

Données sur le coûts et l’usage

Evidemment !

Comment on les récupère ? Ça dépend du Cloud provider ...
Pour la méthode d’accès aux données, et pour leur format

GET /costs – AWS Programmatic Billing

GET /costs – AppEngine ‘HTTP headers cost/req’

X-AppEngine-Resource-Usage: ms=293 cpu_ms=500 api_cpu_ms=236
X-AppEngine-Estimated-CPM-US-Dollars: $0.012320

Présent dans les headers HTTP de retour
Il faut naviguer sur son application en
étant connecté en admin sur la console
appengine pour les voir

GET /costs – Teevity API – ‘cost snapshot’

PUT

http://api.teevity.com/

cloudcost/

costAndUsageSnapshot/

forCloudServiceId/

50243203420423

⇒ { snapshotId:582452432342234 }

GET


cloudcost/

costAndUsageSnapshot/

582452432342234

GET /costs – Teevity API – ‘cost snapshot diff’

GET


cloudcost/

costAndUsageSnapshotDifference/

withInitial/582452432342234/

and/5915536323421748

Difﬁculté

Décalage temporel entre
exécution et disponibilité des
données de coûts

Vous pouvez compter plusieurs heures de décalage.
Pour l’instant, très difficile d’avoir un feedback quasi temps-réel

Difﬁculté – le contournement

On fait tourner les tests sur des
périodes de temps bien déﬁnies

En isolation d’autres activités

Sur un autre environnement Cloud (autre compte, autre appId)

Le coût ok. Mais la qualité ?

Ça ne sufﬁt pas !

C’est la « cost efficiency » qui nous
intéresse, pas le coût absolu
On a besoin d’autres données

Mesure de cost-efﬁciency

Informations de perf (nb trans/sec)

Combien de transactions ont été
réalisées par unité de coût

Mesure de cost-efﬁciency (suite)

Informations de QoS

Latence notamment
Point important ! Vous pouvez économiser beaucoup en arrêtant/lançant des instances
fréquemment. Mais l’impact sur la latence est important.

Dans le cloud …

Vos décisions ont un
impact réel sur les coûts

Un nouveau challenge pour les techos

!
Et on commence juste à découvrir les bonnes pratiques pour le relever

Teevity Cloud Costs
Analytics

Continuous cloud costs testing [Fr] - DevoxxFR - 2013-03

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (6)

Similar a Continuous cloud costs testing [Fr] - DevoxxFR - 2013-03

Similar a Continuous cloud costs testing [Fr] - DevoxxFR - 2013-03 (20)

Continuous cloud costs testing [Fr] - DevoxxFR - 2013-03