SlideShare una empresa de Scribd logo
1 de 35
Descargar para leer sin conexión
Introduction à Cassandra
Big data & NoSQL
1 / 35
1.  Big Data
2.  NoSQL
3.  Architecture de Cassandra
4.  Développer avec CQL
Objectifs
2 / 35
Big Data
Big data is high­volume, high­velocity and high­variety information
assets that demand cost­effective, innovative forms of information
processing for enhanced insight and decision making.
Gartner
3 / 35
Big Data
Traitements en Batch ou Flux
Forts volumes
Performances
Haute­disponibilité
4 / 35
SQL or NoSQL?
Not using the relational model (nor the SQL language).
Open source.
Designed to run on large clusters
Based on the needs of 21st century web properties
No schema, allowing fields to be added to any record without controls
http://martinfowler.com/bliki/NosqlDefinition.html
5 / 35
Relationnel
Clé­Valeur
Document
Colonnes Cassandra
Graphe
Mixte
Modèles de données
6 / 35
ACID
Atomicity
Cohérence
Isolation
Durability
BASE
Basically Available
Soft state
Eventual consistency
ACID ou BASE?
7 / 35
Consistency
Availability
Partition tolerance
CAP
8 / 35
CAP
9 / 35
Cassandra en résumé
Distribuée
Masterless: pas de SPOF
Scalabilité linéaire
Tolérance aux pannes: 100% uptime
Performances
Consistance réglable
Multi­datacenter
Simplicité opérationnelle
10 / 35
Les origines
11 / 35
Plage de Tokens
Distribution
12 / 35
Hachage consistant
Distribution
13 / 35
Réplication
14 / 35
Scalabilité
15 / 35
Scalabilité linéaire
http://techblog.netflix.com/2011/11/benchmarking­cassandra­scalability­on.html
16 / 35
Noeuds virtuels
17 / 35
Node∈Rack∈Datacenter
Decoupage
Géographique
Logique
Cloud
Multi-datacenter
18 / 35
Coordinateur
19 / 35
Timestamp par cellule
Consistance ALL: Ecriture
20 / 35
Tolérance aux pannes
Hinted Handoff
Consistance ONE: Ecriture
21 / 35
Last write wins
Read repair
Consistance ALL: Lecture
22 / 35
Eventual consistency
Consistance ONE: Lecture
23 / 35
Consistance réglable
Niveau de consistance par requête
24 / 35
Consistance immédiate
R + W > RF
Consistance au final
R + W ≤ RF
Consistance: le bilan
25 / 35
Pour l'écriture
Append only + compaction
Pas de disk seek
Pour la lecture
Réplication & Load balancing
Modélisation adaptée → Accès
direct
Caches par table
Performances
26 / 35
Simplicité opérationnelle
Installation
Linux, Java, Python, NTP
Packaging: .tar, .rpm, .deb, .exe
2­3 fichiers de configuration
1 seul processus
1 seul type de noeud
Monitoring
nodetool, JMX, OpsCenter
27 / 35
Simplicité pour le développement
CQL = SQL simplifié
cqlsh
DevCenter
CCM, un cluster en local
28 / 35
CQL
CREATETABLEutilisateur(
id_utilisateurUUID,
loginVARCHAR,
date_naissanceTIMESTAMP,
rolesSET<VARCHAR>,
PRIMARYKEY(id_utilisateur)
);
INSERTINTOutilisateur(id_utilisateur,login,
date_naissance,roles)
VALUES('abc123...','jdoe',
'1978-04-06',{'blogger','journaliste'});
SELECT*FROMutilisateur
WHEREid_utilisateur='abc123...';
29 / 35
Modèle orienté colonne
Table utilisateur 
30 / 35
CQL Grandes lignes
CREATETABLEmessage(
id_utilisateurUUID,
id_messageTIMEUUID,
messageVARCHAR,
PRIMARYKEY(id_utilisateur,id_message)
);
INSERTINTOmessage(id_utilisateur,id_message)
VALUES('abc123...',now(),'ViveCassandra');
SELECT*FROMutilisateur
WHEREid_utilisateur='abc123...';
SELECTmessageFROMutilisateur
WHEREid_utilisateur='abc123...'ANDid_message='cde456...';
31 / 35
Modèle orienté colonne
Table utilisateur 
Table message 
Map<RowKey, SortedMap<ColumnKey, ColumnValue>>
32 / 35
Modélisation
Dénormaliser!
Besoin → Requête → Table
Adapter les données aux requêtes (pas l'inverse)
33 / 35
Driver
Load balancing, tolérance aux pannes, découverte
Synchrone ou asynchrone (réactive programming)
Librairies Java:
ObjectMapper, Achilles, Spring Data Cassandra...
Cassandra Unit, Stubbed Cassandra
34 / 35
Questions
35 / 35

Más contenido relacionado

La actualidad más candente

Apache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalitésApache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalitésRomain Hardouin
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzureMicrosoft Décideurs IT
 
Administration et supervision depuis le Cloud avec Azure Logs Analytics
Administration et supervision depuis le Cloud avec Azure Logs AnalyticsAdministration et supervision depuis le Cloud avec Azure Logs Analytics
Administration et supervision depuis le Cloud avec Azure Logs AnalyticsMicrosoft
 
Azure Service Fabric pour les développeurs
Azure Service Fabric pour les développeursAzure Service Fabric pour les développeurs
Azure Service Fabric pour les développeursMicrosoft
 
Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...
Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...
Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...Microsoft
 
Les nouveautés SQL Server 2016
Les nouveautés SQL Server 2016Les nouveautés SQL Server 2016
Les nouveautés SQL Server 2016Microsoft
 
Webinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud DatabasesWebinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud DatabasesOVHcloud
 
Apache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performantApache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performantALTIC Altic
 
NoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisationNoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisationMicrosoft Technet France
 
Bases de données NoSQL
Bases de données NoSQLBases de données NoSQL
Bases de données NoSQLSamy Dindane
 
Plan de Reprise d'Activité avec Azure Site Recovery
Plan de Reprise d'Activité avec Azure Site RecoveryPlan de Reprise d'Activité avec Azure Site Recovery
Plan de Reprise d'Activité avec Azure Site RecoveryMicrosoft
 
Implentation d'une solution Cloud IAAS
Implentation d'une solution Cloud IAASImplentation d'une solution Cloud IAAS
Implentation d'une solution Cloud IAASmohamed hadrich
 
Mise en place d’une infrastructure cloud basée sur cloudstack
Mise en place d’une infrastructure cloud basée sur cloudstackMise en place d’une infrastructure cloud basée sur cloudstack
Mise en place d’une infrastructure cloud basée sur cloudstackchammem
 
IaaS et Cloud Open Source - Raphael Ferreira, eNovance
IaaS et Cloud Open Source - Raphael Ferreira, eNovanceIaaS et Cloud Open Source - Raphael Ferreira, eNovance
IaaS et Cloud Open Source - Raphael Ferreira, eNovanceStefane Fermigier
 
Architecture Big Data open source S.M.A.C.K
Architecture Big Data open source S.M.A.C.KArchitecture Big Data open source S.M.A.C.K
Architecture Big Data open source S.M.A.C.KJulien Anguenot
 
Big data: NoSQL comme solution
Big data: NoSQL comme solutionBig data: NoSQL comme solution
Big data: NoSQL comme solutionJEMLI Fathi
 

La actualidad más candente (20)

Apache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalitésApache Cassandra - Concepts et fonctionnalités
Apache Cassandra - Concepts et fonctionnalités
 
Panorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans AzurePanorama des offres NoSQL disponibles dans Azure
Panorama des offres NoSQL disponibles dans Azure
 
Administration et supervision depuis le Cloud avec Azure Logs Analytics
Administration et supervision depuis le Cloud avec Azure Logs AnalyticsAdministration et supervision depuis le Cloud avec Azure Logs Analytics
Administration et supervision depuis le Cloud avec Azure Logs Analytics
 
Azure Service Fabric pour les développeurs
Azure Service Fabric pour les développeursAzure Service Fabric pour les développeurs
Azure Service Fabric pour les développeurs
 
Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...
Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...
Modélisation, déploiement et gestion des infrastructures Cloud : outils et bo...
 
Les nouveautés SQL Server 2016
Les nouveautés SQL Server 2016Les nouveautés SQL Server 2016
Les nouveautés SQL Server 2016
 
DataStax Enterprise BBL
DataStax Enterprise BBLDataStax Enterprise BBL
DataStax Enterprise BBL
 
Webinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud DatabasesWebinar - Enterprise Cloud Databases
Webinar - Enterprise Cloud Databases
 
Apache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performantApache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performant
 
NoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisationNoSql : conception des schémas, requêtage, et optimisation
NoSql : conception des schémas, requêtage, et optimisation
 
NoSQL et Big Data
NoSQL et Big DataNoSQL et Big Data
NoSQL et Big Data
 
Bases de données NoSQL
Bases de données NoSQLBases de données NoSQL
Bases de données NoSQL
 
DataStax Enterprise - Cas d'usage
DataStax Enterprise - Cas d'usageDataStax Enterprise - Cas d'usage
DataStax Enterprise - Cas d'usage
 
Plan de Reprise d'Activité avec Azure Site Recovery
Plan de Reprise d'Activité avec Azure Site RecoveryPlan de Reprise d'Activité avec Azure Site Recovery
Plan de Reprise d'Activité avec Azure Site Recovery
 
Implentation d'une solution Cloud IAAS
Implentation d'une solution Cloud IAASImplentation d'une solution Cloud IAAS
Implentation d'une solution Cloud IAAS
 
Mise en place d’une infrastructure cloud basée sur cloudstack
Mise en place d’une infrastructure cloud basée sur cloudstackMise en place d’une infrastructure cloud basée sur cloudstack
Mise en place d’une infrastructure cloud basée sur cloudstack
 
Les BD NoSQL
Les BD NoSQLLes BD NoSQL
Les BD NoSQL
 
IaaS et Cloud Open Source - Raphael Ferreira, eNovance
IaaS et Cloud Open Source - Raphael Ferreira, eNovanceIaaS et Cloud Open Source - Raphael Ferreira, eNovance
IaaS et Cloud Open Source - Raphael Ferreira, eNovance
 
Architecture Big Data open source S.M.A.C.K
Architecture Big Data open source S.M.A.C.KArchitecture Big Data open source S.M.A.C.K
Architecture Big Data open source S.M.A.C.K
 
Big data: NoSQL comme solution
Big data: NoSQL comme solutionBig data: NoSQL comme solution
Big data: NoSQL comme solution
 

Destacado

Destacado (20)

Portfolio
PortfolioPortfolio
Portfolio
 
Probabilidad o certeza gemelos
Probabilidad o certeza   gemelosProbabilidad o certeza   gemelos
Probabilidad o certeza gemelos
 
Tuenti
TuentiTuenti
Tuenti
 
Caperucita Roja en versión de 3º A
 Caperucita Roja en versión de 3º A Caperucita Roja en versión de 3º A
Caperucita Roja en versión de 3º A
 
Le Buzz : Booster votre image grace au web 2.0
Le Buzz : Booster votre image grace au web 2.0Le Buzz : Booster votre image grace au web 2.0
Le Buzz : Booster votre image grace au web 2.0
 
La ReproduccióN
La ReproduccióNLa ReproduccióN
La ReproduccióN
 
Dominios
DominiosDominios
Dominios
 
Diagramme de constellation
Diagramme de constellationDiagramme de constellation
Diagramme de constellation
 
Lasmejoresfotos3
Lasmejoresfotos3Lasmejoresfotos3
Lasmejoresfotos3
 
Presentación Power Point1
Presentación Power Point1Presentación Power Point1
Presentación Power Point1
 
Seminario Final
Seminario   FinalSeminario   Final
Seminario Final
 
El pensamiento sociopolítico de Antonio Gramsci
El pensamiento sociopolítico de Antonio GramsciEl pensamiento sociopolítico de Antonio Gramsci
El pensamiento sociopolítico de Antonio Gramsci
 
Mots Liste7
Mots Liste7Mots Liste7
Mots Liste7
 
¡Hola!Los
¡Hola!Los¡Hola!Los
¡Hola!Los
 
El Social Trip #sienteteruel ha producido 104.399.751 impactos en Twitter
El Social Trip #sienteteruel ha producido 104.399.751 impactos en TwitterEl Social Trip #sienteteruel ha producido 104.399.751 impactos en Twitter
El Social Trip #sienteteruel ha producido 104.399.751 impactos en Twitter
 
La méthode z
La méthode zLa méthode z
La méthode z
 
Peliculas
PeliculasPeliculas
Peliculas
 
Habilidades comunicativas para el siglo xxi
Habilidades comunicativas para el siglo xxiHabilidades comunicativas para el siglo xxi
Habilidades comunicativas para el siglo xxi
 
Mi Vida Durante La Primer Parte Del AñO
Mi Vida Durante La Primer Parte Del AñOMi Vida Durante La Primer Parte Del AñO
Mi Vida Durante La Primer Parte Del AñO
 
Actividades Tema 5
Actividades Tema 5Actividades Tema 5
Actividades Tema 5
 

Similar a Introduction à Cassandra

NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC
NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETICNoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC
NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETICLa FeWeb
 
NoSQL panorama - Jean Seiler Softeam
NoSQL panorama - Jean Seiler SofteamNoSQL panorama - Jean Seiler Softeam
NoSQL panorama - Jean Seiler SofteamTelecomValley
 
Couchbase Capella.pptx
Couchbase Capella.pptxCouchbase Capella.pptx
Couchbase Capella.pptxSaraHmida1
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5Amal Abid
 
BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)BlueData, Inc.
 
HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »
HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »
HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »Hitachi Data Systems France
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
OSA02 - Pas de transactionnel haute performance sans un couple machine logici...
OSA02 - Pas de transactionnel haute performance sans un couple machine logici...OSA02 - Pas de transactionnel haute performance sans un couple machine logici...
OSA02 - Pas de transactionnel haute performance sans un couple machine logici...Nicolas Desachy
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherLilia Sfaxi
 
DataStax et Apache Cassandra pour la gestion des flux IoT
DataStax et Apache Cassandra pour la gestion des flux IoTDataStax et Apache Cassandra pour la gestion des flux IoT
DataStax et Apache Cassandra pour la gestion des flux IoTVictor Coustenoble
 
Introduction nosql
Introduction nosqlIntroduction nosql
Introduction nosqlInes Slimene
 
20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessingPierre-Marie Brunet
 
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...Paris Open Source Summit
 
Xebicon2019 m icroservices
Xebicon2019   m icroservicesXebicon2019   m icroservices
Xebicon2019 m icroservicesCédrick Lunven
 
Avenir des grilles - F. Desprez
Avenir des grilles - F. DesprezAvenir des grilles - F. Desprez
Avenir des grilles - F. DesprezFrederic Desprez
 
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...Frederic Descamps
 
Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - IntroductionBlandine Larbret
 

Similar a Introduction à Cassandra (20)

NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC
NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETICNoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC
NoSQL: Quoi, quand et pour qui par Orlando Cassano du CETIC
 
NoSQL panorama - Jean Seiler Softeam
NoSQL panorama - Jean Seiler SofteamNoSQL panorama - Jean Seiler Softeam
NoSQL panorama - Jean Seiler Softeam
 
Couchbase Capella.pptx
Couchbase Capella.pptxCouchbase Capella.pptx
Couchbase Capella.pptx
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Cours Big Data Chap5
Cours Big Data Chap5Cours Big Data Chap5
Cours Big Data Chap5
 
BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)BlueData EPIC datasheet (en Français)
BlueData EPIC datasheet (en Français)
 
HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »
HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »
HIF Paris 2014 - BROCADE - Le Réseau de Data Center « ON-DEMAND »
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
OSA02 - Pas de transactionnel haute performance sans un couple machine logici...
OSA02 - Pas de transactionnel haute performance sans un couple machine logici...OSA02 - Pas de transactionnel haute performance sans un couple machine logici...
OSA02 - Pas de transactionnel haute performance sans un couple machine logici...
 
BigData_Chp5: Putting it all together
BigData_Chp5: Putting it all togetherBigData_Chp5: Putting it all together
BigData_Chp5: Putting it all together
 
DataStax et Apache Cassandra pour la gestion des flux IoT
DataStax et Apache Cassandra pour la gestion des flux IoTDataStax et Apache Cassandra pour la gestion des flux IoT
DataStax et Apache Cassandra pour la gestion des flux IoT
 
Introduction nosql
Introduction nosqlIntroduction nosql
Introduction nosql
 
Big data architectures
Big data architecturesBig data architectures
Big data architectures
 
20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing20160216 - From BigData to BigProcessing
20160216 - From BigData to BigProcessing
 
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
#OSSPARIS19 - Stream processing : de la base de données classique au streamin...
 
Xebicon2019 m icroservices
Xebicon2019   m icroservicesXebicon2019   m icroservices
Xebicon2019 m icroservices
 
Avenir des grilles - F. Desprez
Avenir des grilles - F. DesprezAvenir des grilles - F. Desprez
Avenir des grilles - F. Desprez
 
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
 
Hadoop Hbase - Introduction
Hadoop Hbase - IntroductionHadoop Hbase - Introduction
Hadoop Hbase - Introduction
 
Google spanner
Google spannerGoogle spanner
Google spanner
 

Introduction à Cassandra