Dojo 02 : Introduction au noSQL

Introduction au NoSQL

Mathieu PARISOT
@matparisot

Présentation So@t 1
License Creative Commons 2.0 – Share Alike

Agenda

Un petit historique

Les acteurs et les cas d'utilisations

Les principes et les familles

Les probématiques

Le futur


Un peu d'histoire...

1998 : naissance du terme
Professional NoSQL par Shashank Tiwari

2009 : meetup de San Francisco
100 participants des principaux acteurs

1970 : premières bases NoSQL


Un nom étrange

Première signification : Pas de SQL

Puis : Not Only SQL

Autres noms :
BigData
NotRelational

En opposition à SGBDR


Qui les utilisent ?


Pourquoi faire ?

Gérer des volumes de données énormes
Plusieurs téra octets

Des performances en lectures/écritures
Centaines de milliers de lectures/secondes
Centaines de milliers d'écritures/secondes

Distribuer ses données
Répartition multisites
Éviter les Single Point Of Failure
Load balancing

S'affranchir des schémas rigides

Des cas pratiques...

Gérer des logs

Stocker des messages utilisateurs

Stocker des données de crawling

Remplacer les DataWarehouses

Stocker des données hétérogènes


Un contre exemple


Des grands principes...

Pas de jointures

Des moteurs simples

Des Apis propres à chaque moteur

Des données distribuées

Structures flexibles

Duplication des données

Les types de bases NoSQL

Clefs/Valeurs

Documents

Colonnes

Graphes


Clefs/valeurs

Simple

Rapide

Moteur ne connaît pas le contenu


Documents

Données hiérarchiques
Plusieurs types de documents : XML, JSON, etc.
Indexation possible du contenu


Colonnes

Chaque ligne possède des colonnes différentes

Très flexible


Graphes

Liens complexes et flexibles entre les données

Modélisation proche de la réalité


Nouvelles problématiques

Changements des paradigmes de modélisation
Plus proche de la réalité
Plus proche du code
Problématiques de distribution
Intégration dans le Cloud
Théorème de CAP
Algorithmes distribués
Report de fonctionnalité sur l'application
Pas de jointures
Tri difficiles
Bien choisir ses clefs
Manque d'outils

Théorème de CAP ou CDP

SGBDR

Disponibilit
é
(Availability)
Cohérence
(Consistenc NoSQL
Résistance
y)
au
morcellem
ent
(partition
Impossible tolerence)


Un exemple !


Map/Reduce en théorie

Calcul distribué sur des données énormes (>1Tb)

Découpage du problème en sous problèmes (map)

Agrégation des résultats (reduce)


Map/Reduce en image


Standardisation

Chaque moteur possède son langage de requêtes

Certains réintègrent un SQL allégé

Frameworks de standardisations :
En Java : Spring Data, Hibernate OGM
En DotNet : LINQ

Encore beaucoup de chemin à parcourir


L'avenir : la guerre

Des technologies jeunes portées par des Startup

Beaucoup de solutions

Les gros du secteurs commencent à s'y intéresser

Dans 10 ans combien auront survécu ?


L'avenir : multi-BDD

Chaque solution possède ses avantages et inconvénients

Utiliser le bon outil pour le bon problème

Pas de remplacement des SGBDR mais un complément

Au final nos applications auront plusieurs bases


Les systèmes de caches

Cache = clefs/valeurs distribuées

Stockage en mémoire et sur le disque

Convergence des deux mondes


Des questions ?

Mathieu PARISOT
@matparisot


Dojo 02 : Introduction au noSQL

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (20)

Similar a Dojo 02 : Introduction au noSQL

Similar a Dojo 02 : Introduction au noSQL (20)

Más de SOAT

Más de SOAT (20)

Dojo 02 : Introduction au noSQL

Notas del editor