SlideShare una empresa de Scribd logo
1 de 17
FINI LA RÉCRÉ
PASSONS AUX MÉGADONNÉES
V1 - 10/03/15
1
« Dans le concret, projets
de transformation vers le
BigData … »
ABED AJRAOU
CONNAISSEZ-VOUS PAGESJAUNES ?
CONNAISSEZ-VOUS PAGESJAUNES ?
LES MEGADONNEES RÉPONDENT À DE NOUVEAUX
BESOINS
Big Data
Self-Service BI
BI institutionnelle
Données structurées d’entreprise
CRM SCM
Données locales
Système de
fichierstextes
ERP Base de
données
Données non structurées d’entreprise et externes
Image, VidéoGestion de
contenu, Logs
Réseaux sociaux
DataWarehouse Datamart Cubes
Reporting
ETL Data Cleansing
Couche sémantique
Data Gathering
Business Discovery Data Visualisation
Approche Agile
Mining
Data Interact
Massive Processing
Parallel
Flux des clics
utilisateursen
temps réel
Données GPS et
spatiales
Sentiment Analysis
Social Interaction Open Data
Analyse du Web
Mobile
Voix en Texte
Indexation
Texte MiningGestion des Logs
Analyse des RFID /
Capteurs
5
LA PREUVE PAR L’EXPÉRIMENTATION….
DMT
DWH
ODS
6
Données Structurées ou Semi-structurées d’entreprise
Logs fixe
Base de
donnée
Base de
donnéesLogs mobile
Base de
données
BI Audience BI Mobile BI Commercial BI Données
Quelques limitations de la
BI actuelle:
1. BI globalement en silo
=> ce qui ne constitue
pas de la vraie BI
2. Socle de données sur
Netezza avec risque de
saturation avérée
3. Aucune possibilité
d’incorporer des
données non
structurées (type blog,
réseaux sociaux …)
4. BI en mode batch
BI - ARCHITECTURE 2013 ET 2014
Parc applicatif BI en transformation
en 2014 et cible 2015 : activons le
Big Data !
7Date •Titre de la présentation
Data Mart Fonctionnel
8
Open Data Group
(Données brutes et Open Datamart)
Données Structurées ou Semi-structurées d’entreprise
Logs fixe Commerc
iale
FinanceLogs mobile
Données non structurées
Image, VidéoPortail / IntranetSocial NetworkRH MPG CRM
Data Visualisation
VISION CIBLE ARCHITECTURE DE LA BI
9
RÉALISATIONS 2014 – REAL TIME BUSINESS
Real Time Business
10
RÉALISATIONS 2014/2015 - POWER
SELECTOR
Search Power Selector
11
OUR CONVICTION: OPENSOURCE WOULD SOLVE
MOST OF BI PAINS
The Enterprise Data Hub of Cloudera would be
the « Extended DataWarehouse »
The NoSql « Column Database » is the simple way to give access to the
end user and ensure good performance
The end of the Batch, and the welcome of the Streaming
and real time data
Performance ETL for the data transformation on top of
Hadoop
New Data Visualization / Data Story Telling, which is very
quick to install/deploy, and simple to use
LE PARTAGE DE CONNAISSANCES EST CLEF!
12
Le mangement de la donnée est essentiel dans toute
pratique Big Data et tout projet. Nous avons lancé dans le
cadre de l’association 3 groupes de travail:
• Big Data
• Data Science
• Data Gouvernance
D’autres ateliers suivront, des événements, de la littérature
… donc abonnez-vous et n’attendez plus!
http://www.dama-france.org/
BIENVENUE DANS LE MONDE DU
NOSQL
13
LE NOSQL, POURQUOI?
14
1970
~2009
Système transactionnel:
Écritures concurrentes,
Performance accès concurrents
Standardisation …
Systèmes de fichiers Base de données - RDBMS
Base de données - RDBMS
Big Data:
Volumétrie (téra/péta octet)
Performance
Données non structurées
NOSQL – NOT ONLY SQL
DIFFÉRENTS TYPES:
• BASES ORIENTÉES CLÉ / VALEUR
• BASES ORIENTÉES COLONNES
• BASES ORIENTÉES GRAPHES
• BASES ORIENTÉES DOCUMENTS
15
Data Model Performance Scalability Flexibility Complexity Functionality
Key–Value Store high high high none variable (none)
Column-Oriented
Store
high high moderate low minimal
Document-
Oriented Store
high
variable
(high)
high low variable (low)
Graph Database variable variable high high graph theory
Relational
Database
variable variable low moderate
relational
algebra
Ben Scofield a évalué les différents types de NoSQL:
NOSQL – FOCUS SUR IMPALA ET
L’ORIENTÉE COLONNE
16
RowId Matricule Nom Prénom DateEntrée Fonction Salaire
1 53427Dupont Eric 01/01/2000 Ingénieur 30000
2 89765Martin Jean 15/03/2007 Contrôleur 65000
3 109755LeMaitre Gaston 13/12/2003 Architecte 45000
4 76598Dupont Gaston 01/01/2000 Contrôleur 50000
5 9090432Prince Charles 01/01/2010 Ingénieur 55000
Nom
Dupont 1;4
Martin 2
LeMaitre 3
Prince 5
Prenom
Eric 1
Jean 2
Gaston 3;4
Charles 5
Sur Impala, le mode Parquet enregistre cela en binaire et de façon compressée, ce
qui accélère les analyses OLAP – agrégations, filtres …
CONSEIL: COMMENT ACTIVER LES PROJETS ET
COMMENT REMÉDIER À L’IMMOBILISME?
Avec votre bâton de pèlerin:
• expliquez
• démystifiez
• donnez du sens
• fédérez!
Trouvez le sponsor dans l’entreprise, qui vous
• soutiendra
• appuiera
• mettra en lumière
Lancez-vous! Nous avons toute la maturité
technologique pour enfin réaliser tous nos
désirs en termes de data! Épanouissez-
vous!
17

Más contenido relacionado

La actualidad más candente

BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introductionMouna Torjmen
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusCHAKER ALLAOUI
 
Le Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’AssuranceLe Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’AssuranceAbdessatar Hammedi
 
Croisière sur le data lake
Croisière sur le data lakeCroisière sur le data lake
Croisière sur le data lakeDavid Morel
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Denodo
 
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Jean-Michel Franco
 
Usi 2013-next big data architecture
Usi 2013-next big data architectureUsi 2013-next big data architecture
Usi 2013-next big data architectureOlivier Mallassi
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataNicolas Peene
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Denodo
 
Microsoft Power Business Intelligence
Microsoft Power Business IntelligenceMicrosoft Power Business Intelligence
Microsoft Power Business IntelligenceMario-Charly TOBOSSOU
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data TalendJean-Michel Franco
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceParis Open Source Summit
 
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Jean-Michel Franco
 
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !Denodo
 
Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2Mehdi TAZI
 

La actualidad más candente (20)

Big data
Big dataBig data
Big data
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Chapitre1 introduction
Chapitre1 introductionChapitre1 introduction
Chapitre1 introduction
 
Big Data, kesako ?
Big Data, kesako ?Big Data, kesako ?
Big Data, kesako ?
 
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
 
Big data
Big dataBig data
Big data
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processus
 
Le Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’AssuranceLe Big Data transforme en profondeur le monde de la Banque et de l’Assurance
Le Big Data transforme en profondeur le monde de la Banque et de l’Assurance
 
Croisière sur le data lake
Croisière sur le data lakeCroisière sur le data lake
Croisière sur le data lake
 
Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?Quel est l'avenir des stratégies de données?
Quel est l'avenir des stratégies de données?
 
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
Big Data : au delà du proof of concept et de l'expérimentation (Matinale busi...
 
Usi 2013-next big data architecture
Usi 2013-next big data architectureUsi 2013-next big data architecture
Usi 2013-next big data architecture
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big Data
 
Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...Réussissez vos projets d’analytique self-service avec une couche de services ...
Réussissez vos projets d’analytique self-service avec une couche de services ...
 
Microsoft Power Business Intelligence
Microsoft Power Business IntelligenceMicrosoft Power Business Intelligence
Microsoft Power Business Intelligence
 
[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend[French] Matinale du Big Data Talend
[French] Matinale du Big Data Talend
 
OWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysanceOWF12/BIG DATA Presentation big data owf ysance
OWF12/BIG DATA Presentation big data owf ysance
 
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
Spark : 5 moyens simples et rapides pour exploiter vos Big Data avec Spark et...
 
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
DataGalaxy et Denodo : le guichet unique de gouvernance et d’accès aux données !
 
Introduction à la big data V2
Introduction à la big data V2Introduction à la big data V2
Introduction à la big data V2
 

Destacado

Gamma Soft. L'entreprise Temps-Réel
Gamma Soft. L'entreprise Temps-RéelGamma Soft. L'entreprise Temps-Réel
Gamma Soft. L'entreprise Temps-RéelGamma Soft
 
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME
 
Démo AGGREGO Salon Big Data Paris 2017
Démo AGGREGO Salon Big Data Paris 2017Démo AGGREGO Salon Big Data Paris 2017
Démo AGGREGO Salon Big Data Paris 2017François Paulus
 
La información al servicio de la investigación 2015
La información al servicio de la investigación 2015La información al servicio de la investigación 2015
La información al servicio de la investigación 2015Erla Mariela Morales Morgado
 
Dental phobia
Dental phobiaDental phobia
Dental phobiaLookswoow
 
C Programming Training In Ambala ! BATRA COMPUTER CENTRE
C Programming Training In Ambala ! BATRA COMPUTER CENTREC Programming Training In Ambala ! BATRA COMPUTER CENTRE
C Programming Training In Ambala ! BATRA COMPUTER CENTREjatin batra
 
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...Business & Decision
 
IT Solution Architect & Architecture for Thailand 4.0
IT Solution Architect & Architecture for Thailand 4.0IT Solution Architect & Architecture for Thailand 4.0
IT Solution Architect & Architecture for Thailand 4.0encipher
 
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...Clic et Site
 
Td rs revue externe programme education 16 dec 2013 final -
Td rs revue externe programme education 16 dec 2013   final -Td rs revue externe programme education 16 dec 2013   final -
Td rs revue externe programme education 16 dec 2013 final -assotanmia
 
Questioanire results
Questioanire resultsQuestioanire results
Questioanire resultsmidge1997
 
Centre des cartes mentales pour les nuls
Centre des cartes  mentales pour les nulsCentre des cartes  mentales pour les nuls
Centre des cartes mentales pour les nulsNicolas Lévy
 
Regarder la meteo
Regarder la meteoRegarder la meteo
Regarder la meteoAnder050
 

Destacado (17)

Tesis cuarta parte
Tesis cuarta parteTesis cuarta parte
Tesis cuarta parte
 
Gamma Soft. L'entreprise Temps-Réel
Gamma Soft. L'entreprise Temps-RéelGamma Soft. L'entreprise Temps-Réel
Gamma Soft. L'entreprise Temps-Réel
 
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
Blue DME - COVEA : projet XDStore sur l'accès aux données externes dans l'ass...
 
Démo AGGREGO Salon Big Data Paris 2017
Démo AGGREGO Salon Big Data Paris 2017Démo AGGREGO Salon Big Data Paris 2017
Démo AGGREGO Salon Big Data Paris 2017
 
La información al servicio de la investigación 2015
La información al servicio de la investigación 2015La información al servicio de la investigación 2015
La información al servicio de la investigación 2015
 
Dental phobia
Dental phobiaDental phobia
Dental phobia
 
C Programming Training In Ambala ! BATRA COMPUTER CENTRE
C Programming Training In Ambala ! BATRA COMPUTER CENTREC Programming Training In Ambala ! BATRA COMPUTER CENTRE
C Programming Training In Ambala ! BATRA COMPUTER CENTRE
 
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
Business & Decision - Atteignez le ROI2 sur vos projets Data - Congrès Big Da...
 
IT Solution Architect & Architecture for Thailand 4.0
IT Solution Architect & Architecture for Thailand 4.0IT Solution Architect & Architecture for Thailand 4.0
IT Solution Architect & Architecture for Thailand 4.0
 
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
EMDay 2015 - 10 conseils concrets pour déployer un datamart performant sur le...
 
La chimioprophylaxie et les groupes - cibles
La chimioprophylaxie et les groupes - ciblesLa chimioprophylaxie et les groupes - cibles
La chimioprophylaxie et les groupes - cibles
 
Td rs revue externe programme education 16 dec 2013 final -
Td rs revue externe programme education 16 dec 2013   final -Td rs revue externe programme education 16 dec 2013   final -
Td rs revue externe programme education 16 dec 2013 final -
 
Questioanire results
Questioanire resultsQuestioanire results
Questioanire results
 
La gestion du cycle de projet
La gestion du cycle de projetLa gestion du cycle de projet
La gestion du cycle de projet
 
Centre des cartes mentales pour les nuls
Centre des cartes  mentales pour les nulsCentre des cartes  mentales pour les nuls
Centre des cartes mentales pour les nuls
 
Regarder la meteo
Regarder la meteoRegarder la meteo
Regarder la meteo
 
Mi ple
Mi pleMi ple
Mi ple
 

Similar a Big data Paris Presentation Solocal 20150310

La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientDenodo
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationDenodo
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesConverteo
 
Simplifier la mise en place d'une stratégie Data Mesh avec Denodo
Simplifier la mise en place d'une stratégie Data Mesh avec DenodoSimplifier la mise en place d'une stratégie Data Mesh avec Denodo
Simplifier la mise en place d'une stratégie Data Mesh avec DenodoDenodo
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013ADBS
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Converteo
 
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...Denodo
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big DataIdriss22
 
Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Microsoft Technet France
 
Big Data by Soft Computing - Lille
Big Data by Soft Computing - LilleBig Data by Soft Computing - Lille
Big Data by Soft Computing - LilleSoft Computing
 
Le reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageLe reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageMichael Nokhamzon
 
Trop de Bla Bla, Passons au BigData
Trop de Bla Bla, Passons au BigDataTrop de Bla Bla, Passons au BigData
Trop de Bla Bla, Passons au BigDataAbed Ajraou
 
SAS Forum Soft Computing Théâtre
SAS Forum Soft Computing ThéâtreSAS Forum Soft Computing Théâtre
SAS Forum Soft Computing ThéâtreSoft Computing
 
#BigDataBx 1 - Présentation de la BI au BigData - Solocal Group
#BigDataBx 1 - Présentation de la BI au BigData - Solocal Group#BigDataBx 1 - Présentation de la BI au BigData - Solocal Group
#BigDataBx 1 - Présentation de la BI au BigData - Solocal GroupExcelerate Systems
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationDenodo
 
De la BI au Big Data
De la BI au Big DataDe la BI au Big Data
De la BI au Big DataAbed Ajraou
 
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...Yassine, LASRI
 

Similar a Big data Paris Presentation Solocal 20150310 (20)

La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance client
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data VirtualizationSession découverte de la Logical Data Fabric soutenue par la Data Virtualization
Session découverte de la Logical Data Fabric soutenue par la Data Virtualization
 
Livre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakesLivre Blanc : comprendre les data-lakes
Livre Blanc : comprendre les data-lakes
 
Simplifier la mise en place d'une stratégie Data Mesh avec Denodo
Simplifier la mise en place d'une stratégie Data Mesh avec DenodoSimplifier la mise en place d'une stratégie Data Mesh avec Denodo
Simplifier la mise en place d'une stratégie Data Mesh avec Denodo
 
Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013Big Data, Charles Huot, Aproged,février 2013
Big Data, Charles Huot, Aproged,février 2013
 
Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018Livre blanc data-lakes converteo 2018
Livre blanc data-lakes converteo 2018
 
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
 
Ecosystème Big Data
Ecosystème Big DataEcosystème Big Data
Ecosystème Big Data
 
Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage
 
Big Data by Soft Computing - Lille
Big Data by Soft Computing - LilleBig Data by Soft Computing - Lille
Big Data by Soft Computing - Lille
 
Big data
Big dataBig data
Big data
 
Le reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageLe reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usage
 
Trop de Bla Bla, Passons au BigData
Trop de Bla Bla, Passons au BigDataTrop de Bla Bla, Passons au BigData
Trop de Bla Bla, Passons au BigData
 
SAS Forum Soft Computing Théâtre
SAS Forum Soft Computing ThéâtreSAS Forum Soft Computing Théâtre
SAS Forum Soft Computing Théâtre
 
Big Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internetBig Data - Quel usage au sein des projets internet
Big Data - Quel usage au sein des projets internet
 
#BigDataBx 1 - Présentation de la BI au BigData - Solocal Group
#BigDataBx 1 - Présentation de la BI au BigData - Solocal Group#BigDataBx 1 - Présentation de la BI au BigData - Solocal Group
#BigDataBx 1 - Présentation de la BI au BigData - Solocal Group
 
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data VirtualizationRéinventez votre stratégie de données en 2021 avec la Data Virtualization
Réinventez votre stratégie de données en 2021 avec la Data Virtualization
 
De la BI au Big Data
De la BI au Big DataDe la BI au Big Data
De la BI au Big Data
 
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
Webinaire Comment enrichir votre BI avec l’analyse en temps réel des CDR via ...
 

Big data Paris Presentation Solocal 20150310

  • 1. FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES V1 - 10/03/15 1 « Dans le concret, projets de transformation vers le BigData … » ABED AJRAOU
  • 4. LES MEGADONNEES RÉPONDENT À DE NOUVEAUX BESOINS Big Data Self-Service BI BI institutionnelle Données structurées d’entreprise CRM SCM Données locales Système de fichierstextes ERP Base de données Données non structurées d’entreprise et externes Image, VidéoGestion de contenu, Logs Réseaux sociaux DataWarehouse Datamart Cubes Reporting ETL Data Cleansing Couche sémantique Data Gathering Business Discovery Data Visualisation Approche Agile Mining Data Interact Massive Processing Parallel Flux des clics utilisateursen temps réel Données GPS et spatiales Sentiment Analysis Social Interaction Open Data Analyse du Web Mobile Voix en Texte Indexation Texte MiningGestion des Logs Analyse des RFID / Capteurs
  • 5. 5 LA PREUVE PAR L’EXPÉRIMENTATION….
  • 6. DMT DWH ODS 6 Données Structurées ou Semi-structurées d’entreprise Logs fixe Base de donnée Base de donnéesLogs mobile Base de données BI Audience BI Mobile BI Commercial BI Données Quelques limitations de la BI actuelle: 1. BI globalement en silo => ce qui ne constitue pas de la vraie BI 2. Socle de données sur Netezza avec risque de saturation avérée 3. Aucune possibilité d’incorporer des données non structurées (type blog, réseaux sociaux …) 4. BI en mode batch BI - ARCHITECTURE 2013 ET 2014
  • 7. Parc applicatif BI en transformation en 2014 et cible 2015 : activons le Big Data ! 7Date •Titre de la présentation
  • 8. Data Mart Fonctionnel 8 Open Data Group (Données brutes et Open Datamart) Données Structurées ou Semi-structurées d’entreprise Logs fixe Commerc iale FinanceLogs mobile Données non structurées Image, VidéoPortail / IntranetSocial NetworkRH MPG CRM Data Visualisation VISION CIBLE ARCHITECTURE DE LA BI
  • 9. 9 RÉALISATIONS 2014 – REAL TIME BUSINESS Real Time Business
  • 10. 10 RÉALISATIONS 2014/2015 - POWER SELECTOR Search Power Selector
  • 11. 11 OUR CONVICTION: OPENSOURCE WOULD SOLVE MOST OF BI PAINS The Enterprise Data Hub of Cloudera would be the « Extended DataWarehouse » The NoSql « Column Database » is the simple way to give access to the end user and ensure good performance The end of the Batch, and the welcome of the Streaming and real time data Performance ETL for the data transformation on top of Hadoop New Data Visualization / Data Story Telling, which is very quick to install/deploy, and simple to use
  • 12. LE PARTAGE DE CONNAISSANCES EST CLEF! 12 Le mangement de la donnée est essentiel dans toute pratique Big Data et tout projet. Nous avons lancé dans le cadre de l’association 3 groupes de travail: • Big Data • Data Science • Data Gouvernance D’autres ateliers suivront, des événements, de la littérature … donc abonnez-vous et n’attendez plus! http://www.dama-france.org/
  • 13. BIENVENUE DANS LE MONDE DU NOSQL 13
  • 14. LE NOSQL, POURQUOI? 14 1970 ~2009 Système transactionnel: Écritures concurrentes, Performance accès concurrents Standardisation … Systèmes de fichiers Base de données - RDBMS Base de données - RDBMS Big Data: Volumétrie (téra/péta octet) Performance Données non structurées
  • 15. NOSQL – NOT ONLY SQL DIFFÉRENTS TYPES: • BASES ORIENTÉES CLÉ / VALEUR • BASES ORIENTÉES COLONNES • BASES ORIENTÉES GRAPHES • BASES ORIENTÉES DOCUMENTS 15 Data Model Performance Scalability Flexibility Complexity Functionality Key–Value Store high high high none variable (none) Column-Oriented Store high high moderate low minimal Document- Oriented Store high variable (high) high low variable (low) Graph Database variable variable high high graph theory Relational Database variable variable low moderate relational algebra Ben Scofield a évalué les différents types de NoSQL:
  • 16. NOSQL – FOCUS SUR IMPALA ET L’ORIENTÉE COLONNE 16 RowId Matricule Nom Prénom DateEntrée Fonction Salaire 1 53427Dupont Eric 01/01/2000 Ingénieur 30000 2 89765Martin Jean 15/03/2007 Contrôleur 65000 3 109755LeMaitre Gaston 13/12/2003 Architecte 45000 4 76598Dupont Gaston 01/01/2000 Contrôleur 50000 5 9090432Prince Charles 01/01/2010 Ingénieur 55000 Nom Dupont 1;4 Martin 2 LeMaitre 3 Prince 5 Prenom Eric 1 Jean 2 Gaston 3;4 Charles 5 Sur Impala, le mode Parquet enregistre cela en binaire et de façon compressée, ce qui accélère les analyses OLAP – agrégations, filtres …
  • 17. CONSEIL: COMMENT ACTIVER LES PROJETS ET COMMENT REMÉDIER À L’IMMOBILISME? Avec votre bâton de pèlerin: • expliquez • démystifiez • donnez du sens • fédérez! Trouvez le sponsor dans l’entreprise, qui vous • soutiendra • appuiera • mettra en lumière Lancez-vous! Nous avons toute la maturité technologique pour enfin réaliser tous nos désirs en termes de data! Épanouissez- vous! 17