SlideShare una empresa de Scribd logo
1 de 26
INTRODUCTION DU SUJET
AIT EL MOUDEN Zakariyaa
Définition
 Les big data, littéralement les « grosses données »,
ou mégadonnées, désignent des ensembles de données qui
deviennent tellement volumineux qu'ils en deviennent
difficiles à travailler avec des outils classiques de gestion
de base de données ou de gestion de l'information.
-wikipédia-
2
D’où vient les données ?
 Les applications et les services professionnels:
- ERP ’Entreprise Resource planning’
en français « progiciel de gestion intégré » (PGI) : Ce type de
logiciel correspond, pour une organisation, au support de base
capable d'assurer une « gestion intégrée», définie comme étant
l'interconnexion et l'intégration de l'ensemble des fonctions de
l'entreprise dans un système informatique centralisé (et
généralement configuré selon le mode client-serveur).
Les sources de production des données :
3
- CRM ’Customer Relationship Management’
en français « La gestion de la relation client » (GRC) : est l'ensemble
des outils et techniques destinés à capter, traiter, analyser les
informations relatives aux clients et aux prospects, dans le but de les
fidéliser en leur offrant le meilleur service
- SCM ‘supply chain management’
en français «gestion de la chaîne logistique» (GCL)
vise à garantir l'organisation et la qualité du service logistique en
conformité avec les dispositions figurant au cahier des charges
logistique.
- les outils de production de contenu et de bureautique (série
office) ou les intranets, etc.
Les sources de production des données : (suite)
4
 Le Web
En utilisant le Web, Les entreprises et les organisations créent
un volume considérable de données (sites d’actualités, e-
commerce, publicités … )
Avec l’utilisation des moteurs de recherche et les annuaires
dans le web, le nombre des données crées est de plus en plus
innombrables.
"Nous créons actuellement en deux jours autant d'information
que nous en avions créée depuis la naissance de la civilisation
jusqu'en 2003".
rappelait récemment Eric Schmidt, Chairman de Google.
Les sources de production des données : (suite)
5
 Les Media sociaux
Avec le développement des outils d’expression (le Web 2.0) ces
dix dernières années, le volume des données produites à eu une
croissance phénoménale.
exemples :
Réseaux sociaux : facebook, twitter, youtube, etc
Plateformes de partage : SlideShare, Flickr, Instagram, etc
Statistique :
Chaque minute, plus de 30 heures de vidéo sont uploadées sur
YouTube, 2 millions de posts sont publiés sur Facebook et
100.000 tweets diffusés sur Twitter.
Les sources de production des données : (suite)
6
 Le Mobile
Avec l’évolution du mobile, et l’apparition du ‘smartphone’, Le
téléphone mobile est devenu une source respectable de
production des données.
Les statistiques prouvent qu’ il y a actuellement 4 fois plus de
téléphone mobiles en usage que des ordinateurs et tablettes.
Statistique :
A la fin 2013, l'App Store de Apple et Google Play auront
dépassé les 50 milliards d'applications téléchargées.
Les sources de production des données : (suite)
7
 Internet des objets (IdO)
en anglais « Internet Of Things » (IoT)
un réseau qui permet, via des systèmes d’identification
électronique normalisés et sans fil, d’identifier et de
communiquer numériquement avec des objets physiques afin de
pouvoir mesurer et échanger des données entre les mondes
physiques et virtuels.
L'internet des objets est considéré comme la troisième
évolution de l'Internet, baptisée Web 3.0
Les sources de production des données : (suite)
8
Les catégories des données
 Données Structurées
les informations structurées sont disposées de façon à être traitées
automatiquement et efficacement par un logiciel, mais non
nécessairement par un humain.
La ligne de code Java : int salaire = 6000; String nom=« Ali";
est un exemple simple d’informations structurées ,nous connaissons
les valeurs, dont le nom est associé à la fonction. Nous pouvons ici
supposer que le nom de l’individu est Jean et que son salaire est de
6 000 Dh.
Par opposition, la chaîne de caractères « Ali gagne un salaire de
60 000 dirhams » n’est pas structurée, car nous ne pouvons nous
attendre à ce qu’un logiciel puisse lire et comprendre une phrase
écrite en français.
9
Les catégories des données (suite)
 Le plus souvent, nous disposons les informations structurées
dans des tableaux, comme dans une base de données
relationnelle
Nom Salaire
Ali 6000
Mohammed 7000
10
Les catégories des données (suite)
 Les données non structurées
Il est impossible de tout stocker sous la forme d’informations
structurées (p. ex. lettres, courriels, livres, rapports, collections
d’images ou de vidéos, brevets, images satellites, offres de service
et CV, appels d’offre). Il s’agit pourtant d’informations que les
organisations doivent traiter.
 Les big data sont généralement des données semi structurées.
11
Les dimensions du BIG DATA
Les
dimensions
du big data
Volume
Vitesse
Variété
Véracité
Visibilité
Valeur
12
 Le Volume : Le premier concept qui intervient dans la notion
du big data, données en petabyte( 1015 bytes )
 La Vitesse : Analyse et exploitation des données en temps réel.
 La Variété : Les données sont non structurées, et de plus sont de
formats différents (images, texte, sons, vidéos , etc.)
 La Valeur : Les données concernées sont de valeur importante
dans l’entreprise.
Les 4v principaux
13
Pourquoi la notion du big data est
récente ?
 L’expression « Big data » fait finalement son apparition en
octobre 1997 dans la bibliothèque numérique de l’ACM*, au sein
d’articles scientifiques qui pointent du doigt les défis
technologiques à visualiser les « grands ensembles de données ».
Le Big data est né, et avec lui ses nombreux défis..
*Association For Computing Machinery, association américaine à but non
lucratif fondée en 1947 et vouée à l’informatique. Sa bibliothèque
numérique est particulièrement riche quand il s’agit de retracer l’histoire
de la discipline.
14
Facteurs de naissance du Big data
 Le cout du stockage : Ce concept n’est plus un problème majeur
pour les entreprises avec l’apparition du Cloud Computing.
 Réseaux à très haut débit (THD) : Le stockage des données dans
des serveurs distants n’est pas une vrai solution sans un réseau
hait débit pour atteindre ces données avec une transparence à la
localisation.
 Evolution des technologie de gestion et d’analyse des données :
Analyse et gestion en temps réel
15
Usages des Big Data
 Optimisation
Optimisation du temps de calcul, recherche, traitement des
données, etc.
exemple:
Une société de de fabrication d’éoliennes nommée Vestas ,
utilise les ‘ big data analytics ’ d’IBM pour décider la localisation
d’éoliennes en optimisant le temps de traitement des données
variées et non structurées (données météorologiques et géo
spatiales, des images satellites, etc. )
>> résultat fournit en quelques heures, au lieu des études qui
prennent des semaines sur terrain.
16
 Tracer et cibler
Les big data permettent d’analyser la situation et le contexte de
millier de personnes en temps réel.
Application : (big data dans l’aéroport)
les passagers doivent obligatoirement passer un certain
nombre de tests de sécurité (ce qui génère du stress, des temps
d’attente).
Une application de géolocalisation dans l’aéroport pourrait
offrir aux passagers, en retour de leurs données émises, un guide
interactif du lieu, des informations sur les temps d’attente aux
différents postes de sécurité, sur les horaires des vols et portes
d’embarquement, alors ils peuvent exploiter leurs temps
d’attente dans des boutiques ou des restaurants, etc.
17
Usages des Big Data (suite)
Usages des Big Data (suite)
 Prévoir et prédire
L’analyse prédictive permet de faire des projections ultra
réalistes pour identifier des nouvelles sources d’opportunités (ou
des menaces) et ainsi anticiper les réponses adaptées à la
situation réelle.
Exemple :
‘Flu Trends’ est un modèle de Google qui permet d’estimer la
propagation des cas réels de grippe en fonction des recherches
sur Internet, prenant en compte le fait que tous les internautes
qui tapent « grippe » sur leur clavier ne sont pas nécessairement
malades.
 Automobile et Autres usages …
18
Visualisation des données
 Pourquoi on visualise les données ?
‘’ Une image (data visualisation) vaut mieux qu'un long (big)
discours (data) ‘’
Une visualisation intelligente et utilisable des analytics sont un
facteur clé dans le déploiement du Big Data dans les entreprises.
Le développement des infographies va d'ailleurs de pair avec le
développement des techniques d'exploitation des données.
19
Visualisation des données (suite)
La visualisation des big data permet :
 La prise de décision
Une Data Visualisation de qualité donnera aux managers le
moyen de manipuler de larges volumes de données pour faire
émerger des tendances, ou encore répondre à des questions
spécifiques.
Grâce à des outils de comparaison et de croisement dynamiques,
les managers peuvent faire apparaître des informations perdues
sous le flot de données, qui ne peuvent se révéler qu’après avoir
été visualisées.
20
Visualisation des données (suite)
 se concentrer sur l’essentiel, plus rapidement
La principale raison pour laquelle la Data Visualisation est
demandée par les entreprises est la confusion qui accompagne la
surcharge de données : celles-ci sont éparpillées dans des feuilles
de calculs, des bases de données, des espaces de stockages… Leur
interprétation devient difficile. A l’inverse, le but de la Data
Visualisation va à l’essentiel en regroupant toutes ces données
sur un seul écran, et en les traitant intelligemment grâce à des
filtres, des groupes et des classements pertinents.
21
Visualisation des données (suite)
22
Exemple :
 Fichier visualisé :
Les misérables de Victor Hugo
 Nombre de nœuds : 77
 Nombre des liens : 254
 Algorithme de spatialisation :
Force Atlas
 Outil de visualisation :
Gephi 0.8.1
Visualisation des données (suite)
 Même fichier avec d’autres algorithmes de spatialisation :
23
Fruchterman-Reingold Force Atlas 2
Conclusion
 Avec la notion du big data, les problèmes volume des
données, variance, hétérogénéité, le temps d’analyse
des données et plein d’autres problèmes ne sont plus
de la même complexité qu’avant. C’est la nouvelle
génération des données.
24
Références
 www.wiki.gephi.org
 www.awt.be
 http://physicsbjj.perso.sfr.fr/
 www.wikipedia.org
 le big data, Christophe de Maistre
25
Chapitre suivant :
Algorithmes de spatialisation

Más contenido relacionado

La actualidad más candente

Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleLilia Sfaxi
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applicationsAffinity Engine
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2Amal Abid
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQLLilia Sfaxi
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesJean-Michel Franco
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesHassan Lâasri
 
Outils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseOutils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseBEL MRHAR Mohamed Amine
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big dataAbdelghani Azri
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesJean-Marc Dupont
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesLilia Sfaxi
 
Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)Ines Ben Kahla
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceLilia Sfaxi
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & SparkAlexia Audevart
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceLilia Sfaxi
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehousekhlifi z
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction généraleMohamed Heny SELMI
 

La actualidad más candente (20)

Chp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation MultidimensionnelleChp3 - Modélisation Multidimensionnelle
Chp3 - Modélisation Multidimensionnelle
 
La Big Data et ses applications
La Big Data et ses applicationsLa Big Data et ses applications
La Big Data et ses applications
 
Cours Big Data Chap2
Cours Big Data Chap2Cours Big Data Chap2
Cours Big Data Chap2
 
BigData_Chp4: NOSQL
BigData_Chp4: NOSQLBigData_Chp4: NOSQL
BigData_Chp4: NOSQL
 
Big Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendancesBig Data : concepts, cas d'usage et tendances
Big Data : concepts, cas d'usage et tendances
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Big Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologiesBig Data... Big Analytics à travers les âges, les industries et les technologies
Big Data... Big Analytics à travers les âges, les industries et les technologies
 
Outils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouseOutils décisionnels : Data-Mining and Data-warehouse
Outils décisionnels : Data-Mining and Data-warehouse
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
Projet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de donnéesProjet BI - 2 - Conception base de données
Projet BI - 2 - Conception base de données
 
Chp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de DonnéesChp2 - Les Entrepôts de Données
Chp2 - Les Entrepôts de Données
 
Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)Rapport de stage: mastère ISIC (Business Intelligence)
Rapport de stage: mastère ISIC (Business Intelligence)
 
Chapitre 2 hadoop
Chapitre 2 hadoopChapitre 2 hadoop
Chapitre 2 hadoop
 
BigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-ReduceBigData_TP1: Initiation à Hadoop et Map-Reduce
BigData_TP1: Initiation à Hadoop et Map-Reduce
 
Big Data, Hadoop & Spark
Big Data, Hadoop & SparkBig Data, Hadoop & Spark
Big Data, Hadoop & Spark
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
Cours data warehouse
Cours data warehouseCours data warehouse
Cours data warehouse
 
Data mining - Introduction générale
Data mining - Introduction généraleData mining - Introduction générale
Data mining - Introduction générale
 
Présentation bi 1.0
Présentation bi 1.0Présentation bi 1.0
Présentation bi 1.0
 
Les BD NoSQL
Les BD NoSQLLes BD NoSQL
Les BD NoSQL
 

Destacado

Application Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdkApplication Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdkNazih Heni
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataNicolas Peene
 
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatBig data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatfifi75
 
Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...Louise Antonio
 
Big Data
Big DataBig Data
Big DataNGDATA
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing
 

Destacado (11)

Application Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdkApplication Mobile "Livre des histoires " avec Corona sdk
Application Mobile "Livre des histoires " avec Corona sdk
 
Point de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big DataPoint de Vue Sopra Consulting sur le Big Data
Point de Vue Sopra Consulting sur le Big Data
 
Confessions of a horrified audience
Confessions of a horrified audienceConfessions of a horrified audience
Confessions of a horrified audience
 
AIR POWERED ENGINE PPT
AIR POWERED ENGINE PPTAIR POWERED ENGINE PPT
AIR POWERED ENGINE PPT
 
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achatBig data et marketing :Vers une analyse prédictif de d'acte d'achat
Big data et marketing :Vers une analyse prédictif de d'acte d'achat
 
Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...Final Project presentation on Image processing based intelligent traffic cont...
Final Project presentation on Image processing based intelligent traffic cont...
 
Big Data
Big DataBig Data
Big Data
 
Soft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMPSoft Computing & IBM : Digital, Big Data & DMP
Soft Computing & IBM : Digital, Big Data & DMP
 
Big data ppt
Big data pptBig data ppt
Big data ppt
 
Big data ppt
Big  data pptBig  data ppt
Big data ppt
 
What is Big Data?
What is Big Data?What is Big Data?
What is Big Data?
 

Similar a Introduction au BIG DATA

Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621Haifa Akermi
 
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Altares D&B
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceExcelerate Systems
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel businessMouhsine LAKHDISSI
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015IBM France Lab
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldoradoKarim Baïna
 
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdfcdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdfZkSadrati
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientDenodo
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxInfopole1
 
dt_medecine_personalis.pptx
dt_medecine_personalis.pptxdt_medecine_personalis.pptx
dt_medecine_personalis.pptxnour91922
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurMicrosoft Ideas
 
La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)Nicolae Sfetcu
 
Etude AKOYA Big Data
Etude AKOYA Big DataEtude AKOYA Big Data
Etude AKOYA Big DataJocelyn Muret
 

Similar a Introduction au BIG DATA (20)

Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Introduction
IntroductionIntroduction
Introduction
 
Analyse spatiale en Big data
Analyse spatiale en Big dataAnalyse spatiale en Big data
Analyse spatiale en Big data
 
Big data-2-170220212621
Big data-2-170220212621Big data-2-170220212621
Big data-2-170220212621
 
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
Livre Blanc ALTARES: La Data, nouveau disrupteur du business model des entrep...
 
BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node BigData BigBuzz @ Le Node
BigData BigBuzz @ Le Node
 
BigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems FranceBigData & Cloud @ Excelerate Systems France
BigData & Cloud @ Excelerate Systems France
 
Big Data Des méandres des outils au potentiel business
Big Data   Des méandres des outils au potentiel businessBig Data   Des méandres des outils au potentiel business
Big Data Des méandres des outils au potentiel business
 
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015Bluemix Paris Meetup :  Big data et Analytics - 15 avril 2015
Bluemix Paris Meetup : Big data et Analytics - 15 avril 2015
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Baina bigdata le futur eldorado
Baina bigdata le futur eldoradoBaina bigdata le futur eldorado
Baina bigdata le futur eldorado
 
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdfcdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
cdg69-i-int-2017-sujet-projet_etude-isi-sic.pdf
 
Introduction au Big data
Introduction au Big data Introduction au Big data
Introduction au Big data
 
La Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance clientLa Logical Data Fabric au secours de la connaissance client
La Logical Data Fabric au secours de la connaissance client
 
EXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptxEXTRA-Présentation generale 180923.pptx
EXTRA-Présentation generale 180923.pptx
 
Big data
Big dataBig data
Big data
 
dt_medecine_personalis.pptx
dt_medecine_personalis.pptxdt_medecine_personalis.pptx
dt_medecine_personalis.pptx
 
La data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeurLa data n’a pas besoin d’être « big » pour générer de la valeur
La data n’a pas besoin d’être « big » pour générer de la valeur
 
La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)La technologie des mégadonnées (big data)
La technologie des mégadonnées (big data)
 
Etude AKOYA Big Data
Etude AKOYA Big DataEtude AKOYA Big Data
Etude AKOYA Big Data
 

Más de Zakariyaa AIT ELMOUDEN (11)

Les réseaux informatiques 3
Les réseaux informatiques 3Les réseaux informatiques 3
Les réseaux informatiques 3
 
Les réseaux informatiques 2
Les réseaux informatiques 2Les réseaux informatiques 2
Les réseaux informatiques 2
 
Exercices : Algorithmes et Langage C
Exercices : Algorithmes et Langage CExercices : Algorithmes et Langage C
Exercices : Algorithmes et Langage C
 
Algorithmique
AlgorithmiqueAlgorithmique
Algorithmique
 
Introduction aux réseaux informatiques
Introduction aux réseaux informatiquesIntroduction aux réseaux informatiques
Introduction aux réseaux informatiques
 
Langage HTML
Langage HTMLLangage HTML
Langage HTML
 
Introduction au Web
Introduction au WebIntroduction au Web
Introduction au Web
 
QCM Sécurité Informatique
QCM Sécurité InformatiqueQCM Sécurité Informatique
QCM Sécurité Informatique
 
Excel : Les fonctions mathématiques
Excel : Les fonctions mathématiquesExcel : Les fonctions mathématiques
Excel : Les fonctions mathématiques
 
Atelier EXCEL : Les fonctions financières
Atelier EXCEL :  Les fonctions financièresAtelier EXCEL :  Les fonctions financières
Atelier EXCEL : Les fonctions financières
 
Installer et configurer NAGIOS sous linux
Installer et configurer NAGIOS sous linuxInstaller et configurer NAGIOS sous linux
Installer et configurer NAGIOS sous linux
 

Último

BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcinsBOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcinsidelewebmestre
 
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...idelewebmestre
 
Cadre réglementaire et développement de l'agrivoltaïsme en France
Cadre réglementaire et développement de l'agrivoltaïsme en FranceCadre réglementaire et développement de l'agrivoltaïsme en France
Cadre réglementaire et développement de l'agrivoltaïsme en Franceidelewebmestre
 
BOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcinBOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcinidelewebmestre
 
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleuridelewebmestre
 
La logistique a L'ère de l'industrie 4.0
La logistique a L'ère de l'industrie 4.0La logistique a L'ère de l'industrie 4.0
La logistique a L'ère de l'industrie 4.0ourssoula
 
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...idelewebmestre
 
Support de cours La technologie WDM.pptx
Support de cours La technologie WDM.pptxSupport de cours La technologie WDM.pptx
Support de cours La technologie WDM.pptxdocteurgyneco1
 
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdfActions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdfalainfahed961
 
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueBOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueidelewebmestre
 
présentation sur la logistique (4).
présentation     sur la  logistique (4).présentation     sur la  logistique (4).
présentation sur la logistique (4).FatimaEzzahra753100
 
BOW 2024 - 3-6 - Adaptation climat chaud Porcs
BOW 2024 - 3-6 - Adaptation climat chaud PorcsBOW 2024 - 3-6 - Adaptation climat chaud Porcs
BOW 2024 - 3-6 - Adaptation climat chaud Porcsidelewebmestre
 
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSKennel
 
Compersseur d'air a vis atlas copco avec huile
Compersseur d'air a vis atlas copco avec huileCompersseur d'air a vis atlas copco avec huile
Compersseur d'air a vis atlas copco avec huileMBouderbala
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvreidelewebmestre
 
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresidelewebmestre
 
BOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pasBOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pasidelewebmestre
 
BOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresBOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresidelewebmestre
 
BOW 2024-3-10 - Batcool Petits ruminants
BOW 2024-3-10 - Batcool Petits ruminantsBOW 2024-3-10 - Batcool Petits ruminants
BOW 2024-3-10 - Batcool Petits ruminantsidelewebmestre
 

Último (20)

Note agro-climatique n°2 - 17 Avril 2024
Note agro-climatique n°2 - 17 Avril 2024Note agro-climatique n°2 - 17 Avril 2024
Note agro-climatique n°2 - 17 Avril 2024
 
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcinsBOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
BOW 24 - De la réflexion de groupe à l'immersion dans des bâtiments porcins
 
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
Accompagnement de l'agrivoltaisme - Focus sur l'étude système en Merthe et Mo...
 
Cadre réglementaire et développement de l'agrivoltaïsme en France
Cadre réglementaire et développement de l'agrivoltaïsme en FranceCadre réglementaire et développement de l'agrivoltaïsme en France
Cadre réglementaire et développement de l'agrivoltaïsme en France
 
BOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcinBOW 2024 - Le bâtiment multicritère porcin
BOW 2024 - Le bâtiment multicritère porcin
 
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleurBOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
BOW 2024 - 3-5 - Des solutions numériques pour se préparer aux pics de chaleur
 
La logistique a L'ère de l'industrie 4.0
La logistique a L'ère de l'industrie 4.0La logistique a L'ère de l'industrie 4.0
La logistique a L'ère de l'industrie 4.0
 
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
BOW 2024 - Nouveaux modes de logement pour des veaux de boucherie avec accès ...
 
Support de cours La technologie WDM.pptx
Support de cours La technologie WDM.pptxSupport de cours La technologie WDM.pptx
Support de cours La technologie WDM.pptx
 
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdfActions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
Actions du vent sur les bâtiments selon lEurocode 1 – Partie 1-4.pdf
 
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatiqueBOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
BOW 2024 - 3 1 - Les infrastructures équestres et le changement climatique
 
présentation sur la logistique (4).
présentation     sur la  logistique (4).présentation     sur la  logistique (4).
présentation sur la logistique (4).
 
BOW 2024 - 3-6 - Adaptation climat chaud Porcs
BOW 2024 - 3-6 - Adaptation climat chaud PorcsBOW 2024 - 3-6 - Adaptation climat chaud Porcs
BOW 2024 - 3-6 - Adaptation climat chaud Porcs
 
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdfSciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
SciencesPo_Aix_InnovationPédagogique_Atelier_APC.pdf
 
Compersseur d'air a vis atlas copco avec huile
Compersseur d'air a vis atlas copco avec huileCompersseur d'air a vis atlas copco avec huile
Compersseur d'air a vis atlas copco avec huile
 
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la NièvreAccompagnement de l'agrivoltaïsme dans le département de la Nièvre
Accompagnement de l'agrivoltaïsme dans le département de la Nièvre
 
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitièresBOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
BOW 2024 -3-7- Impact bâtiment stress thermique Vaches laitières
 
BOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pasBOW 2024 - Dedans/Dehors quand voir ne suffit pas
BOW 2024 - Dedans/Dehors quand voir ne suffit pas
 
BOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitièresBOW 2024 - L'enrichissement du milieu des chèvres laitières
BOW 2024 - L'enrichissement du milieu des chèvres laitières
 
BOW 2024-3-10 - Batcool Petits ruminants
BOW 2024-3-10 - Batcool Petits ruminantsBOW 2024-3-10 - Batcool Petits ruminants
BOW 2024-3-10 - Batcool Petits ruminants
 

Introduction au BIG DATA

  • 1. INTRODUCTION DU SUJET AIT EL MOUDEN Zakariyaa
  • 2. Définition  Les big data, littéralement les « grosses données », ou mégadonnées, désignent des ensembles de données qui deviennent tellement volumineux qu'ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données ou de gestion de l'information. -wikipédia- 2
  • 3. D’où vient les données ?  Les applications et les services professionnels: - ERP ’Entreprise Resource planning’ en français « progiciel de gestion intégré » (PGI) : Ce type de logiciel correspond, pour une organisation, au support de base capable d'assurer une « gestion intégrée», définie comme étant l'interconnexion et l'intégration de l'ensemble des fonctions de l'entreprise dans un système informatique centralisé (et généralement configuré selon le mode client-serveur). Les sources de production des données : 3
  • 4. - CRM ’Customer Relationship Management’ en français « La gestion de la relation client » (GRC) : est l'ensemble des outils et techniques destinés à capter, traiter, analyser les informations relatives aux clients et aux prospects, dans le but de les fidéliser en leur offrant le meilleur service - SCM ‘supply chain management’ en français «gestion de la chaîne logistique» (GCL) vise à garantir l'organisation et la qualité du service logistique en conformité avec les dispositions figurant au cahier des charges logistique. - les outils de production de contenu et de bureautique (série office) ou les intranets, etc. Les sources de production des données : (suite) 4
  • 5.  Le Web En utilisant le Web, Les entreprises et les organisations créent un volume considérable de données (sites d’actualités, e- commerce, publicités … ) Avec l’utilisation des moteurs de recherche et les annuaires dans le web, le nombre des données crées est de plus en plus innombrables. "Nous créons actuellement en deux jours autant d'information que nous en avions créée depuis la naissance de la civilisation jusqu'en 2003". rappelait récemment Eric Schmidt, Chairman de Google. Les sources de production des données : (suite) 5
  • 6.  Les Media sociaux Avec le développement des outils d’expression (le Web 2.0) ces dix dernières années, le volume des données produites à eu une croissance phénoménale. exemples : Réseaux sociaux : facebook, twitter, youtube, etc Plateformes de partage : SlideShare, Flickr, Instagram, etc Statistique : Chaque minute, plus de 30 heures de vidéo sont uploadées sur YouTube, 2 millions de posts sont publiés sur Facebook et 100.000 tweets diffusés sur Twitter. Les sources de production des données : (suite) 6
  • 7.  Le Mobile Avec l’évolution du mobile, et l’apparition du ‘smartphone’, Le téléphone mobile est devenu une source respectable de production des données. Les statistiques prouvent qu’ il y a actuellement 4 fois plus de téléphone mobiles en usage que des ordinateurs et tablettes. Statistique : A la fin 2013, l'App Store de Apple et Google Play auront dépassé les 50 milliards d'applications téléchargées. Les sources de production des données : (suite) 7
  • 8.  Internet des objets (IdO) en anglais « Internet Of Things » (IoT) un réseau qui permet, via des systèmes d’identification électronique normalisés et sans fil, d’identifier et de communiquer numériquement avec des objets physiques afin de pouvoir mesurer et échanger des données entre les mondes physiques et virtuels. L'internet des objets est considéré comme la troisième évolution de l'Internet, baptisée Web 3.0 Les sources de production des données : (suite) 8
  • 9. Les catégories des données  Données Structurées les informations structurées sont disposées de façon à être traitées automatiquement et efficacement par un logiciel, mais non nécessairement par un humain. La ligne de code Java : int salaire = 6000; String nom=« Ali"; est un exemple simple d’informations structurées ,nous connaissons les valeurs, dont le nom est associé à la fonction. Nous pouvons ici supposer que le nom de l’individu est Jean et que son salaire est de 6 000 Dh. Par opposition, la chaîne de caractères « Ali gagne un salaire de 60 000 dirhams » n’est pas structurée, car nous ne pouvons nous attendre à ce qu’un logiciel puisse lire et comprendre une phrase écrite en français. 9
  • 10. Les catégories des données (suite)  Le plus souvent, nous disposons les informations structurées dans des tableaux, comme dans une base de données relationnelle Nom Salaire Ali 6000 Mohammed 7000 10
  • 11. Les catégories des données (suite)  Les données non structurées Il est impossible de tout stocker sous la forme d’informations structurées (p. ex. lettres, courriels, livres, rapports, collections d’images ou de vidéos, brevets, images satellites, offres de service et CV, appels d’offre). Il s’agit pourtant d’informations que les organisations doivent traiter.  Les big data sont généralement des données semi structurées. 11
  • 12. Les dimensions du BIG DATA Les dimensions du big data Volume Vitesse Variété Véracité Visibilité Valeur 12
  • 13.  Le Volume : Le premier concept qui intervient dans la notion du big data, données en petabyte( 1015 bytes )  La Vitesse : Analyse et exploitation des données en temps réel.  La Variété : Les données sont non structurées, et de plus sont de formats différents (images, texte, sons, vidéos , etc.)  La Valeur : Les données concernées sont de valeur importante dans l’entreprise. Les 4v principaux 13
  • 14. Pourquoi la notion du big data est récente ?  L’expression « Big data » fait finalement son apparition en octobre 1997 dans la bibliothèque numérique de l’ACM*, au sein d’articles scientifiques qui pointent du doigt les défis technologiques à visualiser les « grands ensembles de données ». Le Big data est né, et avec lui ses nombreux défis.. *Association For Computing Machinery, association américaine à but non lucratif fondée en 1947 et vouée à l’informatique. Sa bibliothèque numérique est particulièrement riche quand il s’agit de retracer l’histoire de la discipline. 14
  • 15. Facteurs de naissance du Big data  Le cout du stockage : Ce concept n’est plus un problème majeur pour les entreprises avec l’apparition du Cloud Computing.  Réseaux à très haut débit (THD) : Le stockage des données dans des serveurs distants n’est pas une vrai solution sans un réseau hait débit pour atteindre ces données avec une transparence à la localisation.  Evolution des technologie de gestion et d’analyse des données : Analyse et gestion en temps réel 15
  • 16. Usages des Big Data  Optimisation Optimisation du temps de calcul, recherche, traitement des données, etc. exemple: Une société de de fabrication d’éoliennes nommée Vestas , utilise les ‘ big data analytics ’ d’IBM pour décider la localisation d’éoliennes en optimisant le temps de traitement des données variées et non structurées (données météorologiques et géo spatiales, des images satellites, etc. ) >> résultat fournit en quelques heures, au lieu des études qui prennent des semaines sur terrain. 16
  • 17.  Tracer et cibler Les big data permettent d’analyser la situation et le contexte de millier de personnes en temps réel. Application : (big data dans l’aéroport) les passagers doivent obligatoirement passer un certain nombre de tests de sécurité (ce qui génère du stress, des temps d’attente). Une application de géolocalisation dans l’aéroport pourrait offrir aux passagers, en retour de leurs données émises, un guide interactif du lieu, des informations sur les temps d’attente aux différents postes de sécurité, sur les horaires des vols et portes d’embarquement, alors ils peuvent exploiter leurs temps d’attente dans des boutiques ou des restaurants, etc. 17 Usages des Big Data (suite)
  • 18. Usages des Big Data (suite)  Prévoir et prédire L’analyse prédictive permet de faire des projections ultra réalistes pour identifier des nouvelles sources d’opportunités (ou des menaces) et ainsi anticiper les réponses adaptées à la situation réelle. Exemple : ‘Flu Trends’ est un modèle de Google qui permet d’estimer la propagation des cas réels de grippe en fonction des recherches sur Internet, prenant en compte le fait que tous les internautes qui tapent « grippe » sur leur clavier ne sont pas nécessairement malades.  Automobile et Autres usages … 18
  • 19. Visualisation des données  Pourquoi on visualise les données ? ‘’ Une image (data visualisation) vaut mieux qu'un long (big) discours (data) ‘’ Une visualisation intelligente et utilisable des analytics sont un facteur clé dans le déploiement du Big Data dans les entreprises. Le développement des infographies va d'ailleurs de pair avec le développement des techniques d'exploitation des données. 19
  • 20. Visualisation des données (suite) La visualisation des big data permet :  La prise de décision Une Data Visualisation de qualité donnera aux managers le moyen de manipuler de larges volumes de données pour faire émerger des tendances, ou encore répondre à des questions spécifiques. Grâce à des outils de comparaison et de croisement dynamiques, les managers peuvent faire apparaître des informations perdues sous le flot de données, qui ne peuvent se révéler qu’après avoir été visualisées. 20
  • 21. Visualisation des données (suite)  se concentrer sur l’essentiel, plus rapidement La principale raison pour laquelle la Data Visualisation est demandée par les entreprises est la confusion qui accompagne la surcharge de données : celles-ci sont éparpillées dans des feuilles de calculs, des bases de données, des espaces de stockages… Leur interprétation devient difficile. A l’inverse, le but de la Data Visualisation va à l’essentiel en regroupant toutes ces données sur un seul écran, et en les traitant intelligemment grâce à des filtres, des groupes et des classements pertinents. 21
  • 22. Visualisation des données (suite) 22 Exemple :  Fichier visualisé : Les misérables de Victor Hugo  Nombre de nœuds : 77  Nombre des liens : 254  Algorithme de spatialisation : Force Atlas  Outil de visualisation : Gephi 0.8.1
  • 23. Visualisation des données (suite)  Même fichier avec d’autres algorithmes de spatialisation : 23 Fruchterman-Reingold Force Atlas 2
  • 24. Conclusion  Avec la notion du big data, les problèmes volume des données, variance, hétérogénéité, le temps d’analyse des données et plein d’autres problèmes ne sont plus de la même complexité qu’avant. C’est la nouvelle génération des données. 24
  • 25. Références  www.wiki.gephi.org  www.awt.be  http://physicsbjj.perso.sfr.fr/  www.wikipedia.org  le big data, Christophe de Maistre 25