L'analyse des données massives, autrement appelée Big Data, commence à toucher les collectivités et les acteurs publics. Quelles sont les formes et les opportunités offertes par ce nouveau phénomène ? Deux témoignages permettront de comprendre ce que peut apporter concrètement le Big Data. On en soulignera également les limites : des voix s'élèvent pour faire valoir la protection des données personnelles, une vraie responsabilité pour les acteurs publics.
Marc Cervennansky, Chef de projet numérique à la CU Bordeaux
Benjamin Teitgen, Responsable de la communication digitale de la ville de Besançon
Joël Rubino, Président ApiCube
VP1 - Toulouse terre de rugby : un puissant marqueur du territoire
CapCom13: CN4: Comment aborder l'ère du Big Data ?
1. 25e Forum de la communication publique et territoriale !
La Rochelle 10, 11 & 12 décembre!
Carrefour
numérique n°4!
Comment aborder l'ère du Big Data ?!
SESSION
ANIMÉE
PAR
– Benjamin
Teitgen
– Marc
Cervennansky
– Joël
Rubino
3. Big Data
«
La
Donnée
est
le
nouveau
Pétrole
»
Clive
Humby,
2006
4. Big Data: Les 3V
Volume
Le
Volume
est
l’un
des
éléments
clés
dans
la
définiPon
du
Big
Data,
et
il
est
sans
doute
le
moins
important
des
trois
éléments…
Vitesse
Variété
La
Vitesse
évoque
la
rapidité
de
changement
des
données
et
la
rapidité
avec
laquelle
elle
doit
être
uPlisée
pour
créer
de
la
valeur.
La
Variété
fait
référence
aux
différents
types
de
données
et
de
fichiers
uPlisés
pour
une
analyse
exhausPve.
Exemples:
Vidéo,
texte,
images,
données
géo-‐localisées,…
5. Big Data: pour quoi faire ?
Volume
Vitesse
Variété
12
5
100
Terabytes
de Tweets créés chaque jour
Millions
de transactions par seconde
Millions
De cameras vidéo dans le monde
Analyse du sentiment sur un produit
Identifier la fraude potentielle
Surveillance d’évènements
350
500
80%
Milliards
de lectures compteurs par an
Prévision de la consommation électrique
Millions
d’appels téléphoniques enregistrés par jour
Prévention des désabonnements
Croissance
Images, Vidéo, Documents
Amélioration de la satisfaction client
6. Un univers digital en expansion
INSIGHTS
Depuis Adam et Eve
jusqu’en 2011
90% des données publiques
créées depuis le début de
l’humanité et accessibles
légalement ont été créées ces
2 dernières années
(Source IBM)
ACTIONS
90%
2012 - 2013
Explosion exponentielle de la
quantité de données. Nous ne
sommes qu’au début d’un
phénomène d’ampleur.
Focus sur la valeur pas sur la
donnée
7. INSIGHTS
Un univers digital en expansion
Machines
75% des données actuellement
disponibles sont générées par
des humains
(Source Cisco)
Humains
ACTIONS
75%
La multiplicité des objets
connectés à internet va
permettre de nouveaux usages
Quels usages pour quel client /
service dans un monde hyper
connecté ?
8. Empreintes digitale Humaine
1
milliard
d’uPlisateurs,
3,2
milliards
de
«
Like
»
chaque
jour
en
2012
500
millions
d’uPlisateurs
400
Millions
de
tweets
par
jour
en
2012
4
milliards
d’heures
de
vidéos
vues
et
commentées
ou
«
likées
»
chaque
mois
9. Toujours plus de données
BLACKSOCKS:
RFID
Chaussedes
CommunicaPon
entre
chaque
chaussede
et
l’applicaPon
‘the
Sock
Sorter
sur
iPhone
.
Permet
un
appairage
facile
ainsi
que
la
commande
de
nouvelles
paires
chausedes.
10. Toujours plus de données
VITALITY:
Pilulier
connecté
A
l’intérieur
du
couvercle,
une
puce
électronique
surveille
les
ouvertures
de
la
boite
à
pilules
et
envoi
un
signal
qui
sera
relayé
sur
votre
applicaPon
iphone
ou
celle
de
votre
infirmière
11. Toujours plus de données
SCENETAP:
Grace
à
une
applicaPon
disponible
sur
smartphone,
Scenetap
vous
permet
de
savoir,
à
distance,
combien
de
personnes
sont
présentes,
le
raPo
hommes
/
femmes
et
l’âge
moyen.
12. Toujours plus de données
GOOGLECAR
Voiture
sans
conducteur
«
Nous
analysons
et
prédisons
le
monde
20
fois
par
seconde
»
Levandowski,
Google
13. Un univers digital en expansion
INSIGHTS
Données
analysées
Actuellement, moins de 1% des
données actuellement
disponibles dans le monde sont
analysées
(Source EMC)
Données non analysées
ACTIONS
+99%
Acquérir et stocker des
données c’est bien utiliser ces
données pour mieux connaître
vos clients, prospects
concurrents c’est mieux.
Démarrez avec des questions
pas avec des données
14. Subis
Espace maitrisé:
Communication institutionnelle
Marque -> clients
Site Corporate
Publicité
Espace semi-maitrisé:
INSIGHTS
Semi-Maitrisé
Maitrisé
Espaces de communication
Modération du dialogue entre la
marque et ses clients
Page Facebook
Blog Corporate
S.A.V.
Compte Twitter
Chaine Youtube
…
Espace subi:
Expression totalement libre et
incontrôlée
Sites Concurrents
Presse en ligne
Forum de discussions
Instagram
Tripadvisor
Twitter
Facebook
Google
…
15. Sémantique et sentiments
Iden4fica4on
de
la
marque
«
La
grande
marche
»
Homme
marié
qui
parle
Iden4fica4on
du
temps
Iden4fica4on
du
lieu
…. « Hier soir, de passage par La Rochelle, j’ai diné à « La grande marche » avec
mon épouse. Ce restaurant vaut le détour, mais la carte des vins n’est pas
terrible »….
Opinion positive sur la marque
Opinion négative sur le produit
16. Découvrir des usages
Utilisation
produit
1,5
milliards de
sites analysés
Nouvelle
campagne
Kraft a désiré savoir comment son produit était utilisé, en dehors
des traditionnels toasts, sans lancer une étude de marché de
plusieurs mois.
1,5 milliards de blogs, forums et autres sites
de discussions ont été analysés afin de
mieux comprendre les usages réels
Cette étude a permis ainsi de découvrir que
le produit était en réalité utilisé avec du
fromage, de la tomate, mais aussi des sushis …
Une campagne a été lancée à partir de ces « insights » et
donnant à la marque une nouvelle vie.
18. Surveillance
T wider
d es
é vénements
T rocadéro
AnPciper
des
débordements
liés
à
la
remise
du
trophée
des
champions
au
PSG.
•
48h
avant
la
remise
du
trophée
–
–
•
ObservaPon
et
confirmaPon
–
–
•
DétecPon
immédiate
des
premiers
messages
laissant
présager
des
débordements
potenPels.
Les
mots
«
zbeul
»
(bordel)
et
«
TweetLoc
»
(RDV)
sont
détectés
et
rajoutés
dans
le
champ
lexical
d’observaPon
Pendant
l’événement
–
–
•
Paramétrage
de
l’applicaPon
Livecatch
autour
d’un
champ
lexical
se
rapportant
à
l’événement.
Mot
clefs:
PSG,
Trophée,
Trocadéro,…
DétecPon
de
messages
et
de
photos
confirmant
les
troubles
et
l’idenPté
des
auteurs
(BouPque
PSG,
BouPque
Abercrombie
&
Fitch,
Echafaudage
Trocadéro,…)
Analyse
et
cartographie
des
différents
écosystèmes
en
présence
(Lynx
vs
Ultra
vs
CRS)
Après
l’événement
–
–
Remise
d’un
rapport
d’analyse
détaillé
des
événements
et
debrieffing
Surveillance
pro
acPve
du
match
PSG-‐Brest
(semaine
suivante,
dernier
match
au
Parc
des
Princes)
18
21. Toulouse
M étropole:
+700
0 00
h abitants,
3 7
c ommunes,
4 60
k m²
22. Toulouse
M étropole:
+700
0 00
h abitants,
3 7
c ommunes,
4 60
k m²
• Stratégie:
– Toulouse
Métropole
a
la
convicPon
que
les
Médias
Sociaux
doivent
être
le
fer
de
lance
de
sa
stratégie
de
communicaPon.
• Problème:
– Le
disposiPf
actuel
est
principalement
réacPf
sur
la
base
des
besoins
entrants
et
d’un
radar
arPsanal
– Difficulté
à
écouter
des
flux
d’informaPon
en
dehors
des
médias
majeurs
– IntervenPons
sur
requête
et
donc
pas
forcément
représentaPves
des
besoins
du
plus
grand
nombre
– PriorisaPon
des
contenus
éditoriaux
à
créer
et
améliorer
– Difficulté
à
détecter
les
sujets
émergents
avant
qu’ils
ne
deviennent
majeurs
– Incapacité
à
prévenir
d’éventuelles
crises
23. Smarter
Analysis:
Ecouter
les
Toulousains
pour
mieux
les
servir
•
Les
équipes
d’Apicube
ont
développé
à
4tre
expérimental
un
modèle
de
données
qui
analyse
les
grandes
thémaPques
importantes
pour
la
ville,
comme
les
transports,
la
sécurité
ou
la
culture.
•
Plus
d’1,6
millions
de
documents
ont
servi
de
base
à
la
1ère
analyse,
le
modèle
étant
maintenant
défini
et
opPmisé
il
pourrait
être
alimenté
en
conPnu
et
temps
réel,
au
fil
de
l’appariPon
de
nouvelles
données
et
servir
à
de
nouvelles
analyses.
•
Un
rapport
comprenant
des
synthèses
qualitaPves
et
quanPtaPves
sur
chaque
grand
thème
a
été
transmis
à
la
DirecPon
de
la
CommunicaPon
afin
d’adapter
leurs
acPons
sur
la
base
de
ces
informaPons,
améliorant
ainsi
l’efficacité
globale
de
leur
travail
et
du
service
aux
citoyens.
23
24. ANALYSE
SMA (Social Media Analytics) traite un
large volume de données issues du
web.
La technologie sémantique traite et
analyse les conversations selon un
modèle prédéterminé.
Ce modèle d’analyse a été
paramétré afin de faire ressortir
toutes les discussions autour de
l’univers de la metropole
Toulousaine en réduisant au
maximum les conversations «
polluantes »
AXES D’ÉTUDE
OUTILS
METHODOLOGIE DE L’ETUDE
L’étude analytique va croiser 3
dimensions:
Types: Grandes Thématiques
Concepts: Segmentation des
thématiques principales (Bus, Metro,
Tramway,…)
Hotwords: Sujets transverses et non
spécifiques à une des 4 marques
(Ville, quartier, …)
32. Toulouse La sensation d’insécurité
au centre des débats – 1/2
•
•
•
L‘affaire
Merah
a
maximisé
la
sensaPon
d’insécurité
Après
dépolluPon
du
modèle
on
retrouve
une
sensaPon
d‘insécurité
comparable
aux
autres
grandes
métropoles
Française
et
en
deçà
de
métropoles
telles
que
Paris/Marseille/Lyon.
En
bâPssant
le
modèle
de
données,
nous
avons
pu
constater
que
la
thémaPque
sécuritaire
est
écrasante
pour
les
Toulousains
qui
ressentent
la
ville
comme
peu
sûre.
(79.559
Documents,74%)
–
–
–
Pour
Toulouse
Métropole,
ce
senPment
est
un
réel
enjeux
car
le
besoin
de
sécurité
est
fondamental
pour
la
populaPon.
L’insécurité
a
une
influence
l’économie,
la
créaPon
d’entreprise,
la
natalité,
le
dynamisme
culturel,
la
santé,
etc...
En
analysant
les
informaPons
disponibles,
on
constate
une
prédominance
d’affaires
naPonales,
de
délinquance
ou
de
terrorisme,
qui
n’ont
pas
de
corrélaPon
directe
avec
Toulouse.
Toulouse
acquiert
une
visibilité
mondiale
sur
le
sujet
et
un
matraquage
médiaPque
quoPdien
s’abat
sur
les
habitants
pendant
plusieurs
mois.
33. Toulouse La sensation d’insécurité
au centre des débats – 1/2
• En
géolocalisant
par
quarPer
les
expressions
des
Toulousains
– Le
senPment
d’insécurité
est
globalement
homogène
– Les
quarPers
pourtant
généralement
considérés
comme
«difficiles»,
ne
sont
pas
différents
• Analyse
par
«
Media
Set
»
spécifique
(c.a.d.
par
typologies
de
sources
d’informaPon)
– La
PQR,
principal
média
local,
traite
énormément
la
thémaPque
sécuritaire,
venant
indirectement
renforcer
la
percepPon
négaPve
de
la
populaPon.