SlideShare una empresa de Scribd logo
1 de 132
La data est partout
Modélisation
d’un réseau
social ❤
UN RÉSEAU SOCIAL ❤
Fanny ❤ Chloé, Robin et Julia
Chloé ❤ Robin, Maéva, Angie, Matéi et Julia
Robin ❤ Fanny, Chloé et Maéti
Maéva ❤ Chloé, Angie et Julia
Angie ❤ Chloé, Maéva et Julia
Matéi ❤ Chloé et Robin
Julia ❤ Fanny, Chloé, Maéva et Angie
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
Fanny ❤ Chloé, Robin et Julia
Chloé ❤ Robin, Maéva, Angie, Matéi et
Julia
Robin ❤ Fanny, Chloé et Maéti
Maéva ❤ Chloé, Angie et Julia
Angie ❤ Chloé, Maéva et Julia
Matéi ❤ Chloé et Robin
Julia ❤ Fanny, Chloé, Maéva et Angie
Arrête
Sommet
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
La distance entre deux sommets
est le nombre d’arrêtes pour
aller de l’un à l’autre.
L'écartement d'un sommet est la
distance maximale existante
entre ce sommet et les autres
sommets du graphe.
Le centre est le sommet dont
l’écartement est minimal
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
<Exercice
d’application>
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
Distance( , ) = ?
Distance( , ) = ?
Ecartement( , ) = ?
Ecartement( , ) = ?
Ecartement( , ) = ?
Centre = ?
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
Distance( , ) = 2
Distance( , ) = 1
Ecartement( , ) = 2
Ecartement( , ) = 1
Ecartement( , ) = 2
Centre = ?
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
Distance( , ) = 2
Distance( , ) = 1
Ecartement( , ) = 2
Ecartement( , ) = 1
Ecartement( , ) = 2
Centre =
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
</Exercice
d’application>
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
Fanny ❤ Chloé, Robin et Julia
Chloé ❤ Robin, Maéva, Angie,
Matéi et Julia
Robin ❤ Fanny, Chloé et Matéi
Maéva ❤ Chloé, Angie et Julia
Angie ❤ Chloé, Maéva et Julia
Matéi ❤ Chloé et Robin
Julia ❤ Fanny, Chloé, Maéva et
Angie
Chaque personne est
représentée par un
sommet et chaque lien
❤ est représenté par
une arête↔
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
Chaque personne est
représentée par un
sommet et chaque lien
❤ est représenté par
une arête↔
Fanny
Chloé
Robin
Maéva
Julia
Matéi
Angie
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
Chaque personne est
représentée par un
sommet et chaque lien
❤ est représenté par
une arête↔
Fanny
Chloé
Robin
Maéva
Julia
Matéi
Angie
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
<Exercice
d’applicatio
n>
Fanny
Chloé
Robin
Maéva
Julia
Matéi
Angie
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
Fanny Chloé Robin Maéva Angie Matéi Julia
Fanny
Chloé
Robin
Maéva
Julia
Matéi
Angie
Compléter le
tableau ci-
dessous avec
l’écartement
L'écartement d'un sommet est la
distance maximale existante entre ce
sommet et les autres sommets du
graphe.
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
Fanny Chloé Robin Maéva Angie Matéi Julia
Fanny
Chloé
Robin
Maéva
Julia
Matéi
Angie
Réponse
écartement
QUEL EST LE CENTRE DU RÉSEAU
SOCIAL❤?
QUELLE EST LA PERSONNE LA
PLUS POPULAIRE ?
Fanny Chloé Robin Maéva Angie Matéi Julia
Fanny
Chloé
Robin
Maéva
Julia
Matéi
Angieécartement
QUELLE EST LA PERSONNE LA
PLUS POPULAIRE DU RÉSEAUX ?
Fanny Chloé Robin Maéva Angie Matéi Julia
Fanny
Chloé
Robin
Maéva
Julia
Matéi
Angie
Chloé ❤ est le centre
du réseau social, si je
veux passer un
message à tout le
groupe, je passe par
Chloé.écartement
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤
PAR LA THÉORIE DES GRAPHES
</Exercice
d’applicatio
n>
Fanny
Chloé ❤
Robin
Maéva
Julia
Matéi
Angie
UN RÉSEAU SOCIAL ❤ EST UNE
MATRICE
Fanny Chloé Robin Maéva Angie Matéi Julia
Fanny 0 1 1 0 0 0 1
Chloé 1 0 1 1 1 1 1
Robin 1 1 0 0 0 1 0
Maéva 0 1 0 0 1 0 1
Angie 0 1 0 1 0 0 1
Matéi 0 1 1 0 0 0 0
Julia 1 1 0 1 1 0 0
Un objet
mathématiqu
e utilisable
par les
algorithmes
*source numworks.com/modelisation-reseau-
MODÉLISATION D’UN RÉSEAU
SOCIAL ❤Fanny Chloé Robin Maéva Angie Matéi Julia
Fanny D D D
Chloé D D D D D D
Robin D D D
Maéva D D D
Angie D D D
Matéi D D
Julia D D D D
Fanny Chloé Robin Maéva Angie Matéi Julia
Fanny U U U
Chloé U U U U U U
Robin U U U
Maéva U U U
Angie U U U
Matéi U U
Julia U U U U
Fanny Chloé Robin Maéva Angie Matéi Julia
Fanny W W W
Chloé W W W W W W
Robin W W W
Maéva W W W
Angie W W W
Matéi W W
Julia W W W W
 U : User Affinity : à quel point ils sont
proches
 W : Weight : point du contenu
Like, comment, share
 D : Decay : Fraicheur du contenu
COMMENT L’ ALGORITHME
DÉCIDE DE CE QUI S’AFFICHE
DANS LE NEWSFEED
Le Data
Marketeur
manipule de la
DATA
CIBLAGE CONSOMMATEUR
LES DONNÉES À DISPOSITION DU DATA
MARKETEUR,
DES FICHIERS AVEC DES MILLIONS DE
LIGNES
id sexe Revenu
s
âge Centres d’intérêts Points de
contacts
préférés
Niveau
d’éducatio
n
Historiqu
e d’achat
11 F 20000€ 19 Gadget Mail Bat +5 Pull
21 M 25000€ 21 Rihana Insta Lunette
32 CAP
75 M 75 Jaguar d’occasion Clé USB
Chaque ligne représente un individu
3 TYPES DE DONNÉES À
DISPOSITION
1st party Data
•Les données qui appartiennent à l’annonceur
•Les données collectées par l’annonceur
2nd party Data
•Les données acquises auprès d’un partenaire
•Le partenaire a lui-même collecté les données
3rd party Data
•Les données acquises auprès d’un data broker
PEUT ON ADRESSER CHAQUE
INDIVIDU, INDIVIDUELLEMENT ?
#SPOIL NON
Chaque point représente un client en
base construit à partir des données
•Sexe
•Age
•Revenu
•Centres d’intérêt
•Déplacements récents
•Points de contact préférés
•Niveau d’éducation
•Historique d’achat
•etc.
UNE SOLUTION
LA SEGMENTATION
La segmentation est le
découpage d’une
population en sous
groupe homogène
Age
Revenu
s
LA SEGMENTATION C’EST QUOI ?
découpage d’une
population en k
(k=3) sous-groupe
homogènes
Un segment est un
sous-groupe
D’un point de vue
pratique, il est plus
facile de manipuler k
(k=3) sous-groupe
que de manipuler la
population totale du
dataset
Age
Revenu
s
Modélisation
des K-
moyennes
UTILISATION DU K-MOYENNES
POUR CONSTITUER K GROUPES
HOMOGÈNES
Méthode
1. Choisir en combien de groupes
homogènes je veux partitionner
mon dataset (k)
2. On choisit k points au hasard
comme centroïdes
3. On laisse l’algorithme faire des
itérations jusqu’à ce que les
centroïdes ne bougent plus
4. Chaque centroïdes est la
moyenne d’un groupe
homogène
5. Résultat : on a k valeurs
moyenne de chaque groupe.
fonctiondesmoindrescarrés
UTILISATION DU K-MOYENNES
POUR CONSTITUER K GROUPES
HOMOGÈNES
Méthode
1. Choisir en combien de groupes
homogènes je veux partitionner
mon dataset (k)
2. On choisit k points au hasard
comme centroïdes
3. On laisse l’algorithme faire des
itérations jusqu’à ce que les
centroïdes ne bougent plus
4. Chaque centroïdes est la
moyenne d’un groupe
homogène
5. Résultat : on a k valeurs
moyenne de chaque groupe.
UTILISATION DU K-MOYENNES
POUR CONSTITUER K GROUPES
HOMOGÈNES
Méthode
1. Choisir en combien de groupes
homogènes je veux partitionner
mon dataset (k)
2. On choisit k points au hasard
comme centroïdes
3. On laisse l’algorithme faire des
itérations jusqu’à ce que les
centroïdes ne bougent plus
4. Chaque centroïdes est la
moyenne d’un groupe
homogène
5. Résultat : on a k valeurs
moyenne de chaque groupe.
UTILISATION DU K-MOYENNES
POUR CONSTITUER K GROUPES
HOMOGÈNES
Méthode
1. Choisir en combien de groupes
homogènes je veux partitionner
mon dataset (k)
2. On choisit k points au hasard
comme centroïdes
3. On laisse l’algorithme faire des
itérations jusqu’à ce que les
centroïdes ne bougent plus
4. Chaque centroïdes est la
moyenne d’un groupe
homogène
5. Résultat : on a k valeurs
moyenne de chaque groupe.
UTILISATION DU K-MOYENNES
POUR CONSTITUER K GROUPES
HOMOGÈNES
<Exercice
d’applicatio
n>
UTILISATION DU K-MOYENNES
POUR CONSTITUER K GROUPES
HOMOGÈNES
K = ?
Combien d’itération ?
Combien de groupes
homogènes ?
Quels sont les centroïdes ?
Où est la souris ?
UTILISATION DU K-MOYENNES
POUR CONSTITUER K GROUPES
HOMOGÈNES
K = 3
itération = 14
groupes homogènes = 3
les Centroïdes
la souris …
UTILISATION DU K-MOYENNES
POUR CONSTITUER K GROUPES
HOMOGÈNES
</Exercice
d’applicatio
n>
UTILISATION DU K-MOYENNES
POUR CONSTITUER K PROFILS
CLIENTS
K profils de clients
qui ont acheté nos
produits
K profils de
prospects qui sont
susceptibles
d’acheter nos
clients
Look-alike
Modeling
LOOK-ALIKE MODELING
A partir de la donnée client, identifier les
prospect susceptibles de profiter de nos
produits
Clients
Prospects
LOOK-ALIKE MODELING
Clients
Prospect Look-alike
Construction du segment
• Femme
• 25-35
• Foot
• Minecraft en mode créa
• Dernier achat GPS vélo
A partir de la donnée client, identifier les
prospect susceptibles de profiter de nos
produits
FAIRE DU PROFILAGE CLIENT
Profil 1
Donnée 1st party
 femme de 47 ans
 mobile : +33 6 xx xxx xxx
 Dernier achat : pull
Données 2nd Party
 Centre d’intérêt minecraft,
bronzage, raclette
Données 3r party
 Revenu : 70000€
 Education : Bac +8
 Mariée
 2 enfant
Profil 2
Donnée 1st party
 femme de 28 ans
 mobile : +33 6 xx xxx xxx
 Dernier achat : débardeur
Données 2nd Party
 Centre d’intérêt café, fitness,
vegan
Données 3r party
 Revenu : 40000€
 Education : Bac +5
 Mariée
 1 enfant
Profil 3
Donnée 1st party
 femme de 19 ans
 mobile : +33 6 xx xxx xxx
 Dernier achat : gps
Données 2nd Party
 Centre d’intérêt voyages,
rencontres, vegan
Données 3r party
 Revenu : 30000€
 Education : Bac +1
 célibataire
La publicité
en ligne
LA PUBLICITÉ NOUS INFLUENCE
Avez-vous entendu le
TouDoum ?
LA PUBLICITÉ EN LIGNE
UN ÉCOSYSTÈME STRUCTURÉ PAR
L’OFFRE ET LA DEMANDE
La demande
L’annonceur a un
catalogue de produits
à faire connaitre et à
vendre
L’offre
L’éditeur offre des
espaces publicitaires
pour faire afficher les
annonces de
l’annonceur
L’éditeur fait en sorte que son contenu
éditorial soit riche et varié pour attirer de
l’audience sur son site.
LA PUBLICITÉ EN LIGNE
UN ÉCOSYSTÈME STRUCTURÉ PAR
L’OFFRE ET LA DEMANDE
Demande
Catalogue de service à
vendre
Offre
L’éditeur valorise son
audience
Offre espace de Pub
LA PUBLICITÉ EN LIGNE :
NIVEAU I
LA PUBLICITÉ EN LIGNE : NIVEAU I
STRUCTURE D’UNE PAGE ÉDITEUR
Espace
publicitaire
Espace
publicitair
e
Espace
publicitair
e
LA DEMANDE : L’ANNONCEUR A UN
CATALOGUE DE PRODUIT À
VALORISER
Catalogue
de produits
à valoriser
L’OFFRE : L’ÉDITEUR A DES
ESPACES PUBLICITAIRES À FAIRE
TOURNER
Espace
publicitaire
Espace
publicitair
e
Espace
publicitair
e
L’OFFRE RENCONTRE LA DEMANDE,
L’ANNONCEUR ANNONCE SON
CATALOGUE DE PRODUIT SUR LE SITE
L’ÉDITEUR
LE MODÈLE A SES LIMITES, JE
PEUX ÊTRE UN HOMME ET JE
REÇOIS UNE PUB MAL CIBLÉE
LA PUBLICITÉ EN LIGNE :
NIVEAU II
LES ÉDITEURS METTENT LEURS
ESPACES PUBLICITAIRES EN
RÉSEAU
Le journal du geek et
Femme-Actuelle
Ex : L’éditeur
garantit 1000
impressions de
l’annonce sur le
réseau
Le Journal du geek +
LA PUBLICITÉ EN LIGNE :
NIVEAU III
LES ÉDITEURS PROPOSENT LEUR
ESPACE PUBLICITAIRES (INVENTAIRES)
VIA UN SYSTÈME D’ENCHÈRES
LES ANNONCEURS ENCHÉRISSENT, OU
PAS, SUR L’OPPORTUNITÉ DE FAIRE
AFFICHER LEUR PUBLICITÉ
Place de marché
LE GAGNANT PLACE SON
ANNONCE
Place de marché
Toute l’opération se fait en moins de 200ms, en quasi temps
réel
Le Real Time Bidding
LA PUBLICITÉ EN LIGNE : NIVEAU III
Demande
Catalogue d’annonces à valoriser
Offre
Inventaire à valoriser
Annonceurs Editeur
DSP SSP
Ad Server
Editeur
Ad Exchange
Ad Server
annonceur
Ad Server
Editeur
LA PUBLICITÉ EN LIGNE :
NIVEAU III
La SSP
permet à
l’éditeur de
valoriser son
inventaire
Offre
Inventaire à valoriser
Editeur
SSP
Ad Exchange
Demande
Catalogue d’annonces à valoriser pour faire la
promotion des produits
Ad Server
annonceur
LA DSP PERMET À L’ÉDITEUR DE
VALORISER SON CATALOGUE
Demande
Catalogue d’annonces à valoriser pour faire la promotion des
produits
La DSP permet à
l’annonceur de faire
des enchères sur les
impressions mises à
disposition par
l’éditeur en ciblant les
bons
clients/prospects
grâce au cookies
laissés par les
visiteurs
Annonceurs
Ad Exchange
DSP
SSP
Ad Server
Editeur
Ad Server
annonceur
LA DSP PERMET À L’ANNONCEUR DE CIBLER
DES SEGMENTS COOKIES GRÂCE À UNE DMP
(OU PAR MAIL)
Demande
Catalogue d’annonces à valoriser pour faire la promotion des
produits
Offre
Inventaire à valoriser
Annonceurs Editeur
DSP
Ad Exchange
LA BID REQUEST
La bid request envoie
des informations sur
l’emplacement de
l’espace publicitaire,
l’appareil utilisé,
l’application mobile, le
segment de cookie et
surtout l’identifiant du
cookie
Les bid request sont
SSP
Ad Server
Editeur
SSP
LA PUBLICITÉ EN LIGNE
<Quizz
>
LA PUBLICITÉ EN LIGNE : QUIZ
Qu’est qu’une impression ?
Qu’est qu’un inventaire ?
Qu’est ce qu’une DSP ?
Qu’est qu’une SSP ?
Qu’est qu’une DMP ?
Donnez un exemple
d’annonceur ?
Donnez un exemple
d’éditeur ?
Qu’est ce qu’un segment ?
Qu’est ce que le RTB ?
En combien de secondes se
fait le RTB ?
Qu’est ce qu’une bid
request ?
LA PUBLICITÉ EN LIGNE
</Quizz
>
EN RÉSUMÉ
Les éditeurs mettent leur espaces publicitaires
(inventaires) au plus offrant des annonceurs
Lorsque l’annonceur affiche sa publicité sur le
site de l’éditeur, il doit le faire au bon moment
avec le bon produit pour la bonne personne de
façon à maximiser la probabilité de clic sur la
bannière.
L’annonceur utilise des techniques pour
connaitre le client qui visite le site de l’éditeur
LES TYPES (NON EXHAUSTIF) DE
DONNÉES DU DATA MARKETING
•Une bannière
s’est affichée
Impression
•Le visiteur a cliqué
sur la bannière
Clicks
•Le visiteur a acheté le
produit
Conversion
ATELIER DE CRÉATION DE
COOKIES
<Exercice
d’applicatio
n>
ATELIER DE CRÉATION DE
COOKIES
installation du
plugin
1. sous Firefox
« Cookie
Quick
Manager »
2. « Awesome
Cookie
Manager »
ATELIER DE CRÉATION DE
COOKIES
À votre avis,
combien de
cookies
avez-vous
sur votre
ordinateur ?
1.10 cookies
2.100 cookies
3.1000 cookies
4.> 1000 cookies
ATELIER DE CRÉATION DE
COOKIES
Afficher
tous les
cookies
ATELIER DE CRÉATION DE
COOKIES
Lotame
Doubeclick
Adobe
AppNexus
ABTesty
ATELIER DE CRÉATION DE
COOKIES
Rendez-vous
sur
https://www.w3school
s.com/js/tryit.asp?file
name=tryjs_cookie_us
ername
ATELIER DE CRÉATION DE
COOKIES
Rendez-vous
sur
https://www.w3school
s.com/js/tryit.asp?file
name=tryjs_cookie_us
ername
ATELIER DE CRÉATION DE
COOKIES
Afficher tous
les cookies
du domaine
www.w3schools.
com
ATELIER DE CRÉATION DE
COOKIES
1. Cliquez sur
Run
2. Entrez votre
nom
ATELIER DE CRÉATION DE
COOKIES
1. Cliquer sur
l’extension cookie
quick manager
2. Le cookie
‘username’ a été
crée
3. Le navigateur via le
server du domain
www.w3schools.co
m a déposé un
cookie ‘username’
sur votre navigateur
ATELIER DE CRÉATION DE
COOKIES
Nom du
cookie
Valeur du
cookie
Domaine
du cookie
Date
d’expiration
du cookie
Chemin du
cookie
ATELIER DE CRÉATION DE
COOKIES
1. Cliquez sur
Run
2. Le
navigateur
vous
reconnait
ATELIER DE CRÉATION DE
COOKIES
1. Modifiez le
cookie
2. Observez
et
commente
z le
ATELIER DE CRÉATION DE
COOKIES
À RETENIR
1. Le nom du cookie
2. La valeur du
cookie
3. Le domaine du
cookie
4. Un cookie est
valable que pour
un domaine (ie
w3schools.com
dans notre cas)
ATELIER DE CRÉATION DE
COOKIES
</Exercice
d’applicatio
n>
Le
traitement
LE TRAITEMENT DE LA DONNÉES
1. Sur un dataset type,
chaque ligne
représente un
individu
2. Chaque colonne
contient les actions
effectuées par le
visiteur, son
exposition à une
campagne
publicitaire, etc.Dataset
UN DATASET D’UNE BASE DE
DONNÉES RELATIONNELLES DE 18GO
AVITO ~LEBONCOIN RUSSE
['UserID', 'UserAgentID', 'UserAgentOSID', 'UserDeviceID', 'UserAgentFamilyID'] UserID UserAgentID UserAgentOSID UserDeviceID
UserAgentFamilyID4284788 4339827 63458 19 2014 644284789 4339828 22293 20
2014 254284790 4339829 10275 20 2014 254284791 4339830 12505
20 2014 854284792 4339831 32388 7 2014 154284793 4339832
63756 43 2014 74284794 4339833 57133 20 2014 254284795
4339834 9243 20 2014 254284796 4339835 57133 20 2014
254284797 4339836 63091 20 2014 254284798 4339837 33726 20 2014
624284799 4339838 9230 7 2014 624284800 4339839 57133 20 2014
254284801 4339840 55731 20 2014 644284802 4339841 57133 20 2014
254284803 4339842 10275 20 2014 254284804 4339843 58369 7 2014
254284805 4339844 29432 20 2014 154284806 4339845 15093 35 2905
634284807 4339846 55033 35 576 634284808 4339847 48490 43 2014
644284809 4339848 10275 20 2014 254284810 4339849 21092 43 2014
624284811 4339850 12505 20 2014 854284812 4339851 57133 20 2014
254284813 4339852 12505 20 2014 854284814 4339853 57133 20 2014
254284815 4339854 55731 20 2014 644284816 4339855 8533 9 2014
624284817 4339856 54898 20 2014 854284818 4339857 7075 20 2014
624284819 4339858 1393 30 2019 94284820 4339859 57133 20 2014
254284821 4339860 63091 20 2014 254284822 4339861 57133 20 2014
25['LocationID', 'Level', 'RegionID', 'CityID'] LocationID Level RegionID CityID4045 1000003 3 31 13564046
1000004 3 31 28364047 1000005 3 31 15034048 1000006 3 31 25014049 1000007 3
31 20164050 1000008 3 31 36994051 1000009 3 31 28044052 1000010 3 31 34054053
1000011 3 31 22354054 1000012 3 31 24754055 1000013 3 31 12264056 1000014 3
31 19424057 1000015 3 31 13734058 1000016 3 31 35304059 1000017 3 31 20674060
1000018 3 31 554061 1000019 3 31 25944062 1000020 3 31 35524063 1000021 3
31 6524064 1000022 3 31 14454065 1000023 3 31 30154066 1000024 3 31 31734067
1000025 3 31 35874068 1000026 3 31 28164069 1000027 3 31 26454070 1000028 3
31 21454071 1000029 3 31 15384072 1000030 3 31 33824073 1000031 3 31 25254074
1000032 3 31 32234075 1000033 3 31 5134076 1000034 3 31 11624077 1000035 3
31 30414078 1000036 3 31 27804079 1250001 2 31 1245['CategoryID', 'Level', 'ParentCategoryID',
'SubcategoryID'] CategoryID Level ParentCategoryID SubcategoryID63 250003 2 11 4564 250004
3 11 3365 250005 3 7 2666 250006 3 11
867 500001 3 5 1['SearchID', 'SearchDate', 'IPID', 'UserID', 'IsUserLoggedOn', 'SearchQuery',
'LocationID', 'CategoryID', 'SearchParams'] SearchID SearchDate IPID0 1 2015-05-18 19:54:32.0 17170901
2 2015-05-12 14:21:28.0 17315682 3 2015-05-12 07:09:42.0 7931433 4 2015-05-10 18:11:01.0 8987054 5 2015-
04-25 13:04:09.0 20097075 6 2015-05-07 16:49:15.0 16584566 7 2015-05-14 23:07:27.0 18491177 8 2015-05-09
09:10:06.0 5725858 9 2015-05-02 20:14:15.0 771629 10 2015-05-15 17:38:46.0 137107210 11 2015-05-17
12:01:01.0 6735611 12 2015-05-13 11:54:24.0 130519112 13 2015-04-26 21:34:59.0 147385113 14 2015-04-28
01:30:16.0 47333114 15 2015-05-06 11:23:50.0 111701215 16 2015-05-10 21:08:27.0 202212716 17 2015-05-03
14:12:19.0 69798217 19 2015-05-12 10:14:07.0 208043518 20 2015-05-16 14:38:00.0 48640819 21 2015-05-14
17:27:55.0 1279103
UN DATASET D’UNE BASE DE
DONNÉES RELATIONNELLES DE 18GO
AVITO ~LEBONCOIN RUSSE
SOURCE KAGGLE
HTTPS://WWW.KAGGLE.COM/MKECHIN
OV/ECOMMERCE-BEHAVIOR-DATA-
FROM-MULTI-CATEGORY-STORE
Dataset
LE TRAITEMENT DE LA DATA
Dataset Nettoyage des données
Analyse statistique
DataMining
Machine Learning
Création de modèlesConnaissance
L’analyse
descriptive
•Mes visiteurs ont
cliqué sur la bannière
de mon site
L’analyse
prédictive
•Mes visiteurs
cliqueront sur ma
bannière
L’analyse
prescriptive
•Ce que je dois faire
pour que les
visiteurs cliquent sur
la bannière
L’ANALYSE DE LA DATA
3 NIVEAUX DE VALEUR DE L’ANALYSE
DE LA DONNÉE
L’ANALYSE DESCRIPTIVE
Quelques outils à
connaitre
La moyenne
L’écart type (1σ, 2σ, 3σ)
La médiane
Le décile, le centile
80/20 PRINCIPE DE PARETO ET LE
TABLEAU DES FRÉQUENCES
CUMULÉES80% du
trafic
apporté par
les réseaux
sociaux, le
blog, le
Search
20% par le
reste
1201
898
500
343
122 89 76
80%
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0
200
400
600
800
1000
1200
1400
Les…
Leblog
Search
Publicité…
Compara…
Email…
Mobile
Diagramme de Pareto
ANALYSE LONGITUDINALE
<Exercice
d’applicatio
n>
ANALYSE LONGITUDINALE
Analyse des
évolution dans
le temps pour
trouver des
effets de
saisonnalité
ANALYSE LONGITUDINALE
1. Allez sur Google Trends
France
2. Saisissez raclette
3. Observez la courbe sur un
an
4. Observez la courbe sur 5
ans
ANALYSE LONGITUDINALE
1. Rajoutez Maillot de bain
2. Observez la courbe sur 5
ans
ANALYSE LONGITUDINALE
1. Exportez les données
2. Ouvrez le ficher .csv avec
Excel
3. Sélectionnez la colonne A
4. Calculez le coefficient de
Corrélation
1. =COEFFICIENT.CORRELATION(C4:C
263;B4:B263)
5. (Option) tracez les
courbes
ANALYSE LONGITUDINALE
2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019
raclette: (France)
maillot de bain: (France)
COEFFICIENT.CORRELATION( raclette ; maillot de bain ) =
-0,70
y = -1.2703x + 48.157
R² = 0.4859
-20
0
20
40
60
80
100
120
0 10 20 30 40 50
maillotdebain
raclette
ANALYSE LONGITUDINALE
CONSTATER ET DÉCRIRE
2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019
raclette: (France)
maillot de bain: (France)
L’objectif de l’analyse
descriptive est de constater
et de décrire
Que constatez-vous ?
Que pouvez décrire ?
Quelle est la saisonnalité ?
ANALYSE LONGITUDINALE
CONSTATER ET DÉCRIRE
raclette: (France) maillot de bain: (France)
Mettre crème solaire
en
surpression quelques
jours avant les
vacances scolaires
ANALYSE LONGITUDINALE
CORRÉLATION ET CAUSALITÉ
2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019
raclette: (France)
maillot de bain: (France)
En première analyse, lorsque
les recherches sur les raclettes
baissent, celles sur les maillots
de bain augmentent. Il y a
corrélation proche de 1 (-
0,697), mais négative,
Les recherches sur les raclettes
font baisser les recherches sur
les maillots de bain (10
recherches sur raclette font
baisser les recherches de
12,703 sur les maillots de
ANALYSE LONGITUDINALE
CORRÉLATION ET CAUSALITÉ
2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019
raclette: (France)
maillot de bain: (France)
En première analyse, lorsque
les recherches sur les raclettes
baissent, celles sur les maillots
de bain augmentent. Il y a
corrélation proche de 1 (-
0,697), mais négative,
Les recherches sur les raclettes
font baisser les recherches sur
les maillots de bain (10
recherches sur raclette font
baisser les recherches de
12,703 sur les maillots de
ANALYSE LONGITUDINALE
CORRÉLATION ET CAUSALITÉ
2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019
raclette: (France)
maillot de bain: (France)
En data marketing (et
ailleurs) corrélation ne
vaut pas causalité.
Dans notre cas, il existe
une troisième variable
qui explique les
variations des deux
premières.
ANALYSE LONGITUDINALE
</Exercice
d’applicatio
n>
L’ANALYSE PRÉDICTIVE
Utiliser la data marketing
pour prédire le
comportement futur en
utilisant les données du
passé
Prédire le click sur la
bannière
Prédire l’achat ou
l’abonnement
L’ANALYSE PRÉDICTIVE : PRÉDIRE
LE CLIC SUR UNE BANNIÈRE
Quelle est la probabilité que le
visiteur clique sur la bannière ?
La fonction de modélisation de
la probabilité qu’un visiteur
clique sur une bannière prend
deux valeurs, 0 et 1
 1 le visiteur a cliqué
 0 le visiteurs n’a pas cliqué
On prédit un évènement
binaire,
L’ANALYSE PRÉDICTIVE : PRÉDIRE
LE CLIC SUR UNE BANNIÈRE
QUELLE EST LA PROBABILITÉ QUE
LE VISITEUR CLIQUE SUR LA
BANNIÈRE ?
L’ANALYSE PRÉDICTIVE
On veut prédire P(click | display) = f(taille du display, emplacement,
device, fréquence, historique de navigation, exposition à la
campagne, météo, lieux, xk, … xn)
Taille du display emplacement Device … Click
600x300 en haut Laptop Oui
100x100 à droite iPad Non
…. Id Non
L’ANALYSE PRÉDICTIVE
LA RÉGRESSION LOGISTIQUE
MULTIVARIÉE
On veut prédire P(click | display) = f(taille du display, emplacement, device, fréquence,
historique de navigation, exposition à la campagne, météo, lieux, 𝑋1, … 𝑋 𝑛)
Il y a potentiellement des milliers de paramètres possible.
log
𝑃(𝑐𝑙𝑖𝑐𝑘)
1−𝑃(𝑐𝑙𝑖𝑐𝑘)
= β0 + β1. 𝑋1 + ⋯ + β 𝑘. 𝑋 𝑘 + ⋯ + β 𝑛. 𝑋 𝑛
β 𝑘. 𝑋 𝑘 sont les variables explicatives du modèle
Avec les données historiques, on détermine les coefficients de pondération β 𝑘
Plus la valeur du coefficient est élevé, plus l’impact de la variable est important.
LA PROGRAMMATIQUE
•Le visiteur navigue sur le site
•La SSP qui gère les espaces pub pose un cookie
•Le SSP informe la DSP de l’existence de deux
emplacement pubs avec une bid request
•<bid request>cookies, emplacement espace
pub, device, etc.</bid request>
•La DSP fait l’enchère pour afficher la pub
•La SSP retient l’enchère gagnante
•La pub s’affiche
LA PROGRAMMATIQUE
•Le visiteur navigue sur le site
•La SSP qui gère les espaces pub pose un cookie
•Le SSP informe la DSP de l’existence de deux emplacement
pubs avec une bid request
•<bid request>cookies, emplacement espace pub,
device, etc.</bid request>
•La DSP fait l’enchère pour afficher la pub
•La SSP retient l’enchère gagnante
•La pub s’affiche
{
"id": "1234534625254",
"at": 2,
"tmax": 120,
"imp": [
{
"id": "1",
"banner": {
"w": 320,
"h": 50,
"pos": 1,
"battr": [
13
]
}
}
],
"badv": [
"company1.com",
"company2.com"
],
"app": {
"id": "234563",
"bundle": "com.rovio.angrybirds",
"cat": [
"IAB2-1",
"IAB2-2"
],
"publisher": {
"id": "pub12345"
}
},
"device": {
"ip": "64.124.253.1",
"ua": "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.6; en-US; rv:1.9.2.16)
Gecko/20110319 Firefox/3.6.16",
"os": "OS X"
},
"user": {
"id": "45asdf987656789adfad4678rew656789"
},
"ext": {
"udi": {
"idfa": "44E9AF56-9ED1-47AE-A3F4-719D050641F9"
},
"appnexus": {
"seller_member_id": 2066
}
}
}
C’EST QUOI UNE DMP?
« La DMP est une plateforme qui permet de
créer des audiences ciblées à partir de données
issues de 1st et 3rd party pour mener des
campagnes ciblées à travers des réseaux Ad
Exchange et Ad Network
La DMP permet de mesurer les performances
des meilleurs segments et canaux et d’affiner
l’achat média et la création de bannière »
Activatio
nDMP SegmentationDonnées
C’EST QUOI UNE DMP?
1st Party Data
3rd Party Data
Constitution des Segments dans la DMPDMPDonnées
CONSTITUTION DES PERSONAS
1st Party Data
3rd Party Data
Constitution des
Segments dans la
DMP
Annonce
ur
CONSTITUTION DES PERSONAS
LES SEGMENTS DE LA DSP SE
RETROUVENT DANS LA DSP
DSP
Ad Exchange
LA DMP ORANGE – L’OUTIL DE GESTION DES COOKIES POUR
LES CAMPAGNES DIGITALE
• portails xxxx.fr et xxxx
• campagnes Web
• MD (email, SMS)
• CRM onboarding
• 2nd party
• 3rd party
Catégories pour classer les
cookies (vaste arborescence
appelée taxonomie)
• prospects Internet éligibles Fibre
• intentionnistes déménagement
• familles avec enfants détentrices
d’une offre Large
• etc.
+ 1300
+ 880 audience créées
Source : Bluekai le 22/09/2016
100% des campagnes Search
90% des campagnes d’acquisition
40% des campagnes branding
82M de cookies collectés
1. Collecte les cookies 2. Classe les cookies
3. Génère des audiences 4. Transforme les audience en
campagnes
et les envoie aux ad exchanges
DMP ANNONCEUR
LA TAXONOMIE DE LA DMP
La taxonomie de la
DMP, c'est-à-dire
l’arborescence des
catégories classées par
thèmes (navigation
portails, attributs
clients CRM). L’écran
principal à droite sert
à construire les
audiences
DMP ANNONCEUR
TAXONOMY MANAGER
Le Taxonomy
Manager sert à
définir les règles
de chaque
élément de la
taxonomie
DMP ANNONCEUR
ÉCRAN AUDIENCES
La page qui
répertorie
toutes les
audiences
créées avec
leurs
caractéristique
DMP ANNONCEUR
ÉCRAN CAMPAGNES
La page qui
répertorie les
campagnes. Les
campagnes sont
des audiences qui
sont envoyées aux
outils et
plateformes de
campagnes
Un écosystème
qui repose sur
les cookies
Merci pour
votre
attention
REMERCIEMENTS
Mes remerciements vont dans le
désordre à Blaise Vignon, Le MBA MCI,
François Pierre, Elodie Gacon, Louis
Duroulle et j’en oublie beaucoup.
RÉFÉRENCES BIBLIOGRAPHIQUES
Bonjour PPC Le digital pour tous #BonjourPPC
ebg Digital Marketing 2020
Modélisation d’un réseau social Claire Savinas,
La publicité à l’heure de la data Jean Allary et Vincent Balusseau
Le guide de la transformation digitale Emmanuel Vivier, Vincent Ducrey
Display Lumascape by Luma Partners
giphy.com pour les gifs animés
learnbymarketing.com K-Means Clustering – What it is and How it
Works
w3schools.com HTML The language for building web pages

Más contenido relacionado

Destacado

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Destacado (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Mba mci ilv - cours fondamentaux du data marketing

  • 1. La data est partout
  • 3. UN RÉSEAU SOCIAL ❤ Fanny ❤ Chloé, Robin et Julia Chloé ❤ Robin, Maéva, Angie, Matéi et Julia Robin ❤ Fanny, Chloé et Maéti Maéva ❤ Chloé, Angie et Julia Angie ❤ Chloé, Maéva et Julia Matéi ❤ Chloé et Robin Julia ❤ Fanny, Chloé, Maéva et Angie
  • 4. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES Fanny ❤ Chloé, Robin et Julia Chloé ❤ Robin, Maéva, Angie, Matéi et Julia Robin ❤ Fanny, Chloé et Maéti Maéva ❤ Chloé, Angie et Julia Angie ❤ Chloé, Maéva et Julia Matéi ❤ Chloé et Robin Julia ❤ Fanny, Chloé, Maéva et Angie Arrête Sommet
  • 5. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES La distance entre deux sommets est le nombre d’arrêtes pour aller de l’un à l’autre. L'écartement d'un sommet est la distance maximale existante entre ce sommet et les autres sommets du graphe. Le centre est le sommet dont l’écartement est minimal
  • 6. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES <Exercice d’application>
  • 7. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES Distance( , ) = ? Distance( , ) = ? Ecartement( , ) = ? Ecartement( , ) = ? Ecartement( , ) = ? Centre = ?
  • 8. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES Distance( , ) = 2 Distance( , ) = 1 Ecartement( , ) = 2 Ecartement( , ) = 1 Ecartement( , ) = 2 Centre = ?
  • 9. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES Distance( , ) = 2 Distance( , ) = 1 Ecartement( , ) = 2 Ecartement( , ) = 1 Ecartement( , ) = 2 Centre =
  • 10. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES </Exercice d’application>
  • 11. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES Fanny ❤ Chloé, Robin et Julia Chloé ❤ Robin, Maéva, Angie, Matéi et Julia Robin ❤ Fanny, Chloé et Matéi Maéva ❤ Chloé, Angie et Julia Angie ❤ Chloé, Maéva et Julia Matéi ❤ Chloé et Robin Julia ❤ Fanny, Chloé, Maéva et Angie Chaque personne est représentée par un sommet et chaque lien ❤ est représenté par une arête↔
  • 12. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES Chaque personne est représentée par un sommet et chaque lien ❤ est représenté par une arête↔ Fanny Chloé Robin Maéva Julia Matéi Angie
  • 13. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES Chaque personne est représentée par un sommet et chaque lien ❤ est représenté par une arête↔ Fanny Chloé Robin Maéva Julia Matéi Angie
  • 14. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES <Exercice d’applicatio n> Fanny Chloé Robin Maéva Julia Matéi Angie
  • 15. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES Fanny Chloé Robin Maéva Angie Matéi Julia Fanny Chloé Robin Maéva Julia Matéi Angie Compléter le tableau ci- dessous avec l’écartement L'écartement d'un sommet est la distance maximale existante entre ce sommet et les autres sommets du graphe.
  • 16. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES Fanny Chloé Robin Maéva Angie Matéi Julia Fanny Chloé Robin Maéva Julia Matéi Angie Réponse écartement
  • 17. QUEL EST LE CENTRE DU RÉSEAU SOCIAL❤? QUELLE EST LA PERSONNE LA PLUS POPULAIRE ? Fanny Chloé Robin Maéva Angie Matéi Julia Fanny Chloé Robin Maéva Julia Matéi Angieécartement
  • 18. QUELLE EST LA PERSONNE LA PLUS POPULAIRE DU RÉSEAUX ? Fanny Chloé Robin Maéva Angie Matéi Julia Fanny Chloé Robin Maéva Julia Matéi Angie Chloé ❤ est le centre du réseau social, si je veux passer un message à tout le groupe, je passe par Chloé.écartement
  • 19. MODÉLISATION D’UN RÉSEAU SOCIAL ❤ PAR LA THÉORIE DES GRAPHES </Exercice d’applicatio n> Fanny Chloé ❤ Robin Maéva Julia Matéi Angie
  • 20.
  • 21. UN RÉSEAU SOCIAL ❤ EST UNE MATRICE Fanny Chloé Robin Maéva Angie Matéi Julia Fanny 0 1 1 0 0 0 1 Chloé 1 0 1 1 1 1 1 Robin 1 1 0 0 0 1 0 Maéva 0 1 0 0 1 0 1 Angie 0 1 0 1 0 0 1 Matéi 0 1 1 0 0 0 0 Julia 1 1 0 1 1 0 0 Un objet mathématiqu e utilisable par les algorithmes *source numworks.com/modelisation-reseau-
  • 22. MODÉLISATION D’UN RÉSEAU SOCIAL ❤Fanny Chloé Robin Maéva Angie Matéi Julia Fanny D D D Chloé D D D D D D Robin D D D Maéva D D D Angie D D D Matéi D D Julia D D D D Fanny Chloé Robin Maéva Angie Matéi Julia Fanny U U U Chloé U U U U U U Robin U U U Maéva U U U Angie U U U Matéi U U Julia U U U U Fanny Chloé Robin Maéva Angie Matéi Julia Fanny W W W Chloé W W W W W W Robin W W W Maéva W W W Angie W W W Matéi W W Julia W W W W  U : User Affinity : à quel point ils sont proches  W : Weight : point du contenu Like, comment, share  D : Decay : Fraicheur du contenu
  • 23.
  • 24. COMMENT L’ ALGORITHME DÉCIDE DE CE QUI S’AFFICHE DANS LE NEWSFEED
  • 27. LES DONNÉES À DISPOSITION DU DATA MARKETEUR, DES FICHIERS AVEC DES MILLIONS DE LIGNES id sexe Revenu s âge Centres d’intérêts Points de contacts préférés Niveau d’éducatio n Historiqu e d’achat 11 F 20000€ 19 Gadget Mail Bat +5 Pull 21 M 25000€ 21 Rihana Insta Lunette 32 CAP 75 M 75 Jaguar d’occasion Clé USB Chaque ligne représente un individu
  • 28. 3 TYPES DE DONNÉES À DISPOSITION 1st party Data •Les données qui appartiennent à l’annonceur •Les données collectées par l’annonceur 2nd party Data •Les données acquises auprès d’un partenaire •Le partenaire a lui-même collecté les données 3rd party Data •Les données acquises auprès d’un data broker
  • 29. PEUT ON ADRESSER CHAQUE INDIVIDU, INDIVIDUELLEMENT ? #SPOIL NON Chaque point représente un client en base construit à partir des données •Sexe •Age •Revenu •Centres d’intérêt •Déplacements récents •Points de contact préférés •Niveau d’éducation •Historique d’achat •etc.
  • 30. UNE SOLUTION LA SEGMENTATION La segmentation est le découpage d’une population en sous groupe homogène Age Revenu s
  • 31. LA SEGMENTATION C’EST QUOI ? découpage d’une population en k (k=3) sous-groupe homogènes Un segment est un sous-groupe D’un point de vue pratique, il est plus facile de manipuler k (k=3) sous-groupe que de manipuler la population totale du dataset Age Revenu s
  • 33. UTILISATION DU K-MOYENNES POUR CONSTITUER K GROUPES HOMOGÈNES Méthode 1. Choisir en combien de groupes homogènes je veux partitionner mon dataset (k) 2. On choisit k points au hasard comme centroïdes 3. On laisse l’algorithme faire des itérations jusqu’à ce que les centroïdes ne bougent plus 4. Chaque centroïdes est la moyenne d’un groupe homogène 5. Résultat : on a k valeurs moyenne de chaque groupe. fonctiondesmoindrescarrés
  • 34. UTILISATION DU K-MOYENNES POUR CONSTITUER K GROUPES HOMOGÈNES Méthode 1. Choisir en combien de groupes homogènes je veux partitionner mon dataset (k) 2. On choisit k points au hasard comme centroïdes 3. On laisse l’algorithme faire des itérations jusqu’à ce que les centroïdes ne bougent plus 4. Chaque centroïdes est la moyenne d’un groupe homogène 5. Résultat : on a k valeurs moyenne de chaque groupe.
  • 35. UTILISATION DU K-MOYENNES POUR CONSTITUER K GROUPES HOMOGÈNES Méthode 1. Choisir en combien de groupes homogènes je veux partitionner mon dataset (k) 2. On choisit k points au hasard comme centroïdes 3. On laisse l’algorithme faire des itérations jusqu’à ce que les centroïdes ne bougent plus 4. Chaque centroïdes est la moyenne d’un groupe homogène 5. Résultat : on a k valeurs moyenne de chaque groupe.
  • 36. UTILISATION DU K-MOYENNES POUR CONSTITUER K GROUPES HOMOGÈNES Méthode 1. Choisir en combien de groupes homogènes je veux partitionner mon dataset (k) 2. On choisit k points au hasard comme centroïdes 3. On laisse l’algorithme faire des itérations jusqu’à ce que les centroïdes ne bougent plus 4. Chaque centroïdes est la moyenne d’un groupe homogène 5. Résultat : on a k valeurs moyenne de chaque groupe.
  • 37. UTILISATION DU K-MOYENNES POUR CONSTITUER K GROUPES HOMOGÈNES <Exercice d’applicatio n>
  • 38. UTILISATION DU K-MOYENNES POUR CONSTITUER K GROUPES HOMOGÈNES K = ? Combien d’itération ? Combien de groupes homogènes ? Quels sont les centroïdes ? Où est la souris ?
  • 39. UTILISATION DU K-MOYENNES POUR CONSTITUER K GROUPES HOMOGÈNES K = 3 itération = 14 groupes homogènes = 3 les Centroïdes la souris …
  • 40. UTILISATION DU K-MOYENNES POUR CONSTITUER K GROUPES HOMOGÈNES </Exercice d’applicatio n>
  • 41. UTILISATION DU K-MOYENNES POUR CONSTITUER K PROFILS CLIENTS K profils de clients qui ont acheté nos produits K profils de prospects qui sont susceptibles d’acheter nos clients
  • 43. LOOK-ALIKE MODELING A partir de la donnée client, identifier les prospect susceptibles de profiter de nos produits Clients Prospects
  • 44. LOOK-ALIKE MODELING Clients Prospect Look-alike Construction du segment • Femme • 25-35 • Foot • Minecraft en mode créa • Dernier achat GPS vélo A partir de la donnée client, identifier les prospect susceptibles de profiter de nos produits
  • 45. FAIRE DU PROFILAGE CLIENT Profil 1 Donnée 1st party  femme de 47 ans  mobile : +33 6 xx xxx xxx  Dernier achat : pull Données 2nd Party  Centre d’intérêt minecraft, bronzage, raclette Données 3r party  Revenu : 70000€  Education : Bac +8  Mariée  2 enfant Profil 2 Donnée 1st party  femme de 28 ans  mobile : +33 6 xx xxx xxx  Dernier achat : débardeur Données 2nd Party  Centre d’intérêt café, fitness, vegan Données 3r party  Revenu : 40000€  Education : Bac +5  Mariée  1 enfant Profil 3 Donnée 1st party  femme de 19 ans  mobile : +33 6 xx xxx xxx  Dernier achat : gps Données 2nd Party  Centre d’intérêt voyages, rencontres, vegan Données 3r party  Revenu : 30000€  Education : Bac +1  célibataire
  • 47.
  • 48. LA PUBLICITÉ NOUS INFLUENCE Avez-vous entendu le TouDoum ?
  • 49. LA PUBLICITÉ EN LIGNE UN ÉCOSYSTÈME STRUCTURÉ PAR L’OFFRE ET LA DEMANDE La demande L’annonceur a un catalogue de produits à faire connaitre et à vendre L’offre L’éditeur offre des espaces publicitaires pour faire afficher les annonces de l’annonceur L’éditeur fait en sorte que son contenu éditorial soit riche et varié pour attirer de l’audience sur son site.
  • 50. LA PUBLICITÉ EN LIGNE UN ÉCOSYSTÈME STRUCTURÉ PAR L’OFFRE ET LA DEMANDE Demande Catalogue de service à vendre Offre L’éditeur valorise son audience Offre espace de Pub
  • 51. LA PUBLICITÉ EN LIGNE : NIVEAU I
  • 52. LA PUBLICITÉ EN LIGNE : NIVEAU I STRUCTURE D’UNE PAGE ÉDITEUR Espace publicitaire Espace publicitair e Espace publicitair e
  • 53. LA DEMANDE : L’ANNONCEUR A UN CATALOGUE DE PRODUIT À VALORISER Catalogue de produits à valoriser
  • 54. L’OFFRE : L’ÉDITEUR A DES ESPACES PUBLICITAIRES À FAIRE TOURNER Espace publicitaire Espace publicitair e Espace publicitair e
  • 55. L’OFFRE RENCONTRE LA DEMANDE, L’ANNONCEUR ANNONCE SON CATALOGUE DE PRODUIT SUR LE SITE L’ÉDITEUR
  • 56. LE MODÈLE A SES LIMITES, JE PEUX ÊTRE UN HOMME ET JE REÇOIS UNE PUB MAL CIBLÉE
  • 57. LA PUBLICITÉ EN LIGNE : NIVEAU II
  • 58. LES ÉDITEURS METTENT LEURS ESPACES PUBLICITAIRES EN RÉSEAU Le journal du geek et Femme-Actuelle Ex : L’éditeur garantit 1000 impressions de l’annonce sur le réseau Le Journal du geek +
  • 59. LA PUBLICITÉ EN LIGNE : NIVEAU III
  • 60. LES ÉDITEURS PROPOSENT LEUR ESPACE PUBLICITAIRES (INVENTAIRES) VIA UN SYSTÈME D’ENCHÈRES LES ANNONCEURS ENCHÉRISSENT, OU PAS, SUR L’OPPORTUNITÉ DE FAIRE AFFICHER LEUR PUBLICITÉ Place de marché
  • 61. LE GAGNANT PLACE SON ANNONCE Place de marché Toute l’opération se fait en moins de 200ms, en quasi temps réel Le Real Time Bidding
  • 62. LA PUBLICITÉ EN LIGNE : NIVEAU III Demande Catalogue d’annonces à valoriser Offre Inventaire à valoriser Annonceurs Editeur DSP SSP Ad Server Editeur Ad Exchange Ad Server annonceur
  • 63. Ad Server Editeur LA PUBLICITÉ EN LIGNE : NIVEAU III La SSP permet à l’éditeur de valoriser son inventaire Offre Inventaire à valoriser Editeur SSP Ad Exchange Demande Catalogue d’annonces à valoriser pour faire la promotion des produits
  • 64. Ad Server annonceur LA DSP PERMET À L’ÉDITEUR DE VALORISER SON CATALOGUE Demande Catalogue d’annonces à valoriser pour faire la promotion des produits La DSP permet à l’annonceur de faire des enchères sur les impressions mises à disposition par l’éditeur en ciblant les bons clients/prospects grâce au cookies laissés par les visiteurs Annonceurs Ad Exchange DSP
  • 65. SSP Ad Server Editeur Ad Server annonceur LA DSP PERMET À L’ANNONCEUR DE CIBLER DES SEGMENTS COOKIES GRÂCE À UNE DMP (OU PAR MAIL) Demande Catalogue d’annonces à valoriser pour faire la promotion des produits Offre Inventaire à valoriser Annonceurs Editeur DSP Ad Exchange
  • 66. LA BID REQUEST La bid request envoie des informations sur l’emplacement de l’espace publicitaire, l’appareil utilisé, l’application mobile, le segment de cookie et surtout l’identifiant du cookie Les bid request sont SSP Ad Server Editeur SSP
  • 67.
  • 68. LA PUBLICITÉ EN LIGNE <Quizz >
  • 69. LA PUBLICITÉ EN LIGNE : QUIZ Qu’est qu’une impression ? Qu’est qu’un inventaire ? Qu’est ce qu’une DSP ? Qu’est qu’une SSP ? Qu’est qu’une DMP ? Donnez un exemple d’annonceur ? Donnez un exemple d’éditeur ? Qu’est ce qu’un segment ? Qu’est ce que le RTB ? En combien de secondes se fait le RTB ? Qu’est ce qu’une bid request ?
  • 70. LA PUBLICITÉ EN LIGNE </Quizz >
  • 71. EN RÉSUMÉ Les éditeurs mettent leur espaces publicitaires (inventaires) au plus offrant des annonceurs Lorsque l’annonceur affiche sa publicité sur le site de l’éditeur, il doit le faire au bon moment avec le bon produit pour la bonne personne de façon à maximiser la probabilité de clic sur la bannière. L’annonceur utilise des techniques pour connaitre le client qui visite le site de l’éditeur
  • 72. LES TYPES (NON EXHAUSTIF) DE DONNÉES DU DATA MARKETING •Une bannière s’est affichée Impression •Le visiteur a cliqué sur la bannière Clicks •Le visiteur a acheté le produit Conversion
  • 73. ATELIER DE CRÉATION DE COOKIES <Exercice d’applicatio n>
  • 74. ATELIER DE CRÉATION DE COOKIES installation du plugin 1. sous Firefox « Cookie Quick Manager » 2. « Awesome Cookie Manager »
  • 75. ATELIER DE CRÉATION DE COOKIES À votre avis, combien de cookies avez-vous sur votre ordinateur ? 1.10 cookies 2.100 cookies 3.1000 cookies 4.> 1000 cookies
  • 76. ATELIER DE CRÉATION DE COOKIES Afficher tous les cookies
  • 77. ATELIER DE CRÉATION DE COOKIES Lotame Doubeclick Adobe AppNexus ABTesty
  • 78. ATELIER DE CRÉATION DE COOKIES Rendez-vous sur https://www.w3school s.com/js/tryit.asp?file name=tryjs_cookie_us ername
  • 79. ATELIER DE CRÉATION DE COOKIES Rendez-vous sur https://www.w3school s.com/js/tryit.asp?file name=tryjs_cookie_us ername
  • 80. ATELIER DE CRÉATION DE COOKIES Afficher tous les cookies du domaine www.w3schools. com
  • 81. ATELIER DE CRÉATION DE COOKIES 1. Cliquez sur Run 2. Entrez votre nom
  • 82. ATELIER DE CRÉATION DE COOKIES 1. Cliquer sur l’extension cookie quick manager 2. Le cookie ‘username’ a été crée 3. Le navigateur via le server du domain www.w3schools.co m a déposé un cookie ‘username’ sur votre navigateur
  • 83. ATELIER DE CRÉATION DE COOKIES Nom du cookie Valeur du cookie Domaine du cookie Date d’expiration du cookie Chemin du cookie
  • 84. ATELIER DE CRÉATION DE COOKIES 1. Cliquez sur Run 2. Le navigateur vous reconnait
  • 85. ATELIER DE CRÉATION DE COOKIES 1. Modifiez le cookie 2. Observez et commente z le
  • 86. ATELIER DE CRÉATION DE COOKIES À RETENIR 1. Le nom du cookie 2. La valeur du cookie 3. Le domaine du cookie 4. Un cookie est valable que pour un domaine (ie w3schools.com dans notre cas)
  • 87. ATELIER DE CRÉATION DE COOKIES </Exercice d’applicatio n>
  • 89. LE TRAITEMENT DE LA DONNÉES 1. Sur un dataset type, chaque ligne représente un individu 2. Chaque colonne contient les actions effectuées par le visiteur, son exposition à une campagne publicitaire, etc.Dataset
  • 90. UN DATASET D’UNE BASE DE DONNÉES RELATIONNELLES DE 18GO AVITO ~LEBONCOIN RUSSE
  • 91. ['UserID', 'UserAgentID', 'UserAgentOSID', 'UserDeviceID', 'UserAgentFamilyID'] UserID UserAgentID UserAgentOSID UserDeviceID UserAgentFamilyID4284788 4339827 63458 19 2014 644284789 4339828 22293 20 2014 254284790 4339829 10275 20 2014 254284791 4339830 12505 20 2014 854284792 4339831 32388 7 2014 154284793 4339832 63756 43 2014 74284794 4339833 57133 20 2014 254284795 4339834 9243 20 2014 254284796 4339835 57133 20 2014 254284797 4339836 63091 20 2014 254284798 4339837 33726 20 2014 624284799 4339838 9230 7 2014 624284800 4339839 57133 20 2014 254284801 4339840 55731 20 2014 644284802 4339841 57133 20 2014 254284803 4339842 10275 20 2014 254284804 4339843 58369 7 2014 254284805 4339844 29432 20 2014 154284806 4339845 15093 35 2905 634284807 4339846 55033 35 576 634284808 4339847 48490 43 2014 644284809 4339848 10275 20 2014 254284810 4339849 21092 43 2014 624284811 4339850 12505 20 2014 854284812 4339851 57133 20 2014 254284813 4339852 12505 20 2014 854284814 4339853 57133 20 2014 254284815 4339854 55731 20 2014 644284816 4339855 8533 9 2014 624284817 4339856 54898 20 2014 854284818 4339857 7075 20 2014 624284819 4339858 1393 30 2019 94284820 4339859 57133 20 2014 254284821 4339860 63091 20 2014 254284822 4339861 57133 20 2014 25['LocationID', 'Level', 'RegionID', 'CityID'] LocationID Level RegionID CityID4045 1000003 3 31 13564046 1000004 3 31 28364047 1000005 3 31 15034048 1000006 3 31 25014049 1000007 3 31 20164050 1000008 3 31 36994051 1000009 3 31 28044052 1000010 3 31 34054053 1000011 3 31 22354054 1000012 3 31 24754055 1000013 3 31 12264056 1000014 3 31 19424057 1000015 3 31 13734058 1000016 3 31 35304059 1000017 3 31 20674060 1000018 3 31 554061 1000019 3 31 25944062 1000020 3 31 35524063 1000021 3 31 6524064 1000022 3 31 14454065 1000023 3 31 30154066 1000024 3 31 31734067 1000025 3 31 35874068 1000026 3 31 28164069 1000027 3 31 26454070 1000028 3 31 21454071 1000029 3 31 15384072 1000030 3 31 33824073 1000031 3 31 25254074 1000032 3 31 32234075 1000033 3 31 5134076 1000034 3 31 11624077 1000035 3 31 30414078 1000036 3 31 27804079 1250001 2 31 1245['CategoryID', 'Level', 'ParentCategoryID', 'SubcategoryID'] CategoryID Level ParentCategoryID SubcategoryID63 250003 2 11 4564 250004 3 11 3365 250005 3 7 2666 250006 3 11 867 500001 3 5 1['SearchID', 'SearchDate', 'IPID', 'UserID', 'IsUserLoggedOn', 'SearchQuery', 'LocationID', 'CategoryID', 'SearchParams'] SearchID SearchDate IPID0 1 2015-05-18 19:54:32.0 17170901 2 2015-05-12 14:21:28.0 17315682 3 2015-05-12 07:09:42.0 7931433 4 2015-05-10 18:11:01.0 8987054 5 2015- 04-25 13:04:09.0 20097075 6 2015-05-07 16:49:15.0 16584566 7 2015-05-14 23:07:27.0 18491177 8 2015-05-09 09:10:06.0 5725858 9 2015-05-02 20:14:15.0 771629 10 2015-05-15 17:38:46.0 137107210 11 2015-05-17 12:01:01.0 6735611 12 2015-05-13 11:54:24.0 130519112 13 2015-04-26 21:34:59.0 147385113 14 2015-04-28 01:30:16.0 47333114 15 2015-05-06 11:23:50.0 111701215 16 2015-05-10 21:08:27.0 202212716 17 2015-05-03 14:12:19.0 69798217 19 2015-05-12 10:14:07.0 208043518 20 2015-05-16 14:38:00.0 48640819 21 2015-05-14 17:27:55.0 1279103
  • 92. UN DATASET D’UNE BASE DE DONNÉES RELATIONNELLES DE 18GO AVITO ~LEBONCOIN RUSSE
  • 94. LE TRAITEMENT DE LA DATA Dataset Nettoyage des données Analyse statistique DataMining Machine Learning Création de modèlesConnaissance
  • 95. L’analyse descriptive •Mes visiteurs ont cliqué sur la bannière de mon site L’analyse prédictive •Mes visiteurs cliqueront sur ma bannière L’analyse prescriptive •Ce que je dois faire pour que les visiteurs cliquent sur la bannière L’ANALYSE DE LA DATA 3 NIVEAUX DE VALEUR DE L’ANALYSE DE LA DONNÉE
  • 96. L’ANALYSE DESCRIPTIVE Quelques outils à connaitre La moyenne L’écart type (1σ, 2σ, 3σ) La médiane Le décile, le centile
  • 97. 80/20 PRINCIPE DE PARETO ET LE TABLEAU DES FRÉQUENCES CUMULÉES80% du trafic apporté par les réseaux sociaux, le blog, le Search 20% par le reste 1201 898 500 343 122 89 76 80% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 0 200 400 600 800 1000 1200 1400 Les… Leblog Search Publicité… Compara… Email… Mobile Diagramme de Pareto
  • 99. ANALYSE LONGITUDINALE Analyse des évolution dans le temps pour trouver des effets de saisonnalité
  • 100. ANALYSE LONGITUDINALE 1. Allez sur Google Trends France 2. Saisissez raclette 3. Observez la courbe sur un an 4. Observez la courbe sur 5 ans
  • 101. ANALYSE LONGITUDINALE 1. Rajoutez Maillot de bain 2. Observez la courbe sur 5 ans
  • 102. ANALYSE LONGITUDINALE 1. Exportez les données 2. Ouvrez le ficher .csv avec Excel 3. Sélectionnez la colonne A 4. Calculez le coefficient de Corrélation 1. =COEFFICIENT.CORRELATION(C4:C 263;B4:B263) 5. (Option) tracez les courbes
  • 103. ANALYSE LONGITUDINALE 2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019 raclette: (France) maillot de bain: (France) COEFFICIENT.CORRELATION( raclette ; maillot de bain ) = -0,70 y = -1.2703x + 48.157 R² = 0.4859 -20 0 20 40 60 80 100 120 0 10 20 30 40 50 maillotdebain raclette
  • 104. ANALYSE LONGITUDINALE CONSTATER ET DÉCRIRE 2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019 raclette: (France) maillot de bain: (France) L’objectif de l’analyse descriptive est de constater et de décrire Que constatez-vous ? Que pouvez décrire ? Quelle est la saisonnalité ?
  • 105. ANALYSE LONGITUDINALE CONSTATER ET DÉCRIRE raclette: (France) maillot de bain: (France) Mettre crème solaire en surpression quelques jours avant les vacances scolaires
  • 106. ANALYSE LONGITUDINALE CORRÉLATION ET CAUSALITÉ 2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019 raclette: (France) maillot de bain: (France) En première analyse, lorsque les recherches sur les raclettes baissent, celles sur les maillots de bain augmentent. Il y a corrélation proche de 1 (- 0,697), mais négative, Les recherches sur les raclettes font baisser les recherches sur les maillots de bain (10 recherches sur raclette font baisser les recherches de 12,703 sur les maillots de
  • 107. ANALYSE LONGITUDINALE CORRÉLATION ET CAUSALITÉ 2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019 raclette: (France) maillot de bain: (France) En première analyse, lorsque les recherches sur les raclettes baissent, celles sur les maillots de bain augmentent. Il y a corrélation proche de 1 (- 0,697), mais négative, Les recherches sur les raclettes font baisser les recherches sur les maillots de bain (10 recherches sur raclette font baisser les recherches de 12,703 sur les maillots de
  • 108. ANALYSE LONGITUDINALE CORRÉLATION ET CAUSALITÉ 2/8/2015 2/8/2016 2/8/2017 2/8/2018 2/8/2019 raclette: (France) maillot de bain: (France) En data marketing (et ailleurs) corrélation ne vaut pas causalité. Dans notre cas, il existe une troisième variable qui explique les variations des deux premières.
  • 110. L’ANALYSE PRÉDICTIVE Utiliser la data marketing pour prédire le comportement futur en utilisant les données du passé Prédire le click sur la bannière Prédire l’achat ou l’abonnement
  • 111. L’ANALYSE PRÉDICTIVE : PRÉDIRE LE CLIC SUR UNE BANNIÈRE Quelle est la probabilité que le visiteur clique sur la bannière ? La fonction de modélisation de la probabilité qu’un visiteur clique sur une bannière prend deux valeurs, 0 et 1  1 le visiteur a cliqué  0 le visiteurs n’a pas cliqué On prédit un évènement binaire,
  • 112. L’ANALYSE PRÉDICTIVE : PRÉDIRE LE CLIC SUR UNE BANNIÈRE
  • 113. QUELLE EST LA PROBABILITÉ QUE LE VISITEUR CLIQUE SUR LA BANNIÈRE ?
  • 114. L’ANALYSE PRÉDICTIVE On veut prédire P(click | display) = f(taille du display, emplacement, device, fréquence, historique de navigation, exposition à la campagne, météo, lieux, xk, … xn) Taille du display emplacement Device … Click 600x300 en haut Laptop Oui 100x100 à droite iPad Non …. Id Non
  • 115. L’ANALYSE PRÉDICTIVE LA RÉGRESSION LOGISTIQUE MULTIVARIÉE On veut prédire P(click | display) = f(taille du display, emplacement, device, fréquence, historique de navigation, exposition à la campagne, météo, lieux, 𝑋1, … 𝑋 𝑛) Il y a potentiellement des milliers de paramètres possible. log 𝑃(𝑐𝑙𝑖𝑐𝑘) 1−𝑃(𝑐𝑙𝑖𝑐𝑘) = β0 + β1. 𝑋1 + ⋯ + β 𝑘. 𝑋 𝑘 + ⋯ + β 𝑛. 𝑋 𝑛 β 𝑘. 𝑋 𝑘 sont les variables explicatives du modèle Avec les données historiques, on détermine les coefficients de pondération β 𝑘 Plus la valeur du coefficient est élevé, plus l’impact de la variable est important.
  • 116.
  • 117. LA PROGRAMMATIQUE •Le visiteur navigue sur le site •La SSP qui gère les espaces pub pose un cookie •Le SSP informe la DSP de l’existence de deux emplacement pubs avec une bid request •<bid request>cookies, emplacement espace pub, device, etc.</bid request> •La DSP fait l’enchère pour afficher la pub •La SSP retient l’enchère gagnante •La pub s’affiche
  • 118. LA PROGRAMMATIQUE •Le visiteur navigue sur le site •La SSP qui gère les espaces pub pose un cookie •Le SSP informe la DSP de l’existence de deux emplacement pubs avec une bid request •<bid request>cookies, emplacement espace pub, device, etc.</bid request> •La DSP fait l’enchère pour afficher la pub •La SSP retient l’enchère gagnante •La pub s’affiche { "id": "1234534625254", "at": 2, "tmax": 120, "imp": [ { "id": "1", "banner": { "w": 320, "h": 50, "pos": 1, "battr": [ 13 ] } } ], "badv": [ "company1.com", "company2.com" ], "app": { "id": "234563", "bundle": "com.rovio.angrybirds", "cat": [ "IAB2-1", "IAB2-2" ], "publisher": { "id": "pub12345" } }, "device": { "ip": "64.124.253.1", "ua": "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.6; en-US; rv:1.9.2.16) Gecko/20110319 Firefox/3.6.16", "os": "OS X" }, "user": { "id": "45asdf987656789adfad4678rew656789" }, "ext": { "udi": { "idfa": "44E9AF56-9ED1-47AE-A3F4-719D050641F9" }, "appnexus": { "seller_member_id": 2066 } } }
  • 119. C’EST QUOI UNE DMP? « La DMP est une plateforme qui permet de créer des audiences ciblées à partir de données issues de 1st et 3rd party pour mener des campagnes ciblées à travers des réseaux Ad Exchange et Ad Network La DMP permet de mesurer les performances des meilleurs segments et canaux et d’affiner l’achat média et la création de bannière »
  • 120. Activatio nDMP SegmentationDonnées C’EST QUOI UNE DMP? 1st Party Data 3rd Party Data
  • 121. Constitution des Segments dans la DMPDMPDonnées CONSTITUTION DES PERSONAS 1st Party Data 3rd Party Data
  • 122. Constitution des Segments dans la DMP Annonce ur CONSTITUTION DES PERSONAS LES SEGMENTS DE LA DSP SE RETROUVENT DANS LA DSP DSP Ad Exchange
  • 123. LA DMP ORANGE – L’OUTIL DE GESTION DES COOKIES POUR LES CAMPAGNES DIGITALE • portails xxxx.fr et xxxx • campagnes Web • MD (email, SMS) • CRM onboarding • 2nd party • 3rd party Catégories pour classer les cookies (vaste arborescence appelée taxonomie) • prospects Internet éligibles Fibre • intentionnistes déménagement • familles avec enfants détentrices d’une offre Large • etc. + 1300 + 880 audience créées Source : Bluekai le 22/09/2016 100% des campagnes Search 90% des campagnes d’acquisition 40% des campagnes branding 82M de cookies collectés 1. Collecte les cookies 2. Classe les cookies 3. Génère des audiences 4. Transforme les audience en campagnes et les envoie aux ad exchanges
  • 124. DMP ANNONCEUR LA TAXONOMIE DE LA DMP La taxonomie de la DMP, c'est-à-dire l’arborescence des catégories classées par thèmes (navigation portails, attributs clients CRM). L’écran principal à droite sert à construire les audiences
  • 125. DMP ANNONCEUR TAXONOMY MANAGER Le Taxonomy Manager sert à définir les règles de chaque élément de la taxonomie
  • 126. DMP ANNONCEUR ÉCRAN AUDIENCES La page qui répertorie toutes les audiences créées avec leurs caractéristique
  • 127. DMP ANNONCEUR ÉCRAN CAMPAGNES La page qui répertorie les campagnes. Les campagnes sont des audiences qui sont envoyées aux outils et plateformes de campagnes
  • 128. Un écosystème qui repose sur les cookies
  • 129.
  • 131. REMERCIEMENTS Mes remerciements vont dans le désordre à Blaise Vignon, Le MBA MCI, François Pierre, Elodie Gacon, Louis Duroulle et j’en oublie beaucoup.
  • 132. RÉFÉRENCES BIBLIOGRAPHIQUES Bonjour PPC Le digital pour tous #BonjourPPC ebg Digital Marketing 2020 Modélisation d’un réseau social Claire Savinas, La publicité à l’heure de la data Jean Allary et Vincent Balusseau Le guide de la transformation digitale Emmanuel Vivier, Vincent Ducrey Display Lumascape by Luma Partners giphy.com pour les gifs animés learnbymarketing.com K-Means Clustering – What it is and How it Works w3schools.com HTML The language for building web pages

Notas del editor

  1. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  2. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  3. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  4. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  5. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  6. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  7. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  8. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  9. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  10. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  11. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  12. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  13. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  14. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  15. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  16. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  17. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  18. Source : https://www.traackr.com
  19. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/ Note pour le lecteur de note de bas de slide ;-) oui vous avez bien lu, c’est un exercice de seconde générale, ce qui montre à quel point les réseaux sociaux influencent notre vie.
  20. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  21. Source : https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  22. Source : Minority Report - https://www.youtube.com/watch?v=7bXJ_obaiYQ
  23. Les données sont lacunaires, et plusieurs paramètres sont estimés grâce à des données 3rd Party. C’est le cas de la colonne Revenus dans l’exemple ci-dessus.
  24. La 1st party data sont les données dont l’acteur (annonceur ou éditeur) est propriétaire, les données proviennent de ses sites, de ses applications, dans une moindre mesure de sa page facebook, de son compte Instagram, Twitter, de sa chaine Youtube. Les 3rd party data sont achetées à des sources externes comme Lotame Data Exchange. La 3rd party data est utilisée pour enrichir la 1st party data et la 2nd party data. Les données 1st party data et 2nd party data sont relativement similaires, pour faire un raccourci sémantique, ma 2nd party data est la 1st party data d’un acteur de mon écosystème. Un vendeur d’assurance sera intéressé pour acquérir de la 1st party data d’un vendeur de vélos électriques. Du point de vue du vendeur d’assurance, la 1st party data du vendeur de vélos est la 2nd party data du vendeur d’assurance. Pour la 1st et la 2nd party data, tout est question de points de vue. Ma first party data est toujours la 2nd party data de l’autre acteur sur la chaine de valeur de mon secteur d’activité.
  25. comment constituer k groupes homogènes ?
  26. Dans le cas d’un dataset de n points, on décompose le dataset en k (k=<n) sous-groupe homogènes. Si k=n vous avez n sous-groupe homogènes, soit exactement la taille du dataset, ce qui reste d’un intérêt limité ;-)
  27. Source : http://www.learnbymarketing.com/methods/k-means-clustering/
  28. Source : http://www.learnbymarketing.com/methods/k-means-clustering/ https://en.wikipedia.org/wiki/K-means_clustering
  29. Source : http://www.learnbymarketing.com/methods/k-means-clustering/ https://en.wikipedia.org/wiki/K-means_clustering
  30. Source : http://www.learnbymarketing.com/methods/k-means-clustering/ https://en.wikipedia.org/wiki/K-means_clustering
  31. Source : http://www.learnbymarketing.com/methods/k-means-clustering/ https://en.wikipedia.org/wiki/K-means_clustering
  32. Non bien sur, mais on y a pensé très fort.
  33. Source : https://lumapartners.com/content/lumascapes/display-ad-tech-lumascape/
  34. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  35. https://www.numworks.com/fr/ressources/snt/modelisation-reseau-social/
  36. Source : https://www.kaggle.com/c/avito-context-ad-clicks/data
  37. Source : https://www.kaggle.com/tinoswe/split-python-dataframe
  38. Source : https://www.kaggle.com/c/avito-context-ad-clicks/data
  39. Source : https://trends.google.com/trends/explore?date=today%205-y&geo=FR&q=raclette
  40. Source : https://trends.google.com/trends/explore?date=today%205-y&geo=FR&q=raclette,maillot%20de%20bain
  41. Source : https://trends.google.com/trends/explore?date=today%205-y&geo=FR&q=raclette,maillot%20de%20bain
  42. Remarque, plus R² est proche de 1, plus les observations (en bleu) sont regroupées autour de la droite de régression (en noir)
  43. Source : https://wiki.xandr.com/pages/viewpage.action?pageId=58656727