SlideShare une entreprise Scribd logo
1  sur  32
La Ligue 1 sur Facebook :
Analyse des supporters de Football via le prisme des
commentaires
Erwan Le Nagard – Décembre 2017
14.879 posts effectués par 23 clubs et la LFP
sur 6 mois
1.510.491 commentaires impliquant
757.701 usagers
Notre dataset
Un jeu de données pour une connaissance inédite des supporters de football
Document strictement confidentiel 2
Les objectifs de l’étude
Construire une typologie des supporters
Document strictement confidentiel 3
Son activité
Est-il actif ou non ? Quelle est l’intensité de son activité ?
Son « économie »
Comment répartit-il ses commentaires ? sur plusieurs pages, posts, …
La manière dont il commente
Ses commentaires sont-ils longs ? Contiennent-ils des mentions ou des emojis ?
La manière dont il est affecté par les autres
Est-ce que d’autres usagers lui répondent ?
L’engagement des commentateurs est protéiforme
Derrière un volume de commentaires, se cache une « économie » et des profils d’audience variés
Document strictement confidentiel 4
La forme des fils de commentaires :
- La richesse lexicale
- Le capital émotionnel
- Le capital conversationnel
- L’empowerment
Des critères d’activité :
- Le volume de commentaires effectué
- Le volume d’objets commentés (nombre de posts)
- Le volume d’entités commentées (nombre de clubs)
L’enjeu : démêler plusieurs millions de relations
Modéliser les relations entre ces individus, leurs commentaires, les posts, les clubs…
Document strictement confidentiel 5
La finalité :
Concevoir de nouveaux indicateurs qui
caractérisent les liens entre clubs et supporters
Notre problématique :
Comment interpréter un immense
network graph ?
La solution :
Construire un modèle de relations exploitable pour
interroger le graphe
Les technologies mises en œuvre
Neo4j intégré dans un écosystème de solutions
Document strictement confidentiel 6
Collecte
Pre-processing
Connexion à la BDD
Chargement des données
Ajout / modification de
données
Traitements statistiques
Requêtage
Visualisation des données
Exploration des résultats
Visualisation de sous-graphes de tailles
restreintes
Traitement statistiques
Export csv
ACP, HCPC, classification
Comment s’agrègent les communautés de supporters ?
L’audience des clubs
Document strictement confidentiel 7
+
Une audience concentrée autour des « grands clubs »
Trois clubs (OM, PSG et OL) cumulent plus de la moitié des commentateurs
Document strictement confidentiel 8
L’audience est majoritairement masculineLes 45% restants se répartissent sur les 21 autres pages
Mon club, mon commentaire, ma bataille…
97,8% des usagers n’ont commenté qu’un seul club.
Document strictement confidentiel 9
La plupart des usagers concentrent leurs
commentaires sur les publications d’un
seul club.
Néanmoins, la proportion d’audience
partagée avec d’autres clubs est variable.
Par exemple, ¼ des commentateurs du
MHSC ont aussi commenté sur la page
d’au moins un autre club.
6.511 commentateurs de l’OM (5% de
l’audience totale) ont commenté sur la
page d’au moins un autre club.
L’OL et le PSG partagent moins de 1% de
leur audience avec d’autres clubs.
La carte de l’audience commune des clubs
Une audience commune entre clubs qui témoigne moins de rivalités historiques, que de l’actualité.
Document strictement confidentiel 10
Les rivalités historiques entre clubs ne s’expriment pas au
travers des audiences communes. Néanmoins, on peut les
trouver dans la sémantique des commentaires.
Par exemple, seulement 14 usagers ont commenté à la fois la
page du PSG et de l’OM. De même, il n’existe aucun
commentateur commun entre Rennes et Guingamp.
En revanche, ces flux semblent liés à une dimension locale
(notamment dans les régions où les clubs sont proches – ex :
Montpellier – Marseille – Monaco), et évoluent en fonction
du calendrier du championnat.
Réseau non-dirigé des audiences
commune. La taille des liens
correspond au nombre de
commentateurs communs
La carte de l’audience partagée des clubs
La LFP est un acteur central pour le dynamisme digital des clubs
Document strictement confidentiel 11
La LFP partage environ 15% de son audience avec les clubs. Pour ¼
des clubs, elle figure parmi les 3 principaux apporteurs d’audience
(>1% de ses commentateurs).
Certains clubs ont tendance à faire circuler l’audience (rapport liens
entrants / liens sortants – basé ici uniquement sur les flux >1%) :
l’ESTAC Troyes distribue plus de 1% de son audience à 6 autres
clubs, mais ne capture plus de 1% d’audience qu’à un seul club.
A l’inverse : L’AS Monaco et l’OM capturent l’audience de 5 autres
clubs, mais ne distribue leur audience qu’à 2 autres.
L’OL est isolé : il ne distribue jamais plus de 1% de son audience et
ne capture pas de flux d’audience >1%.
Réseau dirigé représentant le
pourcentage d’audience partagée
entre clubs. Les flux d’audience
<1% des commentateurs ne sont
pas tracés.
Comment circule l’audience ?
Des communautés de supporters, au cœur de l’économie des commentaires
Document strictement confidentiel 12
La dynamique de l’audience, s’organise autour de 4 groupes de clubs :
1/ Un flux Ouest <> Est (en mauve) : Une audience connectée à la page
de la LFP et aux clubs de l’Ouest (en mauve). Le FC Metz et l’ESTAC sont
très connectés à la LFP, elle-même très connectée à la plupart des clubs
de l’Ouest.
2/ Un flux Sud <> Nord (en jaune) : Une audience connectée à l’OM,
l’AS Monaco et le LOSC, avec des clubs périphériques (MHSC, Amiens,
Angers)
3/ Un flux Centre <> Est (en vert) : Une audience connectée à l’AS St
Etienne (en vert), qui comprend l’OL, DFCO, ASNL et l’OGC Nice.
4/ Un flux périphérique (en bleu) : les clubs qui partagent finalement
peu d’audience compose le dernier groupe (PSG, RC Strasbourg, SC
Bastia, TFC, SMC et le Stade Rennais).
Quel est le degré d’activité des supporters par club ?
Profils d’activité des supporters
Document strictement confidentiel 13
+
Une typologie par critères d’activité
Combien de posts effectués par le club, l’usager a-t-il commenté ?
Document strictement confidentiel 14
L’Ultra
12 posts ou plus
Le Ponctuel
1 seul post
Le Spectateur
Aucun post commenté
L’Occasionnel
2 à 11 posts
L’engagement des audiences
Les 1% de commentateurs les plus actifs publient en moyenne 33 messages
Document strictement confidentiel 15
61,3% des usagers, les
moins actifs
20,7% des usagers
1% des usagers, les
plus actifs
a publié 17,5% des
commentaires
43,8% des
commentaires
A publié 38,7% des
commentaires
16,9% des usagers
sont spectateurs
33,3 commentaires en
moyenne
4,1 commentaires en
moyenne
1,3 commentaire en
moyenne
« Ultras »
« Occasionnels »
« Spectateurs »
« Ponctuels »
7953 users
157.124 users
464.306 users
128.318 users
264.955 commentaires
661.276 commentaires
584.260 commentaires
757.701 usagers
1.510.491 commentaires
L’engagement des audiences, par club
Le PSG rencontre un soucis d’activation : le club possède plus de spectateurs que de commentateurs
fréquents, les commentateurs ponctuels contribuent à 72% du total de commentaires
Document strictement confidentiel 16
Activation des commentateurs
Plus d’1 mention sur 2 n’obtient pas de réponse, ce qui représente un large manque à gagner pour
certains clubs
Document strictement confidentiel 17
Le pourcentage de
commentateurs (on
retranche les spectateurs)
Le pourcentage de
sollicitations (mentions)
ayant obtenu une
réponse
Le volume de
sollicitations n’ayant pas
obtenu de réponse
Le volume d’usagers
mentionnés, qui n’ont
pas répondu
20% des usagers exposés par le PSG sont des spectateurs ; le club
pourrait potentiellement prendre la 1ère position en volume de
commentateurs actifs.
L’AS St Etienne a mieux activé ses commentateurs et cumule le 5e
volume de commentaires le plus important, devançant ainsi les
Girondins de Bordeaux (5e position potentielle, 6e effective)
De la même manière, le SC Bastia bénéficie d’un taux remarquable
d’activation et se positionne en 19e position en volume de
commentaires (vs 22e potentiellement), dépassant le SMC (20e), EA
Guingamp (21e) et le Toulouse FC (22e)
Quel est le potentiel d’activation des clubs ?
L’AS St Etienne performe bien, à l’inverse du PSG
Document strictement confidentiel 18
Potentiel d’activation
Quels contenus privilégient chaque type d’usagers ?
Document strictement confidentiel 19
Sur la base des posts ayant obtenu plus de 30 commentaires, nous
calculons la proportion de chaque type de commentateur.
Nous réalisons une ACP afin de positionner les posts selon deux
dimensions : un premier axe oppose les posts avec une forte proportion
de ponctuels, à ceux commenté par des usagers plus réguliers ; un second
axe oppose les posts commentés par une forte proportion d’ultras vs des
occasionnels
Une classification hiérarchiques (HCPC) permet de distinguer 3 groupes de
posts.
Posts avec une forte
proportion de Ponctuels
Posts avec une forte
proportion
d’Occasionnels
Posts avec une forte
proportion d’Ultras
Les posts qui génèrent le plus de commentateurs ponctuels
Les contenus les plus viraux, les faits marquants, les moments exceptionnels
Document strictement confidentiel 20
97,5% des commentateurs de ce post n’ont jamais re-
commenté d’autres posts de clubs
65% des commentateurs de ce post n’ont jamais re-
commenté d’autres posts de clubs
85,5% des commentateurs de ce post n’ont jamais re-
commenté d’autres posts de clubs.
Les posts privilégiés par les « occasionnels »
Les concours, les pronostics
Document strictement confidentiel 21
¾ des commentateurs de ces publications sont des « occasionnels »
Les posts privilégiés par les « Ultras »
Les résultats de match, les alignements de départ, les albums de match
Document strictement confidentiel 22
Plus d’1 commentateur sur 2 de ces publications sont des « ultras ». Les ultras représentent
une population intimement liée au calendrier du club : ils commentent régulièrement la
page du club, parce qu’ils ont vu ou assisté aux matchs.
- Les commentateurs ponctuels réagissent à des contenus émotionnels (le but incroyable,
le contenu drôle, l’événement marquant…). En moyenne, les posts privilégiés par les
Ponctuels ont obtenu 300 commentaires, tandis que ceux privilégiés par les Ultras n’ont
obtenu que 70 commentaires. Ainsi, un club comme le PSG qui réalise des contenus
originaux et viraux compte une forte proportion de commentateurs ponctuels.
- Le mode d’accès au contenu est probablement différent selon le type d’usagers. En
moyenne, 1/4 des commentaires des posts privilégiés par les commentateurs ponctuels
contiennent au moins une mention, tandis que cette proportion est seulement de 8%
pour les posts privilégiés par les ultras. Autrement dit, les « Ultras » sont probablement en
grande partie des abonnés qui consultent régulièrement la page du club (accès direct ou
organic reach), tandis que les ponctuels proviennent probablement du média payé ou
gagné.
- Enfin, ces différentes catégories d’usagers témoignent d’un engagement plus ou moins
fort envers le club : on parle du club dans les moments forts ou quand on y est exposé
de manière émotionnelle (ponctuels), on participe à la vie du club au rythme de son
calendrier (ultras), on profite pour s’engager plus lorsque le club nous en offre l’occasion
(occasionnels particulièrement attirés par les concours).
L’émotion ou la raison ?
La proportion de chaque type d’usagers est étroitement liée à la capacité du club à activer et à
fidéliser son audience
Document strictement confidentiel 23
Le PSG montre les coulisses du club sous forme de contenus où
le commentaire devient viral, ici Cavani joue au basket. 95% des
commentateurs n’ont jamais recommenté d’autres posts
De quelle manière les supporters commentent les clubs ?
Profils d’engagement
Document strictement confidentiel 24
+
Une typologie par forme d’engagement
Quel type de commentaire publie-t-il ?
Document strictement confidentiel 25
Le social
Il mentionne une variété
de connaissances
L’émotif
Il partage ses émotions par
une variété d’émojis
Le critique
Il use d’un vocabulaire prolixe,
ses commentaires sont longs
Variable retenue :
la longueur moyenne des
commentaires
Variable retenue :
le nombre total de
connaissances mentionnés
Variable retenue :
le nombre total d’emojis
utilisés
Son opposé :
Le solitaire
Son opposé :
Le rationnel
Son opposé :
Le laconique
Validation des variables
Trois caractères dominants pour l’audience
Document strictement confidentiel 26
Chaque usager est bien décrit par nos variables retenues : la
moyenne de la longueur de ses commentaires, la somme des émojis
utilisés et le total de ses connaissances mentionnées.
Pour chaque usager, nous allons décrire ses commentaire selon 3
niveaux d’usages :
- La longueur des commentaires sera courte, moyenne ou longue
- La somme des émojis sera nulle, faible ou élevée
- Le nombre de connaissances mentionnées sera nulle, faible ou
élevée
Toutes les catégories identifiées n’auront pas forcément de sens, et
nous les agrégerons de manière à obtenir des catégories qui
décrivent au mieux les populations d’usagers.
27 catégories d’usagers possibles
Document strictement confidentiel 27
@solitaires
Laconiques
Commentaires courts
(0 à 50 caractères)
@sociaux
@faible
@solitaires
@sociaux
@faible
@sociaux
@faible
@solitaires 35,98% des usagers (226.476 individus)
14,17% des usagers (89.190 individus)
3,59% des usagers (22.621 individus)
7,21% des usagers (45.374 individus)
1,37% des usagers (8.653 individus)
3,02% des usagers (18.989 individus)
4,17% des usagers (26.227 individus)
0,59% des usagers (3.718 individus)
2,04% des usagers (12.836 individus)
#emotifs
#rationnels
27 catégories d’usagers possibles
Document strictement confidentiel 28
@solitaires
@sociaux
@faible
@solitaires
@sociaux
@faible
@sociaux
@faible
@solitaires 12,59% des usagers (79.241 individus)
1,91% des usagers (12.025 individus)
1,36% des usagers (8.551 individus)
3,04% des usagers (19.128 individus)
0,73% des usagers (4.611 individus)
0,99% des usagers (6.246 individus)
1,4% des usagers (8.841 individus)
0,27% des usagers (1.716 individus)
0,49% des usagers (3.081 individus)
Commentateur moyen
(50 à 140 caractères)
#emotifs
#rationnels
27 catégories d’usagers possibles
Document strictement confidentiel 29
@solitaires
@sociaux
@faible
@solitaires
@sociaux
@faible
@sociaux
@faible
@solitaires 13,06% des usagers (19.262 individus)
0,12% des usagers (760 individus)
0,05% des usagers (339 individus)
0,55% des usagers (3.464 individus)
0,04% des usagers (229 individus)
0,06% des usagers (361 individus)
0,25% des usagers (1.584 individus)
0,01% des usagers (58 individus)
0,03% des usagers (165 individus)
Critiques
Commentaires longs
(> 140 caractères)
#emotifs
#rationnels
En retenant les caractères dominants de la typologie
3 commentateurs sur 4 sont rationnels et solitaires
Document strictement confidentiel 30
76% des commentateurs publient leurs commentaires
de manière solitaire et rationnelle. Parmi eux, 6% sont
des commentateurs prolixes. En moyenne, leurs
messages sont supérieurs à la taille d’un tweet.
Pour 15% des commentateurs, s’exprimer est un moyen
d’affecter les autres de manière émotionnelle. Ils
utilisent un grand nombre d’émojis
Pour 9% des supporters, le commentaire assure une
fonction d’échange avec son cercle de connaissances.
Ces usagers ont mentionné plus d’amis que la
moyenne.
> Une audience extrêmement concentrée autour de quelques clubs (OM, PSG, OL), les supporters qui commentent plusieurs
clubs sont minoritaires (2,2%)
> Les audiences communes de commentateurs témoignent moins des rivalités historiques entre clubs, que de la nature des
contenus publiés. On observe des communautés de supporters par grands ensemble géographiques.
> Une minorité d’usagers (1%) engendre une part importante du volume des commentaires (17%). Ces proportions varient
fortement, les supporters les plus actifs du FC Metz engendrent plus d’1/3 des commentaires du club.
> Les profils de ces supporters témoignent de leur attachement au sport. Les supporters les plus actifs consomment des
contenus directement liés aux calendriers des clubs, tandis que les moins actifs interagissent avec les contenus les plus viraux.
> Plus d’une mention sur deux reste sans réponse. C’est un « manque à gagner » non négligeable pour les clubs, dont 17% des
usagers sont inactifs en moyenne.
> L’usage des émojis ou des mentions est très concentré. 80% des commentateurs publient de manière rationnelle et solitaire.
Principaux apprentissages
Une audience extrêmement concentrée autour de quelques clubs, de quelques
supporters très actifs et d’usages de
Document strictement confidentiel 31
Nous contacter
Erwan Le Nagard
erwan@themetricsfactory.com
Suivez notre actualité sur :
www.themetricsfactory.com
facebook.com/TheMetricsFactory
@metricsfactory
+TheMetricsFactory
LinkedIn

Contenu connexe

Plus de The Metrics Factory

Wake Up Your Audience 9 Online : Esport & Gaming
Wake Up Your Audience 9 Online : Esport & GamingWake Up Your Audience 9 Online : Esport & Gaming
Wake Up Your Audience 9 Online : Esport & GamingThe Metrics Factory
 
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...The Metrics Factory
 
Wake Up Your Audience 8 - Beyond Influence by The Metrics Factory
Wake Up Your Audience 8 - Beyond Influence by The Metrics FactoryWake Up Your Audience 8 - Beyond Influence by The Metrics Factory
Wake Up Your Audience 8 - Beyond Influence by The Metrics FactoryThe Metrics Factory
 
Wake Up Your Audience #7 - 2019, une année sportive
Wake Up Your Audience #7 - 2019, une année sportiveWake Up Your Audience #7 - 2019, une année sportive
Wake Up Your Audience #7 - 2019, une année sportiveThe Metrics Factory
 
Wake Up Your Audience #6 - Résultats Martech Challenge
Wake Up Your Audience #6 - Résultats Martech ChallengeWake Up Your Audience #6 - Résultats Martech Challenge
Wake Up Your Audience #6 - Résultats Martech ChallengeThe Metrics Factory
 
Une année de jeux vidéo sur YouTube
Une année de jeux vidéo sur YouTubeUne année de jeux vidéo sur YouTube
Une année de jeux vidéo sur YouTubeThe Metrics Factory
 
Wake Up Your Audience | CEO 2.0 : be online to lead offline
Wake Up Your Audience | CEO 2.0 : be online to lead offlineWake Up Your Audience | CEO 2.0 : be online to lead offline
Wake Up Your Audience | CEO 2.0 : be online to lead offlineThe Metrics Factory
 
Wake Up Your Audience : 7 conseils clés pour réveiller votre audience en 2019
Wake Up Your Audience : 7 conseils clés pour réveiller votre audience en 2019Wake Up Your Audience : 7 conseils clés pour réveiller votre audience en 2019
Wake Up Your Audience : 7 conseils clés pour réveiller votre audience en 2019The Metrics Factory
 
Dessine-moi un Tuto - Analyse des tutoriels beauté sur YouTube
Dessine-moi un Tuto - Analyse des tutoriels beauté sur YouTubeDessine-moi un Tuto - Analyse des tutoriels beauté sur YouTube
Dessine-moi un Tuto - Analyse des tutoriels beauté sur YouTubeThe Metrics Factory
 
IREP Forum 2017 - Analyse Influenceurs et médias distribués
IREP Forum 2017 - Analyse Influenceurs et médias distribuésIREP Forum 2017 - Analyse Influenceurs et médias distribués
IREP Forum 2017 - Analyse Influenceurs et médias distribuésThe Metrics Factory
 
Produire du contenu, c'est bien, l'évaluer, c'est mieux !
Produire du contenu, c'est bien, l'évaluer, c'est mieux !Produire du contenu, c'est bien, l'évaluer, c'est mieux !
Produire du contenu, c'est bien, l'évaluer, c'est mieux !The Metrics Factory
 
Wake Up Your Audience : 7 conseils clés pour réveiller votre audience
Wake Up Your Audience : 7 conseils clés pour réveiller votre audienceWake Up Your Audience : 7 conseils clés pour réveiller votre audience
Wake Up Your Audience : 7 conseils clés pour réveiller votre audienceThe Metrics Factory
 
Facebook, ils en font tout un fromage
Facebook, ils en font tout un fromageFacebook, ils en font tout un fromage
Facebook, ils en font tout un fromageThe Metrics Factory
 

Plus de The Metrics Factory (14)

Wake Up Your Audience 9 Online : Esport & Gaming
Wake Up Your Audience 9 Online : Esport & GamingWake Up Your Audience 9 Online : Esport & Gaming
Wake Up Your Audience 9 Online : Esport & Gaming
 
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
Comment démocratiser vos études sur les réseaux sociaux ? Un Webinar présenté...
 
Wake Up Your Audience 8 - Beyond Influence by The Metrics Factory
Wake Up Your Audience 8 - Beyond Influence by The Metrics FactoryWake Up Your Audience 8 - Beyond Influence by The Metrics Factory
Wake Up Your Audience 8 - Beyond Influence by The Metrics Factory
 
Wake Up Your Audience #7 - 2019, une année sportive
Wake Up Your Audience #7 - 2019, une année sportiveWake Up Your Audience #7 - 2019, une année sportive
Wake Up Your Audience #7 - 2019, une année sportive
 
Wake Up Your Audience #6 - Résultats Martech Challenge
Wake Up Your Audience #6 - Résultats Martech ChallengeWake Up Your Audience #6 - Résultats Martech Challenge
Wake Up Your Audience #6 - Résultats Martech Challenge
 
Une année de jeux vidéo sur YouTube
Une année de jeux vidéo sur YouTubeUne année de jeux vidéo sur YouTube
Une année de jeux vidéo sur YouTube
 
Wake Up Your Audience | CEO 2.0 : be online to lead offline
Wake Up Your Audience | CEO 2.0 : be online to lead offlineWake Up Your Audience | CEO 2.0 : be online to lead offline
Wake Up Your Audience | CEO 2.0 : be online to lead offline
 
Wake Up Your Audience : 7 conseils clés pour réveiller votre audience en 2019
Wake Up Your Audience : 7 conseils clés pour réveiller votre audience en 2019Wake Up Your Audience : 7 conseils clés pour réveiller votre audience en 2019
Wake Up Your Audience : 7 conseils clés pour réveiller votre audience en 2019
 
RETEX SportsPro OTT Summit
RETEX SportsPro OTT SummitRETEX SportsPro OTT Summit
RETEX SportsPro OTT Summit
 
Dessine-moi un Tuto - Analyse des tutoriels beauté sur YouTube
Dessine-moi un Tuto - Analyse des tutoriels beauté sur YouTubeDessine-moi un Tuto - Analyse des tutoriels beauté sur YouTube
Dessine-moi un Tuto - Analyse des tutoriels beauté sur YouTube
 
IREP Forum 2017 - Analyse Influenceurs et médias distribués
IREP Forum 2017 - Analyse Influenceurs et médias distribuésIREP Forum 2017 - Analyse Influenceurs et médias distribués
IREP Forum 2017 - Analyse Influenceurs et médias distribués
 
Produire du contenu, c'est bien, l'évaluer, c'est mieux !
Produire du contenu, c'est bien, l'évaluer, c'est mieux !Produire du contenu, c'est bien, l'évaluer, c'est mieux !
Produire du contenu, c'est bien, l'évaluer, c'est mieux !
 
Wake Up Your Audience : 7 conseils clés pour réveiller votre audience
Wake Up Your Audience : 7 conseils clés pour réveiller votre audienceWake Up Your Audience : 7 conseils clés pour réveiller votre audience
Wake Up Your Audience : 7 conseils clés pour réveiller votre audience
 
Facebook, ils en font tout un fromage
Facebook, ils en font tout un fromageFacebook, ils en font tout un fromage
Facebook, ils en font tout un fromage
 

La Ligue 1 sur Facebook - Analyse des commentaires

  • 1. La Ligue 1 sur Facebook : Analyse des supporters de Football via le prisme des commentaires Erwan Le Nagard – Décembre 2017
  • 2. 14.879 posts effectués par 23 clubs et la LFP sur 6 mois 1.510.491 commentaires impliquant 757.701 usagers Notre dataset Un jeu de données pour une connaissance inédite des supporters de football Document strictement confidentiel 2
  • 3. Les objectifs de l’étude Construire une typologie des supporters Document strictement confidentiel 3 Son activité Est-il actif ou non ? Quelle est l’intensité de son activité ? Son « économie » Comment répartit-il ses commentaires ? sur plusieurs pages, posts, … La manière dont il commente Ses commentaires sont-ils longs ? Contiennent-ils des mentions ou des emojis ? La manière dont il est affecté par les autres Est-ce que d’autres usagers lui répondent ?
  • 4. L’engagement des commentateurs est protéiforme Derrière un volume de commentaires, se cache une « économie » et des profils d’audience variés Document strictement confidentiel 4 La forme des fils de commentaires : - La richesse lexicale - Le capital émotionnel - Le capital conversationnel - L’empowerment Des critères d’activité : - Le volume de commentaires effectué - Le volume d’objets commentés (nombre de posts) - Le volume d’entités commentées (nombre de clubs)
  • 5. L’enjeu : démêler plusieurs millions de relations Modéliser les relations entre ces individus, leurs commentaires, les posts, les clubs… Document strictement confidentiel 5 La finalité : Concevoir de nouveaux indicateurs qui caractérisent les liens entre clubs et supporters Notre problématique : Comment interpréter un immense network graph ? La solution : Construire un modèle de relations exploitable pour interroger le graphe
  • 6. Les technologies mises en œuvre Neo4j intégré dans un écosystème de solutions Document strictement confidentiel 6 Collecte Pre-processing Connexion à la BDD Chargement des données Ajout / modification de données Traitements statistiques Requêtage Visualisation des données Exploration des résultats Visualisation de sous-graphes de tailles restreintes Traitement statistiques Export csv ACP, HCPC, classification
  • 7. Comment s’agrègent les communautés de supporters ? L’audience des clubs Document strictement confidentiel 7 +
  • 8. Une audience concentrée autour des « grands clubs » Trois clubs (OM, PSG et OL) cumulent plus de la moitié des commentateurs Document strictement confidentiel 8 L’audience est majoritairement masculineLes 45% restants se répartissent sur les 21 autres pages
  • 9. Mon club, mon commentaire, ma bataille… 97,8% des usagers n’ont commenté qu’un seul club. Document strictement confidentiel 9 La plupart des usagers concentrent leurs commentaires sur les publications d’un seul club. Néanmoins, la proportion d’audience partagée avec d’autres clubs est variable. Par exemple, ¼ des commentateurs du MHSC ont aussi commenté sur la page d’au moins un autre club. 6.511 commentateurs de l’OM (5% de l’audience totale) ont commenté sur la page d’au moins un autre club. L’OL et le PSG partagent moins de 1% de leur audience avec d’autres clubs.
  • 10. La carte de l’audience commune des clubs Une audience commune entre clubs qui témoigne moins de rivalités historiques, que de l’actualité. Document strictement confidentiel 10 Les rivalités historiques entre clubs ne s’expriment pas au travers des audiences communes. Néanmoins, on peut les trouver dans la sémantique des commentaires. Par exemple, seulement 14 usagers ont commenté à la fois la page du PSG et de l’OM. De même, il n’existe aucun commentateur commun entre Rennes et Guingamp. En revanche, ces flux semblent liés à une dimension locale (notamment dans les régions où les clubs sont proches – ex : Montpellier – Marseille – Monaco), et évoluent en fonction du calendrier du championnat. Réseau non-dirigé des audiences commune. La taille des liens correspond au nombre de commentateurs communs
  • 11. La carte de l’audience partagée des clubs La LFP est un acteur central pour le dynamisme digital des clubs Document strictement confidentiel 11 La LFP partage environ 15% de son audience avec les clubs. Pour ¼ des clubs, elle figure parmi les 3 principaux apporteurs d’audience (>1% de ses commentateurs). Certains clubs ont tendance à faire circuler l’audience (rapport liens entrants / liens sortants – basé ici uniquement sur les flux >1%) : l’ESTAC Troyes distribue plus de 1% de son audience à 6 autres clubs, mais ne capture plus de 1% d’audience qu’à un seul club. A l’inverse : L’AS Monaco et l’OM capturent l’audience de 5 autres clubs, mais ne distribue leur audience qu’à 2 autres. L’OL est isolé : il ne distribue jamais plus de 1% de son audience et ne capture pas de flux d’audience >1%. Réseau dirigé représentant le pourcentage d’audience partagée entre clubs. Les flux d’audience <1% des commentateurs ne sont pas tracés.
  • 12. Comment circule l’audience ? Des communautés de supporters, au cœur de l’économie des commentaires Document strictement confidentiel 12 La dynamique de l’audience, s’organise autour de 4 groupes de clubs : 1/ Un flux Ouest <> Est (en mauve) : Une audience connectée à la page de la LFP et aux clubs de l’Ouest (en mauve). Le FC Metz et l’ESTAC sont très connectés à la LFP, elle-même très connectée à la plupart des clubs de l’Ouest. 2/ Un flux Sud <> Nord (en jaune) : Une audience connectée à l’OM, l’AS Monaco et le LOSC, avec des clubs périphériques (MHSC, Amiens, Angers) 3/ Un flux Centre <> Est (en vert) : Une audience connectée à l’AS St Etienne (en vert), qui comprend l’OL, DFCO, ASNL et l’OGC Nice. 4/ Un flux périphérique (en bleu) : les clubs qui partagent finalement peu d’audience compose le dernier groupe (PSG, RC Strasbourg, SC Bastia, TFC, SMC et le Stade Rennais).
  • 13. Quel est le degré d’activité des supporters par club ? Profils d’activité des supporters Document strictement confidentiel 13 +
  • 14. Une typologie par critères d’activité Combien de posts effectués par le club, l’usager a-t-il commenté ? Document strictement confidentiel 14 L’Ultra 12 posts ou plus Le Ponctuel 1 seul post Le Spectateur Aucun post commenté L’Occasionnel 2 à 11 posts
  • 15. L’engagement des audiences Les 1% de commentateurs les plus actifs publient en moyenne 33 messages Document strictement confidentiel 15 61,3% des usagers, les moins actifs 20,7% des usagers 1% des usagers, les plus actifs a publié 17,5% des commentaires 43,8% des commentaires A publié 38,7% des commentaires 16,9% des usagers sont spectateurs 33,3 commentaires en moyenne 4,1 commentaires en moyenne 1,3 commentaire en moyenne « Ultras » « Occasionnels » « Spectateurs » « Ponctuels » 7953 users 157.124 users 464.306 users 128.318 users 264.955 commentaires 661.276 commentaires 584.260 commentaires 757.701 usagers 1.510.491 commentaires
  • 16. L’engagement des audiences, par club Le PSG rencontre un soucis d’activation : le club possède plus de spectateurs que de commentateurs fréquents, les commentateurs ponctuels contribuent à 72% du total de commentaires Document strictement confidentiel 16
  • 17. Activation des commentateurs Plus d’1 mention sur 2 n’obtient pas de réponse, ce qui représente un large manque à gagner pour certains clubs Document strictement confidentiel 17 Le pourcentage de commentateurs (on retranche les spectateurs) Le pourcentage de sollicitations (mentions) ayant obtenu une réponse Le volume de sollicitations n’ayant pas obtenu de réponse Le volume d’usagers mentionnés, qui n’ont pas répondu
  • 18. 20% des usagers exposés par le PSG sont des spectateurs ; le club pourrait potentiellement prendre la 1ère position en volume de commentateurs actifs. L’AS St Etienne a mieux activé ses commentateurs et cumule le 5e volume de commentaires le plus important, devançant ainsi les Girondins de Bordeaux (5e position potentielle, 6e effective) De la même manière, le SC Bastia bénéficie d’un taux remarquable d’activation et se positionne en 19e position en volume de commentaires (vs 22e potentiellement), dépassant le SMC (20e), EA Guingamp (21e) et le Toulouse FC (22e) Quel est le potentiel d’activation des clubs ? L’AS St Etienne performe bien, à l’inverse du PSG Document strictement confidentiel 18 Potentiel d’activation
  • 19. Quels contenus privilégient chaque type d’usagers ? Document strictement confidentiel 19 Sur la base des posts ayant obtenu plus de 30 commentaires, nous calculons la proportion de chaque type de commentateur. Nous réalisons une ACP afin de positionner les posts selon deux dimensions : un premier axe oppose les posts avec une forte proportion de ponctuels, à ceux commenté par des usagers plus réguliers ; un second axe oppose les posts commentés par une forte proportion d’ultras vs des occasionnels Une classification hiérarchiques (HCPC) permet de distinguer 3 groupes de posts. Posts avec une forte proportion de Ponctuels Posts avec une forte proportion d’Occasionnels Posts avec une forte proportion d’Ultras
  • 20. Les posts qui génèrent le plus de commentateurs ponctuels Les contenus les plus viraux, les faits marquants, les moments exceptionnels Document strictement confidentiel 20 97,5% des commentateurs de ce post n’ont jamais re- commenté d’autres posts de clubs 65% des commentateurs de ce post n’ont jamais re- commenté d’autres posts de clubs 85,5% des commentateurs de ce post n’ont jamais re- commenté d’autres posts de clubs.
  • 21. Les posts privilégiés par les « occasionnels » Les concours, les pronostics Document strictement confidentiel 21 ¾ des commentateurs de ces publications sont des « occasionnels »
  • 22. Les posts privilégiés par les « Ultras » Les résultats de match, les alignements de départ, les albums de match Document strictement confidentiel 22 Plus d’1 commentateur sur 2 de ces publications sont des « ultras ». Les ultras représentent une population intimement liée au calendrier du club : ils commentent régulièrement la page du club, parce qu’ils ont vu ou assisté aux matchs.
  • 23. - Les commentateurs ponctuels réagissent à des contenus émotionnels (le but incroyable, le contenu drôle, l’événement marquant…). En moyenne, les posts privilégiés par les Ponctuels ont obtenu 300 commentaires, tandis que ceux privilégiés par les Ultras n’ont obtenu que 70 commentaires. Ainsi, un club comme le PSG qui réalise des contenus originaux et viraux compte une forte proportion de commentateurs ponctuels. - Le mode d’accès au contenu est probablement différent selon le type d’usagers. En moyenne, 1/4 des commentaires des posts privilégiés par les commentateurs ponctuels contiennent au moins une mention, tandis que cette proportion est seulement de 8% pour les posts privilégiés par les ultras. Autrement dit, les « Ultras » sont probablement en grande partie des abonnés qui consultent régulièrement la page du club (accès direct ou organic reach), tandis que les ponctuels proviennent probablement du média payé ou gagné. - Enfin, ces différentes catégories d’usagers témoignent d’un engagement plus ou moins fort envers le club : on parle du club dans les moments forts ou quand on y est exposé de manière émotionnelle (ponctuels), on participe à la vie du club au rythme de son calendrier (ultras), on profite pour s’engager plus lorsque le club nous en offre l’occasion (occasionnels particulièrement attirés par les concours). L’émotion ou la raison ? La proportion de chaque type d’usagers est étroitement liée à la capacité du club à activer et à fidéliser son audience Document strictement confidentiel 23 Le PSG montre les coulisses du club sous forme de contenus où le commentaire devient viral, ici Cavani joue au basket. 95% des commentateurs n’ont jamais recommenté d’autres posts
  • 24. De quelle manière les supporters commentent les clubs ? Profils d’engagement Document strictement confidentiel 24 +
  • 25. Une typologie par forme d’engagement Quel type de commentaire publie-t-il ? Document strictement confidentiel 25 Le social Il mentionne une variété de connaissances L’émotif Il partage ses émotions par une variété d’émojis Le critique Il use d’un vocabulaire prolixe, ses commentaires sont longs Variable retenue : la longueur moyenne des commentaires Variable retenue : le nombre total de connaissances mentionnés Variable retenue : le nombre total d’emojis utilisés Son opposé : Le solitaire Son opposé : Le rationnel Son opposé : Le laconique
  • 26. Validation des variables Trois caractères dominants pour l’audience Document strictement confidentiel 26 Chaque usager est bien décrit par nos variables retenues : la moyenne de la longueur de ses commentaires, la somme des émojis utilisés et le total de ses connaissances mentionnées. Pour chaque usager, nous allons décrire ses commentaire selon 3 niveaux d’usages : - La longueur des commentaires sera courte, moyenne ou longue - La somme des émojis sera nulle, faible ou élevée - Le nombre de connaissances mentionnées sera nulle, faible ou élevée Toutes les catégories identifiées n’auront pas forcément de sens, et nous les agrégerons de manière à obtenir des catégories qui décrivent au mieux les populations d’usagers.
  • 27. 27 catégories d’usagers possibles Document strictement confidentiel 27 @solitaires Laconiques Commentaires courts (0 à 50 caractères) @sociaux @faible @solitaires @sociaux @faible @sociaux @faible @solitaires 35,98% des usagers (226.476 individus) 14,17% des usagers (89.190 individus) 3,59% des usagers (22.621 individus) 7,21% des usagers (45.374 individus) 1,37% des usagers (8.653 individus) 3,02% des usagers (18.989 individus) 4,17% des usagers (26.227 individus) 0,59% des usagers (3.718 individus) 2,04% des usagers (12.836 individus) #emotifs #rationnels
  • 28. 27 catégories d’usagers possibles Document strictement confidentiel 28 @solitaires @sociaux @faible @solitaires @sociaux @faible @sociaux @faible @solitaires 12,59% des usagers (79.241 individus) 1,91% des usagers (12.025 individus) 1,36% des usagers (8.551 individus) 3,04% des usagers (19.128 individus) 0,73% des usagers (4.611 individus) 0,99% des usagers (6.246 individus) 1,4% des usagers (8.841 individus) 0,27% des usagers (1.716 individus) 0,49% des usagers (3.081 individus) Commentateur moyen (50 à 140 caractères) #emotifs #rationnels
  • 29. 27 catégories d’usagers possibles Document strictement confidentiel 29 @solitaires @sociaux @faible @solitaires @sociaux @faible @sociaux @faible @solitaires 13,06% des usagers (19.262 individus) 0,12% des usagers (760 individus) 0,05% des usagers (339 individus) 0,55% des usagers (3.464 individus) 0,04% des usagers (229 individus) 0,06% des usagers (361 individus) 0,25% des usagers (1.584 individus) 0,01% des usagers (58 individus) 0,03% des usagers (165 individus) Critiques Commentaires longs (> 140 caractères) #emotifs #rationnels
  • 30. En retenant les caractères dominants de la typologie 3 commentateurs sur 4 sont rationnels et solitaires Document strictement confidentiel 30 76% des commentateurs publient leurs commentaires de manière solitaire et rationnelle. Parmi eux, 6% sont des commentateurs prolixes. En moyenne, leurs messages sont supérieurs à la taille d’un tweet. Pour 15% des commentateurs, s’exprimer est un moyen d’affecter les autres de manière émotionnelle. Ils utilisent un grand nombre d’émojis Pour 9% des supporters, le commentaire assure une fonction d’échange avec son cercle de connaissances. Ces usagers ont mentionné plus d’amis que la moyenne.
  • 31. > Une audience extrêmement concentrée autour de quelques clubs (OM, PSG, OL), les supporters qui commentent plusieurs clubs sont minoritaires (2,2%) > Les audiences communes de commentateurs témoignent moins des rivalités historiques entre clubs, que de la nature des contenus publiés. On observe des communautés de supporters par grands ensemble géographiques. > Une minorité d’usagers (1%) engendre une part importante du volume des commentaires (17%). Ces proportions varient fortement, les supporters les plus actifs du FC Metz engendrent plus d’1/3 des commentaires du club. > Les profils de ces supporters témoignent de leur attachement au sport. Les supporters les plus actifs consomment des contenus directement liés aux calendriers des clubs, tandis que les moins actifs interagissent avec les contenus les plus viraux. > Plus d’une mention sur deux reste sans réponse. C’est un « manque à gagner » non négligeable pour les clubs, dont 17% des usagers sont inactifs en moyenne. > L’usage des émojis ou des mentions est très concentré. 80% des commentateurs publient de manière rationnelle et solitaire. Principaux apprentissages Une audience extrêmement concentrée autour de quelques clubs, de quelques supporters très actifs et d’usages de Document strictement confidentiel 31
  • 32. Nous contacter Erwan Le Nagard erwan@themetricsfactory.com Suivez notre actualité sur : www.themetricsfactory.com facebook.com/TheMetricsFactory @metricsfactory +TheMetricsFactory LinkedIn