The Metrics Factory publie une étude inédite sur la présence Facebook des clubs de Ligue 1. Via l'analyse d'1.5 Millions de commentaires, cette étude dresse le portrait des différents supporters.
La Ligue 1 sur Facebook - Analyse des commentaires
1. La Ligue 1 sur Facebook :
Analyse des supporters de Football via le prisme des
commentaires
Erwan Le Nagard – Décembre 2017
2. 14.879 posts effectués par 23 clubs et la LFP
sur 6 mois
1.510.491 commentaires impliquant
757.701 usagers
Notre dataset
Un jeu de données pour une connaissance inédite des supporters de football
Document strictement confidentiel 2
3. Les objectifs de l’étude
Construire une typologie des supporters
Document strictement confidentiel 3
Son activité
Est-il actif ou non ? Quelle est l’intensité de son activité ?
Son « économie »
Comment répartit-il ses commentaires ? sur plusieurs pages, posts, …
La manière dont il commente
Ses commentaires sont-ils longs ? Contiennent-ils des mentions ou des emojis ?
La manière dont il est affecté par les autres
Est-ce que d’autres usagers lui répondent ?
4. L’engagement des commentateurs est protéiforme
Derrière un volume de commentaires, se cache une « économie » et des profils d’audience variés
Document strictement confidentiel 4
La forme des fils de commentaires :
- La richesse lexicale
- Le capital émotionnel
- Le capital conversationnel
- L’empowerment
Des critères d’activité :
- Le volume de commentaires effectué
- Le volume d’objets commentés (nombre de posts)
- Le volume d’entités commentées (nombre de clubs)
5. L’enjeu : démêler plusieurs millions de relations
Modéliser les relations entre ces individus, leurs commentaires, les posts, les clubs…
Document strictement confidentiel 5
La finalité :
Concevoir de nouveaux indicateurs qui
caractérisent les liens entre clubs et supporters
Notre problématique :
Comment interpréter un immense
network graph ?
La solution :
Construire un modèle de relations exploitable pour
interroger le graphe
6. Les technologies mises en œuvre
Neo4j intégré dans un écosystème de solutions
Document strictement confidentiel 6
Collecte
Pre-processing
Connexion à la BDD
Chargement des données
Ajout / modification de
données
Traitements statistiques
Requêtage
Visualisation des données
Exploration des résultats
Visualisation de sous-graphes de tailles
restreintes
Traitement statistiques
Export csv
ACP, HCPC, classification
7. Comment s’agrègent les communautés de supporters ?
L’audience des clubs
Document strictement confidentiel 7
+
8. Une audience concentrée autour des « grands clubs »
Trois clubs (OM, PSG et OL) cumulent plus de la moitié des commentateurs
Document strictement confidentiel 8
L’audience est majoritairement masculineLes 45% restants se répartissent sur les 21 autres pages
9. Mon club, mon commentaire, ma bataille…
97,8% des usagers n’ont commenté qu’un seul club.
Document strictement confidentiel 9
La plupart des usagers concentrent leurs
commentaires sur les publications d’un
seul club.
Néanmoins, la proportion d’audience
partagée avec d’autres clubs est variable.
Par exemple, ¼ des commentateurs du
MHSC ont aussi commenté sur la page
d’au moins un autre club.
6.511 commentateurs de l’OM (5% de
l’audience totale) ont commenté sur la
page d’au moins un autre club.
L’OL et le PSG partagent moins de 1% de
leur audience avec d’autres clubs.
10. La carte de l’audience commune des clubs
Une audience commune entre clubs qui témoigne moins de rivalités historiques, que de l’actualité.
Document strictement confidentiel 10
Les rivalités historiques entre clubs ne s’expriment pas au
travers des audiences communes. Néanmoins, on peut les
trouver dans la sémantique des commentaires.
Par exemple, seulement 14 usagers ont commenté à la fois la
page du PSG et de l’OM. De même, il n’existe aucun
commentateur commun entre Rennes et Guingamp.
En revanche, ces flux semblent liés à une dimension locale
(notamment dans les régions où les clubs sont proches – ex :
Montpellier – Marseille – Monaco), et évoluent en fonction
du calendrier du championnat.
Réseau non-dirigé des audiences
commune. La taille des liens
correspond au nombre de
commentateurs communs
11. La carte de l’audience partagée des clubs
La LFP est un acteur central pour le dynamisme digital des clubs
Document strictement confidentiel 11
La LFP partage environ 15% de son audience avec les clubs. Pour ¼
des clubs, elle figure parmi les 3 principaux apporteurs d’audience
(>1% de ses commentateurs).
Certains clubs ont tendance à faire circuler l’audience (rapport liens
entrants / liens sortants – basé ici uniquement sur les flux >1%) :
l’ESTAC Troyes distribue plus de 1% de son audience à 6 autres
clubs, mais ne capture plus de 1% d’audience qu’à un seul club.
A l’inverse : L’AS Monaco et l’OM capturent l’audience de 5 autres
clubs, mais ne distribue leur audience qu’à 2 autres.
L’OL est isolé : il ne distribue jamais plus de 1% de son audience et
ne capture pas de flux d’audience >1%.
Réseau dirigé représentant le
pourcentage d’audience partagée
entre clubs. Les flux d’audience
<1% des commentateurs ne sont
pas tracés.
12. Comment circule l’audience ?
Des communautés de supporters, au cœur de l’économie des commentaires
Document strictement confidentiel 12
La dynamique de l’audience, s’organise autour de 4 groupes de clubs :
1/ Un flux Ouest <> Est (en mauve) : Une audience connectée à la page
de la LFP et aux clubs de l’Ouest (en mauve). Le FC Metz et l’ESTAC sont
très connectés à la LFP, elle-même très connectée à la plupart des clubs
de l’Ouest.
2/ Un flux Sud <> Nord (en jaune) : Une audience connectée à l’OM,
l’AS Monaco et le LOSC, avec des clubs périphériques (MHSC, Amiens,
Angers)
3/ Un flux Centre <> Est (en vert) : Une audience connectée à l’AS St
Etienne (en vert), qui comprend l’OL, DFCO, ASNL et l’OGC Nice.
4/ Un flux périphérique (en bleu) : les clubs qui partagent finalement
peu d’audience compose le dernier groupe (PSG, RC Strasbourg, SC
Bastia, TFC, SMC et le Stade Rennais).
13. Quel est le degré d’activité des supporters par club ?
Profils d’activité des supporters
Document strictement confidentiel 13
+
14. Une typologie par critères d’activité
Combien de posts effectués par le club, l’usager a-t-il commenté ?
Document strictement confidentiel 14
L’Ultra
12 posts ou plus
Le Ponctuel
1 seul post
Le Spectateur
Aucun post commenté
L’Occasionnel
2 à 11 posts
15. L’engagement des audiences
Les 1% de commentateurs les plus actifs publient en moyenne 33 messages
Document strictement confidentiel 15
61,3% des usagers, les
moins actifs
20,7% des usagers
1% des usagers, les
plus actifs
a publié 17,5% des
commentaires
43,8% des
commentaires
A publié 38,7% des
commentaires
16,9% des usagers
sont spectateurs
33,3 commentaires en
moyenne
4,1 commentaires en
moyenne
1,3 commentaire en
moyenne
« Ultras »
« Occasionnels »
« Spectateurs »
« Ponctuels »
7953 users
157.124 users
464.306 users
128.318 users
264.955 commentaires
661.276 commentaires
584.260 commentaires
757.701 usagers
1.510.491 commentaires
16. L’engagement des audiences, par club
Le PSG rencontre un soucis d’activation : le club possède plus de spectateurs que de commentateurs
fréquents, les commentateurs ponctuels contribuent à 72% du total de commentaires
Document strictement confidentiel 16
17. Activation des commentateurs
Plus d’1 mention sur 2 n’obtient pas de réponse, ce qui représente un large manque à gagner pour
certains clubs
Document strictement confidentiel 17
Le pourcentage de
commentateurs (on
retranche les spectateurs)
Le pourcentage de
sollicitations (mentions)
ayant obtenu une
réponse
Le volume de
sollicitations n’ayant pas
obtenu de réponse
Le volume d’usagers
mentionnés, qui n’ont
pas répondu
18. 20% des usagers exposés par le PSG sont des spectateurs ; le club
pourrait potentiellement prendre la 1ère position en volume de
commentateurs actifs.
L’AS St Etienne a mieux activé ses commentateurs et cumule le 5e
volume de commentaires le plus important, devançant ainsi les
Girondins de Bordeaux (5e position potentielle, 6e effective)
De la même manière, le SC Bastia bénéficie d’un taux remarquable
d’activation et se positionne en 19e position en volume de
commentaires (vs 22e potentiellement), dépassant le SMC (20e), EA
Guingamp (21e) et le Toulouse FC (22e)
Quel est le potentiel d’activation des clubs ?
L’AS St Etienne performe bien, à l’inverse du PSG
Document strictement confidentiel 18
Potentiel d’activation
19. Quels contenus privilégient chaque type d’usagers ?
Document strictement confidentiel 19
Sur la base des posts ayant obtenu plus de 30 commentaires, nous
calculons la proportion de chaque type de commentateur.
Nous réalisons une ACP afin de positionner les posts selon deux
dimensions : un premier axe oppose les posts avec une forte proportion
de ponctuels, à ceux commenté par des usagers plus réguliers ; un second
axe oppose les posts commentés par une forte proportion d’ultras vs des
occasionnels
Une classification hiérarchiques (HCPC) permet de distinguer 3 groupes de
posts.
Posts avec une forte
proportion de Ponctuels
Posts avec une forte
proportion
d’Occasionnels
Posts avec une forte
proportion d’Ultras
20. Les posts qui génèrent le plus de commentateurs ponctuels
Les contenus les plus viraux, les faits marquants, les moments exceptionnels
Document strictement confidentiel 20
97,5% des commentateurs de ce post n’ont jamais re-
commenté d’autres posts de clubs
65% des commentateurs de ce post n’ont jamais re-
commenté d’autres posts de clubs
85,5% des commentateurs de ce post n’ont jamais re-
commenté d’autres posts de clubs.
21. Les posts privilégiés par les « occasionnels »
Les concours, les pronostics
Document strictement confidentiel 21
¾ des commentateurs de ces publications sont des « occasionnels »
22. Les posts privilégiés par les « Ultras »
Les résultats de match, les alignements de départ, les albums de match
Document strictement confidentiel 22
Plus d’1 commentateur sur 2 de ces publications sont des « ultras ». Les ultras représentent
une population intimement liée au calendrier du club : ils commentent régulièrement la
page du club, parce qu’ils ont vu ou assisté aux matchs.
23. - Les commentateurs ponctuels réagissent à des contenus émotionnels (le but incroyable,
le contenu drôle, l’événement marquant…). En moyenne, les posts privilégiés par les
Ponctuels ont obtenu 300 commentaires, tandis que ceux privilégiés par les Ultras n’ont
obtenu que 70 commentaires. Ainsi, un club comme le PSG qui réalise des contenus
originaux et viraux compte une forte proportion de commentateurs ponctuels.
- Le mode d’accès au contenu est probablement différent selon le type d’usagers. En
moyenne, 1/4 des commentaires des posts privilégiés par les commentateurs ponctuels
contiennent au moins une mention, tandis que cette proportion est seulement de 8%
pour les posts privilégiés par les ultras. Autrement dit, les « Ultras » sont probablement en
grande partie des abonnés qui consultent régulièrement la page du club (accès direct ou
organic reach), tandis que les ponctuels proviennent probablement du média payé ou
gagné.
- Enfin, ces différentes catégories d’usagers témoignent d’un engagement plus ou moins
fort envers le club : on parle du club dans les moments forts ou quand on y est exposé
de manière émotionnelle (ponctuels), on participe à la vie du club au rythme de son
calendrier (ultras), on profite pour s’engager plus lorsque le club nous en offre l’occasion
(occasionnels particulièrement attirés par les concours).
L’émotion ou la raison ?
La proportion de chaque type d’usagers est étroitement liée à la capacité du club à activer et à
fidéliser son audience
Document strictement confidentiel 23
Le PSG montre les coulisses du club sous forme de contenus où
le commentaire devient viral, ici Cavani joue au basket. 95% des
commentateurs n’ont jamais recommenté d’autres posts
24. De quelle manière les supporters commentent les clubs ?
Profils d’engagement
Document strictement confidentiel 24
+
25. Une typologie par forme d’engagement
Quel type de commentaire publie-t-il ?
Document strictement confidentiel 25
Le social
Il mentionne une variété
de connaissances
L’émotif
Il partage ses émotions par
une variété d’émojis
Le critique
Il use d’un vocabulaire prolixe,
ses commentaires sont longs
Variable retenue :
la longueur moyenne des
commentaires
Variable retenue :
le nombre total de
connaissances mentionnés
Variable retenue :
le nombre total d’emojis
utilisés
Son opposé :
Le solitaire
Son opposé :
Le rationnel
Son opposé :
Le laconique
26. Validation des variables
Trois caractères dominants pour l’audience
Document strictement confidentiel 26
Chaque usager est bien décrit par nos variables retenues : la
moyenne de la longueur de ses commentaires, la somme des émojis
utilisés et le total de ses connaissances mentionnées.
Pour chaque usager, nous allons décrire ses commentaire selon 3
niveaux d’usages :
- La longueur des commentaires sera courte, moyenne ou longue
- La somme des émojis sera nulle, faible ou élevée
- Le nombre de connaissances mentionnées sera nulle, faible ou
élevée
Toutes les catégories identifiées n’auront pas forcément de sens, et
nous les agrégerons de manière à obtenir des catégories qui
décrivent au mieux les populations d’usagers.
27. 27 catégories d’usagers possibles
Document strictement confidentiel 27
@solitaires
Laconiques
Commentaires courts
(0 à 50 caractères)
@sociaux
@faible
@solitaires
@sociaux
@faible
@sociaux
@faible
@solitaires 35,98% des usagers (226.476 individus)
14,17% des usagers (89.190 individus)
3,59% des usagers (22.621 individus)
7,21% des usagers (45.374 individus)
1,37% des usagers (8.653 individus)
3,02% des usagers (18.989 individus)
4,17% des usagers (26.227 individus)
0,59% des usagers (3.718 individus)
2,04% des usagers (12.836 individus)
#emotifs
#rationnels
28. 27 catégories d’usagers possibles
Document strictement confidentiel 28
@solitaires
@sociaux
@faible
@solitaires
@sociaux
@faible
@sociaux
@faible
@solitaires 12,59% des usagers (79.241 individus)
1,91% des usagers (12.025 individus)
1,36% des usagers (8.551 individus)
3,04% des usagers (19.128 individus)
0,73% des usagers (4.611 individus)
0,99% des usagers (6.246 individus)
1,4% des usagers (8.841 individus)
0,27% des usagers (1.716 individus)
0,49% des usagers (3.081 individus)
Commentateur moyen
(50 à 140 caractères)
#emotifs
#rationnels
29. 27 catégories d’usagers possibles
Document strictement confidentiel 29
@solitaires
@sociaux
@faible
@solitaires
@sociaux
@faible
@sociaux
@faible
@solitaires 13,06% des usagers (19.262 individus)
0,12% des usagers (760 individus)
0,05% des usagers (339 individus)
0,55% des usagers (3.464 individus)
0,04% des usagers (229 individus)
0,06% des usagers (361 individus)
0,25% des usagers (1.584 individus)
0,01% des usagers (58 individus)
0,03% des usagers (165 individus)
Critiques
Commentaires longs
(> 140 caractères)
#emotifs
#rationnels
30. En retenant les caractères dominants de la typologie
3 commentateurs sur 4 sont rationnels et solitaires
Document strictement confidentiel 30
76% des commentateurs publient leurs commentaires
de manière solitaire et rationnelle. Parmi eux, 6% sont
des commentateurs prolixes. En moyenne, leurs
messages sont supérieurs à la taille d’un tweet.
Pour 15% des commentateurs, s’exprimer est un moyen
d’affecter les autres de manière émotionnelle. Ils
utilisent un grand nombre d’émojis
Pour 9% des supporters, le commentaire assure une
fonction d’échange avec son cercle de connaissances.
Ces usagers ont mentionné plus d’amis que la
moyenne.
31. > Une audience extrêmement concentrée autour de quelques clubs (OM, PSG, OL), les supporters qui commentent plusieurs
clubs sont minoritaires (2,2%)
> Les audiences communes de commentateurs témoignent moins des rivalités historiques entre clubs, que de la nature des
contenus publiés. On observe des communautés de supporters par grands ensemble géographiques.
> Une minorité d’usagers (1%) engendre une part importante du volume des commentaires (17%). Ces proportions varient
fortement, les supporters les plus actifs du FC Metz engendrent plus d’1/3 des commentaires du club.
> Les profils de ces supporters témoignent de leur attachement au sport. Les supporters les plus actifs consomment des
contenus directement liés aux calendriers des clubs, tandis que les moins actifs interagissent avec les contenus les plus viraux.
> Plus d’une mention sur deux reste sans réponse. C’est un « manque à gagner » non négligeable pour les clubs, dont 17% des
usagers sont inactifs en moyenne.
> L’usage des émojis ou des mentions est très concentré. 80% des commentateurs publient de manière rationnelle et solitaire.
Principaux apprentissages
Une audience extrêmement concentrée autour de quelques clubs, de quelques
supporters très actifs et d’usages de
Document strictement confidentiel 31
32. Nous contacter
Erwan Le Nagard
erwan@themetricsfactory.com
Suivez notre actualité sur :
www.themetricsfactory.com
facebook.com/TheMetricsFactory
@metricsfactory
+TheMetricsFactory
LinkedIn