Présentation française de l'outil d'analyse des réseaux sociaux NodeXL de la fondation SMR du Dr Marc Smith.
Traduit et adapté par M. Cyrille Papon, doctorat à l'ED 509 de l'université du sud Toulon Var, membre du laboratoire I3M & IRENav.
2013 smrf-nodexl-sna-socialmedia-fr version -130320011951-phpapp01-1 2
1. Etablirunebibiothèque
des relations sur les
médiassociaux:
Elaborer des
graphesrelationnels et
effectuer des
mesuresàl’aide de
NodeXL
Un projet de la fondation de recherchesur les médiassociaux: http://www.smrfoundation.org
Translated&adapted in french by Cyrille Papon - PhDstudent in SOCMINT / SONEINT
– AMISNI Project – TLN Univ/I3M/IRENav/FMES
Traduit et adapté en français par Cyrille Papon – étudiant en thèse SIC en
R2SI / RMSI – projet MAR2SI – Univ TLN/I3M/IRENav/FMES
2. About Me
Qui suis-je ?
Marc A. Smith
Docteur en sciences humaines et sociales
Groupe “Connected Action Consulting”
Marc@connectedaction.net
http://www.connectedaction.net
http://www.codeplex.com/nodexl
http://www.twitter.com/marc_smith
http://delicious.com/marc_smith/Paper
http://www.flickr.com/photos/marc_smith
http://www.facebook.com/marc.smith.sociologist
http://www.linkedin.com/in/marcasmith
http://www.slideshare.net/Marc_A_Smith
http://www.smrfoundation.org
3. La fondation de recherchesur les médiassociaux
http://smrfoundation.org
15. Réseaux
sociaux
• Histoire:
Unecertaine
antériorité.
• Théorie et
méthode:
1934 ->
• Jacob L.
Moreno
• http://en.wiki
pedia.org/wiki
/Jacob_L._Mor
eno
Jacob Moreno’s early social network diagram of positive and negative relationships among members of a football
team.
Originally published in Moreno, J. L. (1934). Who shall survive? Washington, DC: Nervous and Mental Disease
Publishing Company.
16. A nearly social network diagram of relationships among workers in a factory
illustrates the positions different workers occupy within the workgroup.
Originally published in Roethlisberger, F., and Dickson, W. (1939). Management and
the worker. Cambridge, UK: Cambridge University Press.
37. Un réseau simple peutillustrer
les
différentesvaleursquepeuvent
prendre les noeuds du réseau:
centralité et dégré
38.
39. POLARISEE: Deux clusters denses avec
peud’interconnexions
INTER-RESEAU: Des clusters identifiés
et isolés, avec des
interconnexionsimportantes.
SUJET PUBLIC/MARKETING: De
nombreux clusters isolés en
petitsgroupesfaiblementinterconnecté
s.
BAZAAR: De nombreuxclusters de
taillemoyenne, certainssi
isolés.
DIFFUSION: Un hub qui estretweeté
par de nombreuxabonnés non
interconnectés.
SUPPORT: Un hub qui répondà de
nombreuxabonnés non
interconnectés.
47. La théorie des réseaux
http://en.wikipedia.org/wiki/Social_network
• Principe majeur:
les structures socialesémergent de
l’ensemble des relations parmi les
individusd’une population.
• Phénomèned’intérêt:
l’émergence des groupesou des clusters
àpartir de configurations de relations
entre les individus – centralité
(noyau), périphérie
(noeudsisolés), proximité, diamètre, inter
médiarité.
• Methodes :
enquêtes, interviews, observations, analysis
de fichiers, calculmatriciel
(Hampton &Wellman, 1999; Paolillo, 2001;
Wellman, 2001)
Source: Richards, W.
(1986). The NEGOPY
network analysis
program. Burnaby, BC:
Department of
Communication, Simon
Fraser University. pp.716
48. L’analyse des réseaux
• “Node/vertex” ounoeud
– acteursurlequel la relation agit; réseauorientéou non-orienté.
• “Edge/link” ou lien
A
– Relation connectant les noeuds; peutêtredirectionnel.
• “Cohesive Sub-Group” ou cluster
B
– Groupefortementconnectéou cluster.
C
• “Key Metrics” ouprincipalesmesures
A B D E
– “Centrality” oucentralité (mesureindividuelleou pour un groupe)
• Nombre de connections directesqu’unindividupossède avec les autresindividusdans un groupe
(généralementàpartir des connexionsentrantes) ;
• Mesure au niveauindividuel (noeud) ou au niveau du groupe (composantconnectéou cluster).
D
– “Average shortest path” oudiamètre (mesure pour un groupe)
E
• Facilité avec laquelle un réseau se connecte et s’interconnecte ;
• Série de mesurecalculant le chemin le plus court entre les pairs de noeuds au niveau du réseau,
reflètant la distance moyenne du réseau.
– “Density”oudensité(group measure)
• Robustesse du réseau ;
• Nombre de connexions qui existe au sein d’un groupe par rapport au nombre maximum de
connexions.
– “Betweenness” ouintermédiarité (mesureindividuelle)
G
F
H
I
• Nombre de chemins les plus courts entre chaque pair de noeudsincluant le noeudconcerné ;
• Mesure au niveauindividuel (du noeud)
• “Node roles” ourôle des noeuds
– Periphérique– en-deça de la centralitémoyenne
du réseau
– Noeud central – au-dessus de la centralitémoyenne
du réseau
– Broker – au-dessus de l’intermédiaritémoyenne
du réseau
C
E
D
49. NodeXL : Uneextension gratuited’Excel 2007/10/13 pour l’analyse des
réseauxsociaux
Simplifier l’emploi de la théorie des graphes en produisant un graphecomplet,
avec des mesuresintégrées.
51. Le but: simplifier l’analyse des
réseauxsociaux
• Les outilsd’analyse des
réseauxsociauxexistantssont complexes pour
les utilisateursdébutants ;
• Les outilscomme Excel
sontlargementemployés ;
• La production d’un tableurhôte pour l’analyse
des réseauxsociauxfacilitel’analyse et la
visualisation des données.
58. This graph represents a directed network of 1,360 Twitter users whose recent tweets
contained "contraceptive OR contraception". The network was obtained on Friday,
08 June 2012 at 13:22 UTC. There is an edge for each follows relationship. There is
an edge for each "replies-to" relationship in a tweet. There is an edge for each
"mentions" relationship in a tweet. There is a self-loop edge for each tweet that is
not a "replies-to" or "mentions". The tweets were made over the 2-day period from
Thursday, 07 June 2012 at 18:46 UTC to Friday, 08 June 2012 at 13:06 UTC. The
graph's vertices were grouped by cluster using the Clauset-Newman-Moore cluster
algorithm. The edge colors are based on relationship values. The vertex sizes are
based on each user’s number of followers. Table 1 reports the summary network
metrics that describe the graph.
59.
60. Cettefeuille de calculliste les sommets (comptes Twitter) qui
ontcontribué au Tweet contenant les termes “contraception
OR contraceptives” durant 2 jours en juin 2012. Les
utilisateurssontclassés en fonction de la
“centralitéd’intermédiarité” calculée par rapport au niceau
de suivi, de réponse, et de mention des arêtes. Inclu les
comptes Twitter:
@thinkprogress, @gatesfoundation, @SandraFluke, @male
eek, @Change, @foxandfriends, @melindagates, @AshleyJu
dd, @cnalive, and @SOHLTC.
61. Welser, Howard T., Eric Gleave, Danyel Fisher, and Marc
Smith. 2007. Visualizing the Signatures of Social Roles
in Online Discussion Groups.
The Journal of Social Structure. 8(2).
Experts and “Answer People”
Discussion starters, Topic setters
Discussion people, Topic setters
64. Le contenu de la synthèse de la feuille de
calculNodeXLmontre les URL’s les plus fréquentes, les
hashtags les plus fréquents, et les comptesabonnées les
plus importantsàl’intérieur du réseau et des sous-groupes
du réseau.
71. Paramètres de téléchargement des
données : suivi des relations – suivi
des réponses – suivi des mentions –
suivi des Tweets
Paramètres de limitation des noeuds
du réseau, des Tweets et de
statistiques
82. People
Disciplines
Institutions
University
Faculty
Computer Science
University of Maryland
Students
HCI, CSCW
Oxford Internet Institute
Industry
Machine Learning
Stanford University
Independent
Information Visualization
Microsoft Research
Researchers
UI/UX
Illinois Institute of
Technology
Developers
Social Science/Sociology
Connected Action
Network Analysis
Cornell
Collective Action
Morningside Analytics
83. • Développer le “FireFox des fichiers type GraphML” de l’analyse des
réseauxsociaux, avec des outils simples et facilementexploitables ;
• Connecter les utilisateurs de l’analyse des réseauxsociauxen
facilitant la lecture et la compréhension des graphes;
• Permettre aux chercheurs de se consulter et de travaillersurdes
bases de donnéesimportantes;
• Collecter et rassemblerune large base de données en analyse des
réseauxsociaux par les utilisateurseux-mêmes ;
• Créer un accèslibreaux publications et aux moteurs de recherche ;
• Rendre les “collections de connexions” facile à employer pour les
utilisateurs.
85. • Unebibliothèque de
fichiersd’analyse des
réseauxsociaux:
NodeXLGraphGallery.org
– Une collection de graphesréseaux,
de sets de données et de
commentairespubliés par les
utilisteurs ;
– Une base de donnée collective
disponible pour la communauté de
recherche ;
– Des collections de
donnéespubliéessur un large panel
de sujetsfacilitant le travail des
étudiants et des chercheursdans le
domaine de l’analyse des
réseauxsociaux.
86.
87.
88. • PorterNodeXLvers le Web: (Node[NOT]XL)
– NodeXL pour les feuilles de calcul de GoogleDocs ?
– WebGL Canvas? D3.JS? Sigma.JS ?
• Se connecter àd’
autres sources de données:
– RDF, MediaWikis, Gmail, NYT, Citation Networks
• Résoudre les problèmes de manipulations réseaux via
l’interfaceutilisateur:
– Transformation modale,sériestemporelles, affichagesautomatiques
• Développer et maintenir les archives des collections de sets de
données des réseauxsociaux pour la recherche.
• Améliorerla formation en science des réseaux:
– Groupes de travail surl’analyse des réseauxsociaux
– Présentations et lectures au travers de sessions en public
– Vidéos et supports de formation à disposition des utilisateurs
89. •
•
•
•
•
•
Sponsoriserunecapacité du projetNodeXL
Sponsoriser les groupes de travail
Sponsoriser le travail d’un étudiant
Planifier des formations
Sponsoriser la fondation SRM
Apportervotresoutien au projet :
financier, programmation, stockage, formation, d
onnées, etc…
• Soutenir le travail de la fondation SRM
90.
91. Etablirunebibiothèque
des relations sur les
médiassociaux:
Elaborer des
graphesrelationnels et
effectuer des
mesuresàl’aide de
NodeXL
Un projet de la fondation de recherchesur les médiassociaux: http://www.smrfoundation.org
92. Translated&adapted in french by Cyrille Papon - PhDstudent in SOCMINT / SONEINT
– AMISNI Project – TLN Univ/I3M/IRENav/FMES
Traduit et adapté en français par Cyrille Papon – étudiant en thèse SIC en
R2SI / RMSI – projet MAR2SI – Univ TLN/I3M/IRENav/FMES
A tutorial on analyzing social media networks is available from: casci.umd.edu/NodeXL_TeachingDifferent positions within a network can be measured using network metrics.
The network of connections among people who tweeted “#My2K” over the 1-day, 21-hour, 39-minute period from Sunday, 06 January 2013 at 03:30 UTC to Tuesday, 08 January 2013 at 01:09 UTC.
The graph represents a network of 268 Twitter users whose recent tweets contained "#cmgrchat OR #smchat. The network was obtained on Friday, 18 January 2013 at 15:44 UTC. There is an edge for each follows relationship. There is an edge for each "replies-to" relationship in a tweet. There is an edge for each "mentions" relationship in a tweet. There is a self-loop edge for each tweet that is not a "replies-to" or "mentions". The tweets were made over the 3-day, 21-hour, 15-minute period from Monday, 14 January 2013 at 18:23 UTC to Friday, 18 January 2013 at 15:38 UTC.
The graph represents a network of 1,227 Twitter users whose recent tweets contained "lumia. The network was obtained on Saturday, 12 January 2013 at 19:52 UTC. There is an edge for each follows relationship. There is an edge for each "replies-to" relationship in a tweet. There is an edge for each "mentions" relationship in a tweet. There is a self-loop edge for each tweet that is not a "replies-to" or "mentions". The tweets were made over the 5-hour, 1-minute period from Saturday, 12 January 2013 at 14:36 UTC to Saturday, 12 January 2013 at 19:37 UTC.
The graph represents a network of 1,260 Twitter users whose recent tweets contained "flotus". The network was obtained on Friday, 18 January 2013 at 18:26 UTC. There is an edge for each follows relationship. There is an edge for each "replies-to" relationship in a tweet. There is an edge for each "mentions" relationship in a tweet. There is a self-loop edge for each tweet that is not a "replies-to" or "mentions". The tweets were made over the 3-hour, 3-minute period from Friday, 18 January 2013 at 15:16 UTC to Friday, 18 January 2013 at 18:20 UTC.
The graph represents a network of 399 Twitter users whose recent tweets contained "http://www.nytimes.com/2013/01/11/opinion/krugman-coins-against-crazies.html. The network was obtained on Friday, 11 January 2013 at 14:27 UTC. There is an edge for each follows relationship. There is an edge for each "replies-to" relationship in a tweet. There is an edge for each "mentions" relationship in a tweet. There is a self-loop edge for each tweet that is not a "replies-to" or "mentions". The tweets were made over the 12-hour, 32-minute period from Friday, 11 January 2013 at 01:52 UTC to Friday, 11 January 2013 at 14:24 UTC.
The graph represents a network of 388 Twitter users whose recent tweets contained "delllistens OR dellcares”. The network was obtained on Tuesday, 19 February 2013 at 17:44 UTC. There is an edge for each follows relationship. There is an edge for each "replies-to" relationship in a tweet. There is an edge for each "mentions" relationship in a tweet. There is a self-loop edge for each tweet that is not a "replies-to" or "mentions". The tweets were made over the 6-day, 21-hour, 58-minute period from Tuesday, 12 February 2013 at 19:34 UTC to Tuesday, 19 February 2013 at 17:33 UTC.