Ein Bild sagt mehr als 1000 Worte. Ansprechende Visualisierungen von Online-Netzwerken ermöglichen die Darstellung großer Datenmengen und das Erkennen von Zusammenhängen, die sonst vielleicht im Datenmaterial verloren gingen.
Ich erläutere Grundlagen der Social Network Analysis, basierend auf meinem Lernprozess im MOOC „Social Network Analysis“ im Herbst 2014 (Coursera, Univ. of Michigan, Lada Adamic) und stelle Modelle und wichtige Parameter der Social Network Analysis vor sowie erste Erfahrungen mit der Anwendung dieser Visualisierungen auf meine Online-Gruppen.
6. !
Warum SNA?
!
• Verstehen durch Visualisieren
Definitionen
• Netzwerk: Set von verbunden Knoten (sozial: durch Beziehungen
verbunden)
• Knoten: Personen, Orte … (nodes, actors, sites, vertices)
• Verbindungen: Beziehungen (edges, ties, relations)
• Netzwerke können als Graphen dargestellt werden
6
7. Fragen, Betrachtungsweisen
Zur Netzwerkstruktur
• Sind die Knoten miteinander verbunden? Wie weit sind sie
voneinander entfernt? Sind einige Knoten wichtiger als andere?
Gibt es im Netzwerk Communities?
Formen von Netzwerken
• Zufallsgenerierte oder bevorzugte Verbindungen, Kleine-Welt-
Netzwerke
7
8. • Verbindungen im Netzwerk sind gerichtet/orientiert
oder un-gerichtet
• Die Verbindung kann ein „Gewicht“ haben.
• Ein Knoten kann mehrere Verbindungen
haben - Grad (degree)
A kommuniziert mit B
A kommuniziert mit B und umgekehrt
A kommuniziert 4mal mit B
Verbindungen
8
Kommunikation
einer Studierendengruppe
auf google+ 4 Tage
9. Erdős-Rényi Graph
• einfaches Netzwerkmodell mit fixer Knotenanzahl
• Annahme 1: Knoten verbinden sich zufällig
• Annahme 2: Netzwerk ist ungerichtet
• Annahme 3: N Knoten, M Verbindungen, p Wahrscheinlichkeit,
dass sich zwei Knoten verbinden
• es erscheinen keine „Hubs“ (sehr gut verbundene Knoten), aber
„Giant Component“
9
10. reale Netzwerke wachsen
Erweiterungen des Erdős-Rényi Ansatzes
• wachsende Netzwerke, etwa das WWW, Citation Network
Modelle
• Random Preferential: neue Knoten verbinden sich lieber mit
gut vernetzten Knoten
• Introduction Model: Knoten werden einander „vorgestellt“
• Static Geographic Model: Knoten verbinden sich mit den
Nachbarn der mit ihnen verbundenen Knoten
10
11. Barabasi-Albert Modell
• jeder Knoten verbindet sich mit anderen Knoten mit
einer gewissen Wahrscheinlichkeit abhängig von
seinem Grad (wie viele Verbindungen der Knoten
selbst hat)
• der Prozess startet mit einer Anfangskonfiguration
• jeder neue Knoten kommt mit einer Möglichkeit von
m Verbindungen zum Netzwerk
11
12. Zentralität / Centrality
Welche Rolle spielen die Knoten im Netzwerk?
wichtiger Parameter: average shortest path
!
!
!
!
Freeman’s formula for centralization
12
13. 13
Degree Centrality - Grad-Zentralität
Knoten mit hoher Grad-Zentralität sind aktive
Player im Netzwerk, gut vernetzt
14. 14
Betweeness Centrality - Betweeness-
Zentralität
„Broker“ - über diesen Knoten läuft alle Kommunikation links nach rechts
und umgekehrt
Fällt dieser Knoten aus dem Netzwerk, bricht die Verbindung zusammen
15. 15
Closeness - Nähe
Die Entfernung dieses Knoten zu allen anderen - es reicht nahe einem
gut vernetzten Knoten (Hub) zu sein
16. 16
Eigenvector Centrality - Eigenvektor-
Zentralität
Ein Knoten ist umso wichtiger, je wichtiger seine Nachbarn sind.
17. Communities finden
Was macht eine Community / Substruktur aus?
• Es gibt viele Verbindungen innerhalb der Community
• Jede/r andere ist nur ein paar Hops entfernt
• Knoten derselben Community sind stark miteinander verbunden
Auffinden von Communities ist schwierig, Anzahl der Communities unbekannt, kleine /
große Communities
• minimum cut: vorgeschriebene Anzahl von Gruppen, die möglichst wenig miteinander
verbunden sind
• hierarchisches Clustern: Clustern nach gewissen Eigenschaften
• betweennes Clustering: Verbindungen mit höchster Betweenness werden gelöscht
17
18. 18
Problem: wann hört man auf, Verbindungen zu löschen?
!
=> Modularität - Vergleich, wie viele Verbindungen es innerhalb /
außerhalb der Community gibt
!
In einem Netzwerk wachsen die Verbindungen innerhalb eine
Community, während sie zu Knoten außerhalb abnehmen
http://spark-public.s3.amazonaws.com/sna/other/guess/betweennessclust.html
20. Visualisierungssoftware
Netlogo!
• programmable modeling environment for simulating natural and social
phenomena
• Free, open source - cross-platform: runs on Mac, Windows, Linux, et al
• https://ccl.northwestern.edu/netlogo
Gephi!
• interactive visualization and exploration platform for networks and complex
systems, dynamic and hierarchical graphs.
• Runs on Windows, Linux and Mac OS X. Gephi is open-source and free.
• http://gephi.github.io/
20
26. Visualisierung
von Online-
Gruppen
Trainingskurs 14/15
1 Semester
Moodle - Interaktion: wer antwortet wem
Interaktionen mit sich selbst wurden gelöscht 26
Knotengröße
gemäß Grad /
Degree
!
Farbe gemäß
Betweenness
2 Communities
27. Mein Fazit
• Die SNA gibt mit eine neue Einsicht in meine Online-
Gruppen (Broker, Communities), die ich allerdings noch
nicht ganz verstehe ….
• SNA hat ein großes Potential, ist jedoch auch recht
komplex
• Mit dem aktuellen Datenmaterial: weitere Beschäftigung
mit den Optionen von Gephi
• Zukunft: weitere Beschäftigung mit der Datengenerierung
(etwa cope15 MOOC, Twitter, Facebook, Google+)
27