Analyse Folksonomy basierter Netzwerke als komplementärer Ansatz für Autorenempfehlungen in der Wissenschaft
1. Informationswissenschaft
Analyse von Folksonomy basierten Netzwerken
als komplementärer Ansatz für
Autorenempfehlungen in der Wissenschaft
22. März 2012
Tamara Heck – Abt. für Informationswissenschaft –
Heinrich-Heine-Universität Düsseldorf
2. DGI-Konferenz – Social Media und Web Science – Das Web als
Lebensraum – 22./23. März 2012 – Düsseldorf
3. Informationswissenschaft
Problemstellung
* Kooperationspartner für
* Bildung einer Community of Practice
* Workshop- /Konferenzbeitrag
* Co-Autor
* Ziel: Vorschlagen von relevanten Personen
für einen Zielautor More
like me!
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
4. Informationswissenschaft
Forschungsfragen
1. Können wir einem Zielautor ein Netzwerk mit
relevanten und neuen, unbekannten Autoren
anhand der Bookmarking-Dienste
vorschlagen?
2. Unterscheiden sich diese Ergebnisse von
denen, die mit Co-Zitationsanalyse und
Bibliographic Coupling gewonnen werden?
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
5. Informationswissenschaft
Methoden
* Co-Zitationsanalyse:
* Autoren a und b werden von Autor c co-zitiert
* Datensatz: Alle Autoren in den Referenzlisten
derjenigen Artikel, die Zielautor a zitieren
* Scopus:
* hat Co-Autoren in Referenzliste (Zhao &
Strotmann, 2011)
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
6. Informationswissenschaft
Methoden
* Bibliographic Coupling:
* Autoren a und b zitieren beide Autor d
* Datensatz: Alle Autoren derjenigen Artikel, die
mind. n gemeinsame Referenzen mit einem
Artikel von Zielautor a haben
* Web of Science:
* „related records“
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
7. Informationswissenschaft
Methoden
* Social Bookmarking-Dienst: CiteULike
* Nutzer-Ressource-Tag-Relationen
Tags
Nutzer
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
8. Informationswissenschaft
Methoden
* Collaborative Filtering mit Tags
Artikel
Artikel 1
von
von Ziel-
membrane Autor b
autor a
Artikel
von
Autor c
Artikel 2 red blood
von Ziel- cell
autor a
Artikel
Artikel 3
actin von
von Ziel- Autor d
autor a
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
9. Informationswissenschaft
Methoden
Tag-basiert: je mehr gemeinsame Nutzer-basiert: je mehr
Tags insgesamt (Artikel gemeinsame Nutzer insgesamt
übergreifend), desto größer die (Artikel übergreifend), desto
Ähnlichkeit. größer die Ähnlichkeit.
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
10. Informationswissenschaft
Ergebnisse
* 6 Physiker (FZ Jülich), 35-50 Jahre
* Publikationen von 2006 bis 2011
* 4 Cluster:
1. Co-Zitationen in Scopus: ACC-Cluster
2. Bibliogr. Coupling in WoS: BC-Cluster
3. CF Tag-basiert in CiteULike: CULT-Cluster
4. CF Nutzer-basiert in CiteULike: CULU-Cluster
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
11. Informationswissenschaft
Ergebnisse
* Ein Zielautor hatte keine Daten in CiteULike
* Bei einem Zielautor gab es keine Tags
* Cosinus-Werte bei BC niedriger, da Anzahl der
Referenzen hoch
* Cosinus-Werte in CULT und CULU höher, da
weniger Tags bzw. Nutzer
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
12. Informationswissenschaft
Ergebnisse
* Visualisierung der Cluster in Graphen
* Cosinus-Maß zwischen allen Autoren eines
Datensatzes
* Anpassung:
* Cosinus-Werte mit sim=1 in CiteULike entfernt,
wenn nur ein Tag bzw. Nutzer da
*Cosinus-Intervalle gesetzt zur
Übersichtlichkeit
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
15. Informationswissenschaft
Evaluation: Cluster-Bewertung
* 10 ähnlichste Autoren pro Cluster
Fragen an Probanden:
1. Wie wichtig ist der Autor für Ihre aktuelle Forschung
(Bewertung von “nicht wichtig” (1) bis sehr wichtig
(10))?
2. Fehlen in der Liste Autoren, die für Ihre aktuelle
Forschung wichtig sind?
Relevante Autoren = Autoren mit Bewertung ≥ 5 +
fehlende relevante Autoren
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
16. Informationswissenschaft
Evaluation: Cluster-Bewertung
CiteULike Cosinus- CiteULike Cosinus- Co- Cosinus- Cosinus-
Nutzer Maß Tags Maß Zitationen Maß BibCoup Maß
M. J. Biercuk 0.8660 P. Beliczynski 0.7385 Beliczynski, P. 0.8221 Zahab A 0.1150
P. Beliczynski 0.8660 C. M. Schneider
0.6742 Sapmaz, S. 0.5766 Kouwenhoven LP
0.0914
P. L. Mceuen 0.8660 C. Spudat 0.6742 Furer, J. 0.5150 Meyer JC 0.0700
C. M. Marcus 0.7500 C. Thomsen 0.6742 Weiss, M. 0.3899 Jourdain V 0.0696
C. Schönenberger
0.7500 J. Maultzsch 0.6742 Gräber, M.R. 0.3364 Paillet M 0.0690
M. R. Gräber 0.7500 K. Goss 0.6742 Oberholzer, S. 0.3012 Sauvajol JL 0.0679
M. Weiss 0.7500 L. Houben 0.6742 Hauptmann, J.R. 0.2543 Popov VN 0.0578
N. Mason 0.7500 M. Müller 0.6742 Coish, W.A. 0.2474 Prati E 0.0567
S. Oberholzer 0.7500 M. J. Biercuk 0.5330 Jarillo-Herrero, 0.2074 Monthioux M 0.0473
P.
C. Hoffmann 0.7071 H. I. Jorgensen0.5119 Grove-Rasmussen, K. Terrones M
0.1948 0.0442
D. Loss 0.7071 J. V. Holm 0.5025 Elzerman, J.M. 0.1755 Latempa R 0.0440
D. Roundy 0.7071 C. M. Marcus 0.4671 Pfund, A. 0.1709 Araujo PT 0.0433
E. D. Minot 0.7071 N. Mason 0.4671 Kouwenhoven, 0.1701 Jorio A
L.P. 0.0431
G. Cicero 0.7071 E. D. Minot 0.4558 Lindelof, P.E. 0.1651 Nakabayashi D0.0420
G. Lani 0.7071 K. Ishibashi 0.4558 Loss, D. 0.1590 Henrard L 0.0417
H. Ustunel 0.7071 C. Hoffmann 0.4523 Shorubalko, I. 0.1336 Michel T 0.0373
J. C. Grossman 0.7071 D. Loss 0.4523 Jørgensen, H.I.0.1239 Platero G 0.0341
J. Furer 0.7071 J. Furer 0.4523 Hoffmann, C. 0.1081 Rakov EG 0.0290
J. Park 0.7071 J. R. Hauptmann
0.4523 Flensberg, K. 0.0984 Cheng HM 0.0194
J. R. Hauptmann0.7071 S. Moriyama 0.4523 Schönenberger, C. 0.0950 Aguado R 0.0171
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
17. Informationswissenschaft
Evaluation: Cluster-Bewertung
Abdeckung der relevanten Autoren unter den Top 20
100%
Autoren eines Clusters
80%
60%
ACC
40% BC
CULU
20% CULT
0%
Autor Autor Autor Autor Autor Autor
1 2 3 4 5 6
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
18. Informationswissenschaft
Evaluation: Cluster-Bewertung
Überschneidung 64 67
der relevanten Scopus 27 Web of
Autoren über alle 12 Science
24 16
6 Zielautoren
70
CiteULike
ACC in CF in
Scopus BC in WoS CiteULike
Zielautor 1 ACC in Scopus 11 (3) 0 8
BC in WoS 0 4 (3) 1
CF in CiteULike 8 1 15 (6)
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
19. Informationswissenschaft
Evaluation: Graphen-Bewertung
Fragen an Probanden:
1. Würde dieser Graph mit Empfehlungen von
Autorenkollegen Ihnen helfen, z.B. bei der Organisation
eines Workshops oder um Kooperationspartner zu
finden?
2. Bezogen auf Frage 1: Wie relevant ist für Sie der Graph
(Bewertung von „nicht relevant“ (1) bis „sehr relevant“
(10))?
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
21. Informationswissenschaft
Fazit
1. Können wir einem Zielautor ein Netzwerk mit
relevanten und neuen, unbekannten Autoren anhand
der Bookmarking-Dienste vorschlagen?
* Ja, trotz teils geringer Datenmenge durchaus relevante
Autoren gefunden
* Cluster und Graphen zur Suche von
Kooperationspartnern geeignet
* Graphen geben einen Überblick über ähnliche Forscher
und Forschungsgebiete
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
22. Informationswissenschaft
Fazit
2. Unterscheiden sich diese Ergebnisse von denen, die
mit Co-Zitationsanalyse und Bibliographic Coupling
gewonnen werden?
* Mehr unbekannte, neue Autoren in CiteULike Cluster
* ACC und BC zeigen mehr bekannte Autoren
* Summe aller Cluster am Besten (ACC und BC vergl. Boyack &
Klavans, 2010; Gmur, 2003)
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
23. Informationswissenschaft
Weiteres Vorhaben
* Komplementierung der Cluster
* Wahl der Algorithmen
* Verbesserung der Visualisierung
Danke für Ihre Aufmerksamkeit
Präsentation auf Slideshare: Tamara Heck
Tamara.Heck@hhu.de
Tamara Heck – Analyse von Folksonomy basierten Netzwerken
24. Informationswissenschaft
Quellen
Boyack, K. W., & Klavans, R. (2010). Co-citation analysis, bibliographic coupling, and direct
citation. Which citation approach represents the research front most accurately? Journal of the
American Society for Information Science and Technology, 61(12), 2389-2404. doi:
10.1002/asi.21419
Gmur, M. (2003). Co-citation analysis and the search for invisible colleges. A methodological
evaluation. Scientometrics, 57(1), 27-57. doi: 10.1023/A:1023619503005
Marinho, L. B., Nanopoulos, A., Schmidt-Thieme, L., Jäschke, R., Hotho, A., Stumme, G., &
Symeonidis, P. (2011). Social tagging recommenders systems. In F. Ricci, L. Rokach, B. Shapira &
P.B. Kantor (Eds.), Recommender Systems Handbook (pp. 615-644). New York ,NY: Springer-
Verlag.
Zhao, D., & Strotmann, A. (2011). Counting first, last, or all authors in citation analysis.
Collaborative stem cell research field. Journal of the American Society for Information Science
and Technology, 62(4), 654-676. doi:10.1002/asi.21495
Tamara Heck – Analyse von Folksonomy basierten Netzwerken