Held on December 17th, 2012, as part of the Göttingen Center for Digital Humanities' lecture series on Internet and society. My thanks to Heidi Hanekop for the kind invitation.
http://www.gcdh.de/en/events/calendar-view/dr.-cornelius-puschmann-digitale-methoden-in-den-sozial-und-geisteswissenschaften-chancen-und-herausforderungen
Mehr Offenheit, bitte! Wikipedia und Creative Commons an der Schnittstelle zw...
Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herausforderungen
1. Digitale Methoden in den Sozial- und
Geisteswissenschaften: Chancen und
Herausforderungen
Dr. Cornelius Puschmann
Berlin School of Library and Information Science /
Humboldt Institute for Internet and Society
Göttingen Center for Digital Humanities
Ringvorlesung „Internet & Society“
17. Dezember 2012
2. Inhalt
#1
„Digitale Methoden“ -- ein
Einordnungsversuch
#2
Analysen anhand von Social Media-Daten
#3
Potentiale und Probleme
digitaler Methoden
3. „Internetforschung?“
Netz als Datenquelle
Netz als Gegenstand
Netz als Forschungsinfrastruktur
5. Durch das Internet und die steigende Beliebtheit von
Social Media-Diensten gewinnen Forschungsansätze für
den Umgang mit digitalen Kommunikationsdaten an
Relevanz:
• digital methods (Rogers, 2009)
• cultural analytics (Manovich, 2007)
• computational social science (Lazer et al, 2009)
10. Web 1.0
• kaum nutzergenerierte
Inhalte
• kein einfacher Zugriff auf
Daten (scraping)
Web 2.0
• große Menge nutzergenerierter
Inhalte
• besserer Zugriff auf Daten über
Programmierschnittstellen (APIs)
11. Zugang Kontrolle
TOS API
“law” regeln Umgang Daten ermöglicht Zugriff “code”
Besitz Interpretation
12. Was sind die Implikationen von „Big Data“?
“There are also significant questions of truth, control, and
power in Big Data studies: researchers have the tools and the
access, while social media users as a whole do not. Their data
were created in highly context-sensitive spaces, and it is entirely
possible that some users would not give permission for their
data to be used elsewhere.”
(boyd & Crawford, 2012, p.12)
13. Beispiel Twitter
• Mikroblog/Online-Kurznachrichtendienst,
gestartet 2006
• inzwischen 500 Millionen aktive Benutzer
• wird für die Verbreitung von Nachrichten,
öffentliche Kommunikation genutzt
• Daten größtenteils über API öffentlich
zugänglich
14.
15.
16. Daten aus Twitter extrahieren
HTTP request
liefere alle Daten eines bestimmten Users/von einem
bestimmten Ort/...
Application Programming
Interface (API)
Daten*
19. Rechtliche und ethische
Hürden
• Daten dürfen nicht weitergegeben werden
(Twitter Terms of Service)
• Datenschutzrichtlinien müssen eingehalten
werden (etwa European Data Protection
Directive)
• ethische Fragen stellen sich auch dann,
wenn die Daten öffentlich sind!
22. Blogplattform hypotheses.org
Aktivste Blogs10nach Beiträgen (n=45.528)
Top Blogs by numer of posts (n=45528)
6000
5000
4000
3000
2000
1000
0
Indústrias Culturais Criminocorpus Radar Veille énergie climat Veille sur la Corée Le Cresson veille Corps et Médecine URFIST Info No Mundo dos Museus Nuevo Mundo radar Blog de l'IRHiS
25. Offene Fragen:
• Wem gehören die Daten?
• Wie wird die Privatsphäre der Nutzer gewahrt?
• Wer sichert die Qualität der Daten?
• Wie reproduzierbar sind die Ergebnisse?
• Über welche Art von Prozesse lassen sich
Aussagen treffen?
• Wie generalisierbar sind Einzelstudien?
26. Potentielle Probleme:
• Wettlauf um Kompetenzen und Ressourcen
(zwischen Fachbereichen, Wissenschaft/
Industrie), um komplexe Phänomene
untersuchen zu können
• Wandel der Forschungsfragen
• Stärkerer Druck zu Team- und
Verbundforschung