Er wordt de laatste tijd veel gewezen op de bedreigingen van Big Data voor de archiefwereld. Onze privacy is in het geding. Strengere regels voor privacy en databescherming, het recht om te worden ‘vergeten’, beroven
archieven mogelijk van hun meest waardevolle materiaal. Die discussie wil ik niet aangaan.
Ik kijk naar de kansen die big-datatechnologie de archivaris kan bieden. Het PRISM-programma dat schijnbaar zonder democratische controle gegevens binnenharkt voor de Amerikaanse inlichtingendienst is een zorg, maar tegelijkertijd watertand ik bij de technologie erachter: zouden die datamining-instrumenten ons kunnen helpen bij bijvoorbeeld het toegankelijk maken en waarderen van grote hoeveelheden informatie?
Waar liggen onze mogelijkheden? Ik heb de wereld van de data-intensieve wetenschap verkend. Binnen deze wetenschappelijke disciplines wordt met een onnoemlijke hoeveelheid aan data gewerkt.
Daar speelt een vergelijkbare problematiek:
• beperkte toegankelijkheid door interpretatieverschillen (uitwisselbaarheid);
• menselijk (on)vermogen om grote hoeveelheden informatie te interpreteren;
• de onvolkomenheden van de nu beschikbare technologie.
De lessen die we kunnen leren:
• betekenis en waarde kun je kwantificeren waardoor je kan automatiseren
• leg alles vast en gebruik die informatie: alle data is van waarde
• hoe eet je een olifant? Door hem in stukjes te hakken
• waarderen is verrijken
Ruud Yap
projectleider Werkpakket 1 (Digitale Infrastructuur) Digitale Taken Rijksarchieven (DTR) - Nationaal Archief
1. Big Data x Big opportunities | 17 juni 2014
Big data x big
archives = great
opportunities
2. Cloudy linked big data?
Big Data x Big opportunities | 17 juni 2014
2
http://www.ehealthreporter.com/en/notic
ia/verNoticia/2694/big-linked-and-open-
data-event-november-15th-buenos-
aires-argentina
3. Big Data x Big opportunities | 17 juni 2014
3
Waarom big data?
• Actueel
• Innovatief
• Onbekend
http://www.rocketboom.com/i-spy/
4. Maar let op…
Big Data x Big opportunities | 17 juni 2014
4
http://www.keepcalm-o-matic.co.uk/p/keep-calm-and-don-t-believe-the-hype/
6. Waardering en selectie in de digitale wereld
Big Data x Big opportunities | 17 juni 2014
6
7. Vergelijkbare problematiek?
Big Data x Big opportunities | 17 juni 2014
7
• Data-intensive science
• Ook worsteling met
toegankelijkheid en
leesbaarheid van
informatie
• Belang van kennis en
context
http://research.microsoft.com/en-us/research/toys/fourth-paradigm.aspx
8. Big Data x Big opportunities | 17 juni 2014
8
Is dataficeren nieuw?
• Is niet nieuw
• Dagelijkse kost voor
archivarissen
• Tijdrovend & kostbaar
Wat is wel nieuw?
• Automatisme
• Hoeveelheid
• Snelheid
• Soorten
http://www.economist.com/node/21548493
9. Wat kunnen we met die gegevens?
Big Data x Big opportunities | 17 juni 2014
9
education-portal.com/academy/lesson/correlational-studies-in-psychology-examples-advantages-types.html#lesson
10. Recombineren
Big Data x Big opportunities | 17 juni 2014
10
http://www.speld.nl/2014/02/13/wat-de-metadata-zeggen-over-ronald/
11. Niet alles heeft waarde
Big Data x Big opportunities | 17 juni 2014
11
http://www.tylervigen.com/
12. Big Data x Big opportunities | 17 juni 2014
12
Relaties en betekenis?
• Dataficeren van informatie
door metadatering
• Betekenis bepalen door
recombinatie van entiteiten
13. Wanneer wordt het interessant?
Big Data x Big opportunities | 17 juni 2014
13
• Dataficeren van interactie met
informatie
• Alles van potentiele waarde
beschouwen
15. Big Data x Big opportunities | 17 juni 2014
15
Actuele interactiegegevens
System events Custom events
Mogelijke BZK werkstroomstappen
BZKAfhandelen
BZKAfsluiten
BZKAfstemmen
BZKBehandelen
BZKBehandelenNaOverdracht
BZKEinde
BZKEnvelopAutomatischSluiten
BZKEnvelopHandmatigSluiten
BZKEsclForward
BZKFinancieelAfhandelen
BZKHeractiveren
BZKHeropenen
BZKInitieren
BZKJuridischToetsen
BZKOvernemen
BZKParaferenPSG
BZKPubliceren
BZKRegistreren
BZKRetourAfzender
BZKRetourInitiator
BZKRetourSteller
BZKTerugroepen
BZKVerzenden
BZKWerkVerdelen
16. Laat anderen voor je werken
Big Data x Big opportunities | 17 juni 2014
16
17. Wat is onze taak?
• Bewaken van de context
• Het stellen van de juiste vragen
• Het duiden van het wat
Big Data x Big opportunities | 17 juni 2014
17
18. Genre classificatie
• Genre als concept uit de taal- en communicatiewetenschappen
• Representatie van een communicatieve actie
Genre beschrijft:
• Inhoud
• Deelnemers
• Timing
• Vorm
Dataficeren van genrekenmerken
Big Data x Big opportunities | 17 juni 2014
18
19. Voorbeeld van een genre
Big Data x Big opportunities | 17 juni 2014
19
20. Conclusie?
Big Data x Big opportunities | 17 juni 2014
20
http://prreport.de/home/aktuell/article/6939-marketer-haben-wenig-ahnung-von-daten/