KVAN-dagen
Exploit the Masses! Big Data en de Archivaris
Datum: 16/06/2014
Tijd: 15:00 - 16:00
Lijn: Lijn 1a: Big data big future @Bioscoopzaal 2
Big Data is een trendy term onder informatiedeskundigen, managers en bestuurders. Maar het is meer dan dat. Big Data heeft een groot effect op het gebruik van informatie. Het leidt tot een meerwaarde van informatie. Op dit moment wordt het concept Big Data vooral ingezet om op relatief korte termijn voorspellingen te doen op basis van recente informatie. Dat komt omdat de gedachtevorming nog volop in ontwikkeling is én omdat digitale data op deze schaal pas sinds kort bewaard blijven en dus voorhanden zijn. Er ontstaat duidelijkheid over de meerwaarde die schuilt in het type informatie dat tot voor kort werd gezien als ‘ruis’ en ‘ballast’. En dat meerwaardespectrum zal steeds breder worden, waarbij de bezitters van data uiteindelijk de grote winnaars zullen zijn. Hoe meer je verzamelt, hoe hoger je ‘marktwaarde’.
Wat zou dit kunnen betekenen voor archieven? Worden archieven, als databezitters, (economisch) steeds belangrijker? Krijgt archief, naast de bekende drie functies, door hergebruik nog een vierde – misschien veel zwaardere – functie als grondstof voor informatieproducten? Wat betekent dit voor acquisitie, selectie en vernietiging? Hoe stel je de data beschikbaar en onder welke voorwaarden? Is een e-depot voldoende? En wie beheren die archieven dan: archivarissen of IT-specialisten? Kortom: in welke zin veranderen rol en functie van archief en archivaris als gevolg van deze ontwikkelingen?
Spreker(s) tijdens deze sessie:
Chido Houbraken
zelfstandig informatieadviseur - CHIDO
www.chido.nl
3. Programma
16-06-2014 Exploit the Masses! (KVAN14) 3
• Wat is Big Data (voor de archivaris)?
• Dataficatie
• Waarde
• De Vierde Functie
• Vragen voor de archivaris
• Tot slot
6. Big Data?
16-06-2014 Exploit the Masses! (KVAN14)
Oorzaken:
6
• Data-explosie (oa door
toenemende dataficatie)
• Computerkracht
• Algoritmen
7. Big Data?
16-06-2014 Exploit the Masses! (KVAN14) 7
Definitie 1 (technisch):
Één of meer datasets die te groot zijn om met
reguliere databasemanagementsystemen te
onderhouden.
Rekening houdend met:
• de hoeveelheid data;
• de snelheid waarmee de data binnenkomt en
opgevraagd wordt;
• de diversiteit van de data.
(Gartner)
8. Big Data?
16-06-2014 Exploit the Masses! (KVAN14) 8
Definitie 2 (technisch-simpel):
Data die moeilijk is om te verwerken met, en te
analyseren door, gebruik van traditionele database
en software technieken.
(Gagan Mehra)
9. Big Data?
16-06-2014 Exploit the Masses! (KVAN14) 9
“Definitie” 3 (gebruikers):
Activiteiten die je met informatie onderneemt:
• op grote schaal;
• die op een kleinere schaal niet mogelijk zijn;
• waarmee je nieuwe inzichten verkrijgt of nieuwe
vormen van (economische) waarde creëert op een
manier die invloed heeft op onder andere markten,
organisaties en de relatie tussen burgers en
overheden.
(Mayer-Schönberger / Cukier)
10. Big Data
16-06-2014 Exploit the Masses! (KVAN14) 10
Kenmerken:
• Diversiteit (rommeligheid)
• Correlatie versus causaliteit
• Dataficatie
• Waarde (economisch of
anderszins)
12. Big Data
16-06-2014 Exploit the Masses! (KVAN14) 12
Diversiteit (genealogisch onderzoek)
• Burgerlijke Stand
• Bevolkingsregisters
• DTB-registers
• Memories van Successie
• Notariële archieven
• Kadaster
• Militaire stamboeken
• Lijsten met badgasten
• Bonboeken
• Ingekomen stukken
gemeenten
• Begraafregisters
• Familieberichten in kranten
• Bidprentjes
• Leerlingenregisters van
scholen
• Rechtbankarchieven
• Adresboeken
Enz.
13. Big Data
16-06-2014 Exploit the Masses! (KVAN14) 13
Correlatie versus causaliteit
Oorzaak
Gevolg
Causaliteit
Oorzaak
Gevolg 1 Gevolg 2
Correlatie
14. Big Data
16-06-2014 Exploit the Masses! (KVAN14) 14
Correlatie versus causaliteit
Oorzaak
Gevolg
Causaliteit
Oorzaak 2
Gevolg 2 Gevolg 1
Correlatie
Oorzaak 1
18. Dataficatie
16-06-2014 Exploit the Masses! (KVAN14) 18
Dataficeren:
Een verschijnsel in een kwantificeerbare
vorm omzetten, waarin het systematisch
kan worden vastgelegd en geanalyseerd.
Is géén digitalisering: de omzetting van
analoge informatie in binaire, nullen en
enen, zodat computers ermee overweg
kunnen.
33. Conclusie?
16-06-2014 Exploit the Masses! (KVAN14) 33
Knooppunt
van data, met
expertise
GEBRUIKERS
Dataproducent
Dataproducent
(Zorgdrager) Dataproducent
E-depot
Dienstverlening
34. Conclusie?
16-06-2014 Exploit the Masses! (KVAN14) 34
Eigenaar van
alle data
GEBRUIKERS
Dataproducent
Dataproducent
(Zorgdrager) Dataproducent
E-depot
Dienstverlening
35. Tot slot
16-06-2014 Exploit the Masses! (KVAN14) 35
Denk na over je dienstverleningsconcept Lees De Big Data Revolutie van
Mayer-Schönberger en Cukier!
36. Dank voor uw aandacht!
16-06-2014 Exploit the Masses! (KVAN14) 36
www.chido.nl
chido@chido.nl
@ChidoHier
http://www.facebook.com/chidoadvies