Bibnet projectlijnen collectie en publiekspresentatie
Data trends
1. Data trends
Open,linked,big & portable
22 februari 2013
Studiedag open data en de cloud
een revolutie in de informatiehuishouding van de overheid
Het Pand, Gent
Rosemie Callewaert
iStoire Services
1
2. Hallo,
Ik werk als onafhankelijk informatie architect voor een aantal grote web- en
IT projecten
Ik ben geboeid door nieuwe vormen van lezen en schrijven. Daarvan breng
ik, samen met anderen, verslag op istoire.be
2
3. Doel van de volgende
30 minuten
1. Bijbrengen wat het verschil is tussen
Open data
Linked data
Big data
2. Duidelijk maken waarom je aandacht moet hebben voor
Data portability
3. Doen nadenken over
Mogelijke toepassingen met eigen datasets
3
5. data warehousing
data driven
metadata
data scientists
data analytics data design
open big data
linked data
data microdata
data mining personal big data
data as a service
data driven data visualization
data portability
5
6. Waarvoor staat open data?
Open data is the idea that certain data should be
freely available to everyone to use and republish as
they wish, without restrictions from copyright, patents
or other mechanisms of control.
While not identical, open data has a similar ethos to
those of other “Open” movements such as open
source, open content, and open access.
The term “open data” itself is recent, gaining
besch ikbaar
popularity with the rise of the Internet and World Vrij
Wide Web and, especially, with the launch of open-
data government initiatives such Data.gov Voor iedereen
s
i ctie
estr
Zon der r
6
7. 8 open data principes
voor de overheid
Open data werkgroep (2007)
• 30 internationale experts
• gecoördineerd door Tim O'Reilly
h2p://www.opengovdata.org/home/8principles
7
8. Waarom zou je data openstellen?
• Om data los van een systeem te kunnen gebruiken
– Nieuwe inzichten
– Nieuwe interfaces Open data
– Nieuwe vormen van gebruik
• Om data te kunnen combineren met andere data
– Nieuwe inzichten
a
– Nieuwe interfaces
Linked dat
– Nieuwe vormen van gebruik
8
9. Wat zijn de voordelen als anderen met ‘jouw data’
aan de slag gaan?
• Er kunnen toepassingen, websites of apps ontwikkeld worden die de
organisatiegrenzen en -mogelijkheden overstijgen
• Vanuit het perspectief van een eindgebruiker is de grens van een organisatie niet
altijd relevant
– ik zoek het dichtstbijzijnde zwembad dat nu open is
– ik zoek een ondergrondse parking in de buurt waar ik nu ben en waar plaats vrij is
• Mensen van buiten de organisatie bekijken je data anders en kunnen met
vernieuwende concepten komen waar je als organisatie niet aan gedacht had
9
18. Waarvoor staat linked data?
In computing, linked data describes a method of
publishing structured data so that it can be
interlinked and become more useful.
It builds upon standard Web technologies such as
HTTP and URIs, but rather than using them to serve
web pages for human readers, it extends them to
share information in a way that can be read
automatically by computers. Gestructureerde data
This enables data from different sources to be
eb
p het w
connected and queried.
o
Tim Berners-Lee, director of the World Wide Web
Pub liceren
Consortium, coined the term in a design note
discussing issues around the Semantic Web project. Afgesproken
formaat
However, the idea is very old and is closely related
to concepts including database network models,
citations between scholarly articles, and controlled
headings in library catalogs”
18
19. 5 stars of open linked data
The Semantic Web isn't just about putting data
on the web.
It is about making links, so that a person or
machine can explore the web of data.
With linked data, when you have some of it, you
can find other, related, data
Tim Berners-Lee, 2006
19
23. Waarvoor staat big data?
In information technology, big data is a
collection of data sets so large and complex
that it becomes difficult to process using on-
hand database management tools or
traditional data processing applications. The
challenges include capture, curation, storage,
search, sharing, analysis, and visualization.
Collecties van
The trend to larger data sets is due to the
Grote en complexe datasets
additional information derivable from analysis
of a single large set of related data, as
compared to separate smaller sets with the Analyseren en visualiseren
same total amount of data, allowing Met big-data tools
correlations to be found to "spot business
trends, determine quality of research, prevent an
Ontdekken v
diseases, link legal citations, combat crime, banden
Inzic hten en ver
and determine real-time roadway traffic
conditions.
23
24. Waarom inzetten op big data?
• Trends detecteren
• Inzichten verwerven
• Onderzoek doen
• Voorspellingen maken
• Actie ondernemen op basis van inzichten
24
27. Van logfiles naar verkoopsinterfaces
1. Wat heb ik recent bekeken op Amazon.com?
2. Wat kopen mensen die ook de boeken uit mijn Amazon-
historiek kochten?
27
28. Van personal big data naar health apps
• Logging daily activities into health apps
• Visualize, track, monitor your progress based
on your own goals
Visualisering van harde feiten als motivatie
en aanzet tot gedragswijziging
28
31. It is also staggering how much data towns and cities generate. At a rough
estimate, we will generate 4.1 terabytes per day per square kilometer of
urbanized land area by 2016.
In fact, you could say that cities are the true big data systems of our age.
From geolocation data collected by smart phones to data generated by cars
and their GPS instruments, from the contact sensor payment cards we use
to ride the subway to the data we offer when we want to make use of a bike
or a car in the city. 31
32. Voldoende stof om na te denken
over toepassingen voor jouw
organisatie?
… vergeet dan deze voorwaarden niet
32
34. Make your data portable
Organizations and people should “own” their data and be
able to easily export/remove it from one application or
service and import it into another
34