SlideShare una empresa de Scribd logo
1 de 62
Descargar para leer sin conexión
Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business1
Openbaar
DATA SCIENCE
INZICHT IN MOGELIJKHEDEN EN KANSEN VOOR UW BUSINESS
Dr. Johan van Rooij, 12 September 2019
2 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Openbaar
Dr. Johan van Rooij
Senior Data Scientist @ Valid
• PhD + MSc informatica, MSc wiskunde
• Sinds een jaar Lead Data Scientist bij Valid
• 7 jaar senior consultant ‘kwantitatieve methoden’
voornamelijk in de industrie en de logistiek (CQM BV)
− ProRail, NS, ASML, Oceaneering, VolkerRail, veel meer…
− Planning optimisation, machine learning/deep learning,
bouwen van een zoekmachine, doceren van data science
• Onderdeel van het team dat de ‘Hendrik Lorentz
Nederlandse Data Science Prijs 2018’ gewonnen heeft
• Assistant Professor @ Utrecht University
3 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Openbaar
Mijn doel voor deze bijeenkomst
En tevens de agenda…
1. Wat is Data Science?
− Verhouding tussen Data Science en wat men al jaren doet
− Nieuwe mogelijkheden met Data Science t.o.v. 10 jaar geleden
2. Legio voorbeelden van toepassingen
− Eerst veel voorbeelden uit de industrie, dan consumenten data
3. Waar te beginnen en hoe pak je dat aan
− Basis aanpak voor identificeren mogelijkheden
− Kort hoe een Data Science project werkt
4. Teleurstellingen en misverstanden over Data Science
− Een aantal hardnekkige misverstanden
− Het gevaar dat iedereen zich tegenwoordig ‘Data Scientist’ noemt
5. Kort: wat biedt Valid?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business4
Openbaar
1. Wat is Data Science?
5 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Openbaar
Data Science is een Buzzword, wij pakken deze definitie
Buzzword: vaak verward met AI of Machine Learning (of Big Data, of Deep Learning, of Advanced Analytics, of…)
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business6
Computing
skills
Math &
Statistical
knowledge
Domain
expertise
Openbaar7 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Data Science
Computing
skills
Math &
Statistical
knowledge
Domain
expertise
Data Science is een Buzzword, wij pakken deze definitie
Buzzword: vaak verward met AI of Machine Learning (of Big Data, of Deep Learning, of Advanced Analytics, of…)
Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business
Wat voor problemen lost een data scientist op?
Zaken die we in de jaren 90 met (advanced) analytics aanvlogen
Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business
BI, Data
Exploratie &
Visualisatie
Statistiek
Machine
Learning
Operations
Research
Wat voor problemen lost een data scientist op?
Zaken die we in de jaren 90 met (advanced) analytics aanvlogen
Openbaar
Data Science of Analytics (jaren 90 vs nu)
10 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Data Science
Computing
skills
Math &
Statistical
knowledge
Domain
expertise
Het verschil zit hem in de schaal en rekenkracht:
- Analyses op veel meer data (‘big data’)
- Data beschikbaarheid, bijvoorbeeld via (I)IoT
- Machine learning op beeld, geluid, sensordata, etc…
- Makkelijk herhalen en schalen van analyses
- Snelle automatische analyses in real-time
Openbaar
Hoe verhoudt zich dat tot kunstmatige intelligentie?
Dat is het nieuwe Data Science toch?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business11
Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business12
Kunstmatige Intelligentie is een buzzword of hype
Waar het mij om gaat zijn realistische verwachtingen
Op internet lijkt alles te kunnen.
− Vaak betreft dit spectaculaire resultaten om een heel
smal/specifiek probleem (AlphaGo)
− En/of ligt er hééél veel data en rekenkracht aan te
grondslag en ligt alleen in het bereik van de grote
tech bedrijven (Watson)
− Of, het is een aaneenschakeling van smalle
problemen, met heel veel engineering er om heen
(Zelfrijdende auto en Watson ook)
Wat is wel realistisch?
− Er is geen heilige kunstmatige intelligentie graal als kant-en-klare oplossingen om een bedrijf aan te sturen
− Processen inrichting zodat smalle specifieke problemen met Data Science geautomatiseerd kunnen worden
− Sommige modellen op basis van ‘heel veel rekenkracht’ zijn publiek beschikbaar en bruikbaar als bouwblok
Openbaar
Kunstmatige intelligentie is ook een buzzword
Laten we het over een ander verschil hebben: blackbox vs whitebox models
• AI is vrijwel altijd een blackbox - Data Science kan beide zijn
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business13
Openbaar
Mijn doel voor deze bijeenkomst
En tevens de agenda…
1. Wat is Data Science?
− Verhouding tussen Data Science en wat men al jaren doet
− Nieuwe mogelijkheden met Data Science t.o.v. 10 jaar geleden
2. Legio voorbeelden van toepassingen
− Eerst veel voorbeelden uit de industrie, dan consumenten data
3. Waar te beginnen en hoe pak je dat aan
− Basis aanpak voor identificeren mogelijkheden
− Kort hoe een Data Science project werkt
4. Teleurstellingen en misverstanden over Data Science
− Een aantal hardnekkige misverstanden
− Het gevaar dat iedereen zich tegenwoordig ‘Data Scientist’ noemt
5. Kort: wat biedt Valid?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business14
Openbaar
2a. Voorbeelden uit de industrie
21-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business15
Openbaar
Drie onderwerpen uit de industrie voor Data
Science toepassingen
1. Quality
2. Asset Utilisation
3. Supply Chain
4. (Service / aftersales – sla ik over)
• Setting: machinepark / factory floor
• Er is een moderne data huishouding
− Order & product data, productie instellingen…
− Kwaliteits data, productie failures, yield, …
− (I)IoT machine sensor data
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business16
Openbaar
1. Quality (conform specificatie)
Kennis vergaren om kwaliteit te verhogen
• Traditioneel: six sigma aanpak
− Continuous process improvement
− Scheiden natuurlijke variatie en special causes
− Inschatten effectgroottes: effect product/proces parameters op eindproduct
− SPC indicatoren erop zetten
• Data Science bouwt hier door op basis van IT mogelijkheden:
− Kort cyclisch hypothesen testen
− Breder zoeken naar statistische verbanden (soms semi-geautomatiseerd)
− Veel meer data, dus ook zwakke/complexere verbanden statistisch relevant
• Bijvoorbeeld: effect product configuraties op aantal productie failures
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business17
Openbaar
1. Quality (conform specificatie)
Niet-destructief testen/inspecteren
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business18
Automatische kwaliteitsinspecties:
1. Eerst plaatsen camera (of andere sensoren)
2. Data vergaren over kwaliteit afwijkingen die
te linken is aan de data (beelden)
3. Model trainen en gebruiken om alleen
interessante gevallen handmatig te doen
4. Op basis van 3 verbeteren en automatiseren
• Dit werkt omdat het een ‘smalle taak’ is
• Vaak zelfs betere inspectie mogelijk dan de
niet-(semi-)automatische variant
Openbaar
2. Asset Utilisation
• Lean en bottleneck scheduling de basis.
• Maar als productie proces complexer:
− JIT schedule op de MPS. MRP en planning
voor workcenters volgens ‘exploding’
principe? Dan alleen ideaal als er genoeg
workcenters zijn.
• Echt goed met alle assets omgaan vergt
wiskundige planningsoplossing
− Interactie van kosten en doorlooptijden
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business19
Openbaar
Automatisch plannen
• Vooral bruikbaar als:
− Proces voldoende gestandaardiseerd en gesimplificeerd
− Ontwikkeling en adoptie lastig in situaties waar veel informele lijntjes en informele eisen zijn
− In essentie moet plannen puzzelen zijn, net als een sudoku (met puntentelling voor kosten)
• Termen als Proces simplificatie, routing flexibility en machine flexibility gaan hand in
hand met automatisch plannen
− Gevolg: sneller en flexibeler leveren, ook in kleine batches, tegen beperkte kosten
• Semi-automatische planning leidt tot:
− Kosten reductie
− Mogelijkheid tot snelle what-if studies samen met simulatie tooling
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business20
Openbaar
2. Asset Utilisation
Predictive Maintenance/Anomaly Detection
De belofte:
• Hogere asset utilisation via condition-based maintenance
• Uitval gedrag voorspellen op basis van sensor data (IIoT)
Echter:
• Vaak geen data over failures.
− Model kan alleen door combinatie domein kennis en data.
− Beste resultaten als de data verzameling strategie al predictive
maintenance tot doel heeft
• Of door combinatie data science en begrip van de machine
Alternatief:
• Anomaly detection: Data Science model dat ‘afwijkingen
van normale operatie’ detecteert
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business21
Openbaar
3. Supply Chain – forecasting
Connected company logistics
• Forecasting doen we natuurlijk al jaren
• Met data science, kun je real-time forecasten met:
− Scheiden effecten trend, seizoen, dag van de week etc.
− Uitgesplitst per verkooppunt
− Weersverwachting als input?
− Specifiek rekening houden met vakantiedagen
− …
• Dit kan veel betekenen voor je supply chain planning
− Descision support over descision automation!
• Soms in combinatie met IoT:
− Connected vending machines, containers, etc.
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business22
Openbaar
Views voorspellen…
23 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Openbaar
3. Supply Chain – planning
Connected company logistics
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business24
• Wiskundig kosten doorrekenen en optimaliseren:
− Minimale kilometers, leeg volume, voorraden, etc.
− Wanneer bezorgen? Als bijna op, of als toch in de buurt?
− Past dat nog in de truck?
− Wat betekent dat voor de planning?
• Verschil met vroeger:
− Real-time informatie verwerken
− Met computermodellen kosten volledig optimaliseren
• Uitdagingen bij realisatie zitten in:
− Inherent onvoorspelbare zaken (sommige files)
− Plannen is niet hetzelfde als herplannen
− Huidige methodiek vangen in regels
Openbaar
Industrie: Lean Six Sigma – of Industrie 4.0
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business25
Openbaar
2b. Kort: voorbeelden
points of contact met consumenten
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business26
Openbaar
Veel toepassingen in `big data’ m.b.t. consumenten
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business27
Openbaar
Points of contact met consumenten
• Voorspellen:
− Personalised Recommendations
− Churn / loyalty
− Conversie
− Beste timing om klant te
benaderen
• Descriptive/Diagnostic:
− Wat wordt er over mijn
bedrijf/product gezegd op internet
− Topic detectie
− Sentiment analyse
− Klant profielen opstellen
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business28
Niet alleen Data Science, maar breder Digital Business:
Data verzamelen, data beheer, data infrastructuur.
Openbaar
Veel data science toepassingen in `big data’ m.b.t.
consumenten
• Als je product een website/platvorm is, dan krijg je dit soort data vanzelf.
− Alle verkeer op je website precies volgen
− Hiermee kun je profielen opstellen
− Vervolgens: inzicht in waarom mandjes niet afgerekend worden, welke producten bekeken worden
voordat een product gekocht wordt
• Big data consumenten setting kun je creëren met je product (soms via IoT):
− Hoe wordt je product gebruikt? Alle knopjes waar op gedrukt wordt loggen?
− Predictive maintenance of anderszins support op basis van gebruiksdata?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business29
Openbaar
Mijn doel voor deze bijeenkomst
En tevens de agenda…
1. Wat is Data Science?
− Verhouding tussen Data Science en wat men al jaren doet
− Nieuwe mogelijkheden met Data Science t.o.v. 10 jaar geleden
2. Legio voorbeelden van toepassingen
− Eerst veel voorbeelden uit de industrie, dan consumenten data
3. Waar te beginnen en hoe pak je dat aan
− Basis aanpak voor identificeren mogelijkheden
− Kort hoe een Data Science project werkt
4. Teleurstellingen en misverstanden over Data Science
− Een aantal hardnekkige misverstanden
− Het gevaar dat iedereen zich tegenwoordig ‘Data Scientist’ noemt
5. Kort: wat biedt Valid?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business30
Openbaar
3a. Waar te beginnen?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business31
Openbaar
Waar toepassingen te vinden?
Data Science: van informatie (data) naar beslissing/actie
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business32
Openbaar
Waar toepassingen te vinden?
Data Science: van informatie (data) naar beslissing/actie
• Bekijk de belangrijkste bedrijfspijlers:
− Onderdelen van de operatie
− Points of contact met klanten/consumenten
− Daar waar belangrijke keuzes gemaakt worden
• Welke beslissingen worden waar genomen?
− Over welke beslissingen hebben we data?
− Is die data voldoende om de beslissing te nemen
− Kunnen we dit ondersteunen of automatiseren?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business33
Openbaar
Plekken waar efficiency te winnen is, of beter
begrip van de situatie gewenst is
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business34
Niet alleen Data Science, maar breder Digital Business:
Data verzamelen, data beheer, data infrastructuur.
En: processen zelf simplificeren, standardiseren en flexibeler maken
Openbaar
3b. Hoe pak je zoiets aan?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business35
Openbaar
Data Science onderdeel van Digital Business
Zonder digitalisering werkt het niet
• Digitalisering uitdagingen: data en infrastructuur
− Data kwaliteit en single source of truth
− Produceer ik de juiste (relevante) data
− Welke data infrastructuur past bij mij?
• Proces uitdagingen: standaardisatie en simplificatie!
− Meer met Data Science te halen bij flexibele, eenvoudige, gestandaardiseerde processen
− Data heeft dan ook meer betekenis t.o.v. het echte proces
• Keiharde business involvement nodig
− Data Science is geen puur IT feestje – dan is het gedoemd te falen – wel de aansluiting goed regelen
− Visie op waar Data Science bedraagt aan strategische doelen
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business36
Nodig:
Een moderne
datahuishouding en
data platvorm
Openbaar
READY
Definieer probleem en
randvoorwaarden
Schat businesscase en
impact, data
beschikbaarheid en
kwaliteit in
Definieer MVP, onderzoek
haalbaarheid, stel solution
groei plan op
SET
MVP iteratief uitwerken
(1-4 weken cyclus)
CRISP-DM model elke fase
kort doorlopen
Verwachtingen managen:
accepteer grillig proces
STAY AHEAD
Volledige product lifecycle
in kaart brengen
Gat tussen scalable solution
en MVP dichten
Start van voor af aan met
improvement projecten,
groei naar scalable solution
Onze data Science methodiek
Gestoeld op CRISP-DM en Microsofts ‘Team Data Science Process’
37 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Openbaar
Iedere 1-4 weken in-depth overleg met
business
− Business owner en data scientist werken
intensief samen
− Ontwikkel oplossing voor precies het juiste
probleem
− Tijdens het proces ontstaan altijd nieuwe
inzichten
Alle zes CRISP-DM fasen per iteratie
− Soms heel kort, soms uitgebreid
− Vandaar verschil in duur per iteratie.
SET: Data Science is een iteratief proces
CRISP-DM: CRoss-Industry Standard Process for Data Mining
38 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Openbaar
4. Valkuilen, misverstanden, belemmeringen, etc.
Data Science is vaak innovatief dus met enig risico
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business39
Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business40
How use Decision Making knowledge to improve Data Science impact?
Large
impact
Limited
impact
Valkuil 1: “Geef de Data Scientist data en hij haalt er waarde uit”.
Openbaar
Unicorn probleem
Iedereen wil Data Scientists, maar deze skills gaan moeilijk samen
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business42
Openbaar
Het ‘niet data scientist’ prototype dat de aandacht opeist
Met rapid prototyping kom je een heel eind
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business43
En dat is ook niet zo erg, als je je verwachtingen
daarop aansluit, maar dat doen we doorgaans niet
Openbaar
Typisch gebeurt er dan dit
• Is dit een probleem?
− Wel handig, data science zien als API, veel makkelijker
− Die black box kun je toch niet perfect begrijpen (wel op hoofdlijnen)
− We maken wat moois toch?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business44
Openbaar
Laten we dit eens naast
de toepassingen leggen
1. Descriptive Analytics
What happened?
• Data visualisatie, exploratie, BI
• Niets aan de hand, dit werkt gewoon
• Een groot deel van het data science
werk zit toch hier
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business45
Openbaar
Laten we dit eens naast
de toepassingen leggen
2. Diagnostic Analytics
Why did it happen?
• Je kunt niet bepalen hoe groot een verband is
− Bijvoorbeeld tussen fouten en oorzaken
• Of hoe groot verbanden/effecten zijn:
− Seizoenseffecten? Weerseffecten?
• Of, of een verband statistisch significant is?
Al bovenstaande zijn extreem nuttige kijken op
data, waar klanten/projecten verder mee komen!
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business46
Dit is puur statistiek, dit kan alleen white-box
Openbaar
Laten we dit eens naast
de toepassingen leggen
3. Predictive Analytics
What will happen?
• Voorspellen! De heilige graal van data science
− Machine learning - als API en dus Black Box
− Bijvoorbeeld: AutoML
• Maar wat als:
− Data van gisteren afwijkt van data van morgen? Black box kan dat niet snappen
− Data over mensen gaat? Wat voor eigenschappen neem je wel en niet mee?
 Black box modellen kunnen geen verschil maken tussen correlatie en causale verbanden
 Beoordeeld/veroordeeld mensen op basis van ‘birds of a feather’
• Echte bedrijfsbeslissingen worden niet genomen op basis van een getalletje zonder context
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business47
Openbaar
Laten we dit eens naast
de toepassingen leggen
4. Prescriptive analytics
What should I do?
• Wil ik overslaan
− Dit is een vak apart: Operations Research
− Api’s bestaan, zijn ook super goed
− Als je die goed kunt gebruiken,
dan snap je OR ook
• Sommige data scientists noemen dit geen ‘data science’ omdat dit een vak apart is
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business48
Openbaar
We beloven, marketen en hypen dit…
Our Foes Data Science and AI
We leveren vervolgens dit…
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business49
Omdat ‘Data Scientists’ niet leveren, iets anders leveren
of teleurstellingen leveren, wordt Data Science in de
markt langzaam een soort BI++, terwijl kansen op
succesvolle high-value projecten blijven liggen.
Openbaar
Teleurstellingen
extra aangewakkerd door partners die veel
gave tech leveren, maar ook graag API’s pushen
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business50
Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business51
Openbaar
Voorspellen wanneer de
pan (over)kookt?
Nodig:
• Huidige temperatuur
• Hoe hard het gas staat
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business52
Wat voor patroon laten we AutoML leren?
• Het is nu 40 graden, koken over 20 minuten
• Het is nu 46 graden, koken over 18 minuten
• Het is nu 20 graden, koken over 10 minuten
• …
AutoML zoekt een patroon tussen temperatuur en tijd tot koken
Hoe hard het gas staat wordt helemaal niet meegenomen
Dat komt door hoe wij data aanbieden aan AutoML
Openbaar
Wat biedt Valid?
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business53
Openbaar
READY
Definieer probleem en
randvoorwaarden
Schat businesscase en
impact, data
beschikbaarheid en
kwaliteit in
Definieer MVP, onderzoek
haalbaarheid, stel solution
groei plan op
SET
MVP iteratief uitwerken
(1-4 weken cyclus)
CRISP-DM model elke fase
kort doorlopen
Verwachtingen managen:
accepteer grillig proces
STAY AHEAD
Volledige product lifecycle
in kaart brengen
Gat tussen scalable solution
en MVP dichten
Start van voor af aan met
improvement projecten,
groei naar scalable solution
Onze data Science methodiek
Gestoeld op CRISP-DM en Microsofts ‘Team Data Science Process’
54 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Openbaar
Daarom Data Science bij Valid!
Reden Voordeel
Stay Ahead = vooroplopen in jouw sector
Samen maken wij data science oplossingen die jouw business
echt verder helpen
Valid is “Echt”
Vakmensen, geen cowboys die wiskunde onder de tools niet
snappen
“Microsoft, tenzij”
Snel en niet duur, schakelen op basis van de Microsoft stack...
En aanvullende technologieën waar nodig
Multi-disciplinair team, minder blinde vlekken
Alle activiteiten rondom Data Science zetten wij optimaal in (BI,
cloud-infra, applicatie development…)
Risico beheersing
Bewezen werkwijze op basis van industry standards (CRISP-DM
en Team Data Science Process)
Valid is de technology provider
Maatwerk oplossingen performen in veel domeinen significant
beter dan standaard applicaties
55 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Openbaar56 Data Science: Inzicht in mogelijkheden en kansen voor uw business
Microsoft Modern Data Platform
12-9-2019
Openbaar
Data Platform
Strategy &
Assessment
Data Management &
Integration
Managed
Services
AnalyticsReporting
Data
Platform
57 Data Science: Inzicht in mogelijkheden en kansen voor uw business
Valid Modern Data Platform
12-9-2019
Openbaar
IoT at Valid a glance
• IoT = connectiviteit, meetbaarheid (sensoren in apparaten), data en actie
• Valid levert en integreert Microsoft technologie voor connectiviteit, security en
interoperability
• Integratie met Moderne Data Platvorm
− Reporting
• Enabeler voor sommige Data Science en BI toepassingen
58 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
Openbaar
Conclusie
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business59
Openbaar
Data Science is een
interessante nieuwe
ontwikkeling
12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business60
Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business61
Maar je moet het dan wel goed
doen
Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business62

Más contenido relacionado

Similar a Fex 190912 - presentatie - kansen en mogelijkheden met data science door johan van rooij

Oscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieOscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data Visualisatie
Media Perspectives
 
promotie big data in urban technology
promotie big data in urban technologypromotie big data in urban technology
promotie big data in urban technology
Jurjen Helmus
 
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
Marc Govers
 

Similar a Fex 190912 - presentatie - kansen en mogelijkheden met data science door johan van rooij (20)

Data Science As A Service - by Ordina
Data Science As A Service - by OrdinaData Science As A Service - by Ordina
Data Science As A Service - by Ordina
 
DATA SCIENCE & ARTIFICIAL INTELLIGENCE - FRIENDS OR FOES? - Big Data Expo 2019
DATA SCIENCE & ARTIFICIAL INTELLIGENCE - FRIENDS OR FOES? - Big Data Expo 2019DATA SCIENCE & ARTIFICIAL INTELLIGENCE - FRIENDS OR FOES? - Big Data Expo 2019
DATA SCIENCE & ARTIFICIAL INTELLIGENCE - FRIENDS OR FOES? - Big Data Expo 2019
 
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
Mark Vermeer - Congres 'Data gedreven Beleidsontwikkeling'
 
Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)Marketing Intelligence voor Managers – Big Data voor MKB (2)
Marketing Intelligence voor Managers – Big Data voor MKB (2)
 
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
 
White paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply ChainWhite paper: Starten met Data Science in de Supply Chain
White paper: Starten met Data Science in de Supply Chain
 
NL - Module 2 - Using your own Data
NL - Module 2 - Using your own DataNL - Module 2 - Using your own Data
NL - Module 2 - Using your own Data
 
Big data; het nieuwe goud?
Big data; het nieuwe goud?Big data; het nieuwe goud?
Big data; het nieuwe goud?
 
Open data workshop modellen
Open data workshop modellenOpen data workshop modellen
Open data workshop modellen
 
Fex 1610003 - big data komt naar hr @valid
Fex   1610003 - big data komt naar hr @validFex   1610003 - big data komt naar hr @valid
Fex 1610003 - big data komt naar hr @valid
 
Big Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomstBig Data - een kijk in jouw toekomst
Big Data - een kijk in jouw toekomst
 
20130527 jill dyche - im ronald
20130527   jill dyche - im ronald20130527   jill dyche - im ronald
20130527 jill dyche - im ronald
 
20130527 jill dyche - im ronald [Dutch]
20130527   jill dyche - im ronald [Dutch]20130527   jill dyche - im ronald [Dutch]
20130527 jill dyche - im ronald [Dutch]
 
Oscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data VisualisatieOscar Wijsman @ Tech Update Big Data Visualisatie
Oscar Wijsman @ Tech Update Big Data Visualisatie
 
Big Data in zicht - Nationale Denktank
Big Data in zicht - Nationale DenktankBig Data in zicht - Nationale Denktank
Big Data in zicht - Nationale Denktank
 
Mis01 hc1v3
Mis01 hc1v3Mis01 hc1v3
Mis01 hc1v3
 
promotie big data in urban technology
promotie big data in urban technologypromotie big data in urban technology
promotie big data in urban technology
 
Microsoft Big Data Expo
Microsoft Big Data ExpoMicrosoft Big Data Expo
Microsoft Big Data Expo
 
Presentatie big data in verkoop (cevora) gent 16 Mei 2017
Presentatie big data in verkoop (cevora) gent 16 Mei 2017Presentatie big data in verkoop (cevora) gent 16 Mei 2017
Presentatie big data in verkoop (cevora) gent 16 Mei 2017
 
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
BI Congres Het nut van een gegevensinfrastructuur Marc Govers 2012
 

Más de Flevum

190618 fdc - presentatie ge moonen, moonen packaging
190618   fdc - presentatie ge moonen, moonen packaging190618   fdc - presentatie ge moonen, moonen packaging
190618 fdc - presentatie ge moonen, moonen packaging
Flevum
 
190318 fdc - presentatie doen-en_blijven_doen - joop petit
190318   fdc - presentatie doen-en_blijven_doen - joop petit190318   fdc - presentatie doen-en_blijven_doen - joop petit
190318 fdc - presentatie doen-en_blijven_doen - joop petit
Flevum
 
181023 fdc - presentatie blockchain, from proof of concept to real world so...
181023   fdc - presentatie blockchain, from proof of concept to real world so...181023   fdc - presentatie blockchain, from proof of concept to real world so...
181023 fdc - presentatie blockchain, from proof of concept to real world so...
Flevum
 
180621 flevum executive - presentatie - cybercriminaliteit - veenman
180621   flevum executive - presentatie - cybercriminaliteit - veenman180621   flevum executive - presentatie - cybercriminaliteit - veenman
180621 flevum executive - presentatie - cybercriminaliteit - veenman
Flevum
 
180612 fdc - leiderschap en het succes van de onderneming - presentatie han...
180612   fdc - leiderschap en het succes van de onderneming - presentatie han...180612   fdc - leiderschap en het succes van de onderneming - presentatie han...
180612 fdc - leiderschap en het succes van de onderneming - presentatie han...
Flevum
 

Más de Flevum (20)

190925 fex - evaluatie projectmanagement - presentatie antonie reichling
190925   fex - evaluatie projectmanagement - presentatie antonie reichling190925   fex - evaluatie projectmanagement - presentatie antonie reichling
190925 fex - evaluatie projectmanagement - presentatie antonie reichling
 
190918 fdc - presentatie breaking bad habits - wouter van den berg, brain c...
190918   fdc - presentatie breaking bad habits - wouter van den berg, brain c...190918   fdc - presentatie breaking bad habits - wouter van den berg, brain c...
190918 fdc - presentatie breaking bad habits - wouter van den berg, brain c...
 
190905 fex - presentatie bijeenkomst door bert de vos, pepix
190905   fex - presentatie bijeenkomst door bert de vos, pepix190905   fex - presentatie bijeenkomst door bert de vos, pepix
190905 fex - presentatie bijeenkomst door bert de vos, pepix
 
190618 fdc - presentatie ge moonen, moonen packaging
190618   fdc - presentatie ge moonen, moonen packaging190618   fdc - presentatie ge moonen, moonen packaging
190618 fdc - presentatie ge moonen, moonen packaging
 
fex - 190528 - presentatie - employer branding i.s.m mediatic & soulful r...
fex - 190528 - presentatie - employer branding i.s.m mediatic & soulful r...fex - 190528 - presentatie - employer branding i.s.m mediatic & soulful r...
fex - 190528 - presentatie - employer branding i.s.m mediatic & soulful r...
 
190522 - fex - presentatie - next level content marketing - maarten van rijck...
190522 - fex - presentatie - next level content marketing - maarten van rijck...190522 - fex - presentatie - next level content marketing - maarten van rijck...
190522 - fex - presentatie - next level content marketing - maarten van rijck...
 
190514 presentatie - ethisch zaken doen is science fiction - willemijn nieu...
190514   presentatie - ethisch zaken doen is science fiction - willemijn nieu...190514   presentatie - ethisch zaken doen is science fiction - willemijn nieu...
190514 presentatie - ethisch zaken doen is science fiction - willemijn nieu...
 
190409 fdc - hoe kunnen transities succesvol uitgevoerd worden - presentati...
190409   fdc - hoe kunnen transities succesvol uitgevoerd worden - presentati...190409   fdc - hoe kunnen transities succesvol uitgevoerd worden - presentati...
190409 fdc - hoe kunnen transities succesvol uitgevoerd worden - presentati...
 
190327 fex - de toekomst van online marketing - lars pacbier, fb4
190327   fex - de toekomst van online marketing - lars pacbier, fb4190327   fex - de toekomst van online marketing - lars pacbier, fb4
190327 fex - de toekomst van online marketing - lars pacbier, fb4
 
190318 fdc - presentatie doen-en_blijven_doen - joop petit
190318   fdc - presentatie doen-en_blijven_doen - joop petit190318   fdc - presentatie doen-en_blijven_doen - joop petit
190318 fdc - presentatie doen-en_blijven_doen - joop petit
 
181120 presentatie flevum - excelleren in groei - ttc
181120   presentatie flevum - excelleren in groei - ttc181120   presentatie flevum - excelleren in groei - ttc
181120 presentatie flevum - excelleren in groei - ttc
 
181023 fdc - presentatie blockchain, from proof of concept to real world so...
181023   fdc - presentatie blockchain, from proof of concept to real world so...181023   fdc - presentatie blockchain, from proof of concept to real world so...
181023 fdc - presentatie blockchain, from proof of concept to real world so...
 
FEX - 181002 presentatie workforce analytics - valid
FEX - 181002   presentatie workforce analytics - validFEX - 181002   presentatie workforce analytics - valid
FEX - 181002 presentatie workforce analytics - valid
 
180925 presentatie - word de baas over je eigen brein - top state, chantall...
180925   presentatie - word de baas over je eigen brein - top state, chantall...180925   presentatie - word de baas over je eigen brein - top state, chantall...
180925 presentatie - word de baas over je eigen brein - top state, chantall...
 
Fdc 180911- keynote presentatie - alexander van eerden - building blocks
Fdc   180911- keynote presentatie - alexander van eerden - building blocksFdc   180911- keynote presentatie - alexander van eerden - building blocks
Fdc 180911- keynote presentatie - alexander van eerden - building blocks
 
180906 fex - presentatie wp-haton 4.0 - de fabriek van de toekomst
180906   fex - presentatie wp-haton 4.0 - de fabriek van de toekomst180906   fex - presentatie wp-haton 4.0 - de fabriek van de toekomst
180906 fex - presentatie wp-haton 4.0 - de fabriek van de toekomst
 
180628 fex - presentatie - pro spex - grip op de funnel - maarten van rijc...
180628   fex -  presentatie - pro spex - grip op de funnel - maarten van rijc...180628   fex -  presentatie - pro spex - grip op de funnel - maarten van rijc...
180628 fex - presentatie - pro spex - grip op de funnel - maarten van rijc...
 
180621 flevum executive - presentatie - cybercriminaliteit - veenman
180621   flevum executive - presentatie - cybercriminaliteit - veenman180621   flevum executive - presentatie - cybercriminaliteit - veenman
180621 flevum executive - presentatie - cybercriminaliteit - veenman
 
180612 fdc - leiderschap en het succes van de onderneming - presentatie han...
180612   fdc - leiderschap en het succes van de onderneming - presentatie han...180612   fdc - leiderschap en het succes van de onderneming - presentatie han...
180612 fdc - leiderschap en het succes van de onderneming - presentatie han...
 
180517 fdc - presentatie - essentie van high performance - peter stoppelenburg
180517   fdc - presentatie - essentie van high performance - peter stoppelenburg180517   fdc - presentatie - essentie van high performance - peter stoppelenburg
180517 fdc - presentatie - essentie van high performance - peter stoppelenburg
 

Fex 190912 - presentatie - kansen en mogelijkheden met data science door johan van rooij

  • 1. Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business1
  • 2. Openbaar DATA SCIENCE INZICHT IN MOGELIJKHEDEN EN KANSEN VOOR UW BUSINESS Dr. Johan van Rooij, 12 September 2019 2 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
  • 3. Openbaar Dr. Johan van Rooij Senior Data Scientist @ Valid • PhD + MSc informatica, MSc wiskunde • Sinds een jaar Lead Data Scientist bij Valid • 7 jaar senior consultant ‘kwantitatieve methoden’ voornamelijk in de industrie en de logistiek (CQM BV) − ProRail, NS, ASML, Oceaneering, VolkerRail, veel meer… − Planning optimisation, machine learning/deep learning, bouwen van een zoekmachine, doceren van data science • Onderdeel van het team dat de ‘Hendrik Lorentz Nederlandse Data Science Prijs 2018’ gewonnen heeft • Assistant Professor @ Utrecht University 3 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
  • 4. Openbaar Mijn doel voor deze bijeenkomst En tevens de agenda… 1. Wat is Data Science? − Verhouding tussen Data Science en wat men al jaren doet − Nieuwe mogelijkheden met Data Science t.o.v. 10 jaar geleden 2. Legio voorbeelden van toepassingen − Eerst veel voorbeelden uit de industrie, dan consumenten data 3. Waar te beginnen en hoe pak je dat aan − Basis aanpak voor identificeren mogelijkheden − Kort hoe een Data Science project werkt 4. Teleurstellingen en misverstanden over Data Science − Een aantal hardnekkige misverstanden − Het gevaar dat iedereen zich tegenwoordig ‘Data Scientist’ noemt 5. Kort: wat biedt Valid? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business4
  • 5. Openbaar 1. Wat is Data Science? 5 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
  • 6. Openbaar Data Science is een Buzzword, wij pakken deze definitie Buzzword: vaak verward met AI of Machine Learning (of Big Data, of Deep Learning, of Advanced Analytics, of…) 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business6 Computing skills Math & Statistical knowledge Domain expertise
  • 7. Openbaar7 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019 Data Science Computing skills Math & Statistical knowledge Domain expertise Data Science is een Buzzword, wij pakken deze definitie Buzzword: vaak verward met AI of Machine Learning (of Big Data, of Deep Learning, of Advanced Analytics, of…)
  • 8. Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business Wat voor problemen lost een data scientist op? Zaken die we in de jaren 90 met (advanced) analytics aanvlogen
  • 9. Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business BI, Data Exploratie & Visualisatie Statistiek Machine Learning Operations Research Wat voor problemen lost een data scientist op? Zaken die we in de jaren 90 met (advanced) analytics aanvlogen
  • 10. Openbaar Data Science of Analytics (jaren 90 vs nu) 10 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019 Data Science Computing skills Math & Statistical knowledge Domain expertise Het verschil zit hem in de schaal en rekenkracht: - Analyses op veel meer data (‘big data’) - Data beschikbaarheid, bijvoorbeeld via (I)IoT - Machine learning op beeld, geluid, sensordata, etc… - Makkelijk herhalen en schalen van analyses - Snelle automatische analyses in real-time
  • 11. Openbaar Hoe verhoudt zich dat tot kunstmatige intelligentie? Dat is het nieuwe Data Science toch? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business11
  • 12. Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business12 Kunstmatige Intelligentie is een buzzword of hype Waar het mij om gaat zijn realistische verwachtingen Op internet lijkt alles te kunnen. − Vaak betreft dit spectaculaire resultaten om een heel smal/specifiek probleem (AlphaGo) − En/of ligt er hééél veel data en rekenkracht aan te grondslag en ligt alleen in het bereik van de grote tech bedrijven (Watson) − Of, het is een aaneenschakeling van smalle problemen, met heel veel engineering er om heen (Zelfrijdende auto en Watson ook) Wat is wel realistisch? − Er is geen heilige kunstmatige intelligentie graal als kant-en-klare oplossingen om een bedrijf aan te sturen − Processen inrichting zodat smalle specifieke problemen met Data Science geautomatiseerd kunnen worden − Sommige modellen op basis van ‘heel veel rekenkracht’ zijn publiek beschikbaar en bruikbaar als bouwblok
  • 13. Openbaar Kunstmatige intelligentie is ook een buzzword Laten we het over een ander verschil hebben: blackbox vs whitebox models • AI is vrijwel altijd een blackbox - Data Science kan beide zijn 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business13
  • 14. Openbaar Mijn doel voor deze bijeenkomst En tevens de agenda… 1. Wat is Data Science? − Verhouding tussen Data Science en wat men al jaren doet − Nieuwe mogelijkheden met Data Science t.o.v. 10 jaar geleden 2. Legio voorbeelden van toepassingen − Eerst veel voorbeelden uit de industrie, dan consumenten data 3. Waar te beginnen en hoe pak je dat aan − Basis aanpak voor identificeren mogelijkheden − Kort hoe een Data Science project werkt 4. Teleurstellingen en misverstanden over Data Science − Een aantal hardnekkige misverstanden − Het gevaar dat iedereen zich tegenwoordig ‘Data Scientist’ noemt 5. Kort: wat biedt Valid? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business14
  • 15. Openbaar 2a. Voorbeelden uit de industrie 21-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business15
  • 16. Openbaar Drie onderwerpen uit de industrie voor Data Science toepassingen 1. Quality 2. Asset Utilisation 3. Supply Chain 4. (Service / aftersales – sla ik over) • Setting: machinepark / factory floor • Er is een moderne data huishouding − Order & product data, productie instellingen… − Kwaliteits data, productie failures, yield, … − (I)IoT machine sensor data 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business16
  • 17. Openbaar 1. Quality (conform specificatie) Kennis vergaren om kwaliteit te verhogen • Traditioneel: six sigma aanpak − Continuous process improvement − Scheiden natuurlijke variatie en special causes − Inschatten effectgroottes: effect product/proces parameters op eindproduct − SPC indicatoren erop zetten • Data Science bouwt hier door op basis van IT mogelijkheden: − Kort cyclisch hypothesen testen − Breder zoeken naar statistische verbanden (soms semi-geautomatiseerd) − Veel meer data, dus ook zwakke/complexere verbanden statistisch relevant • Bijvoorbeeld: effect product configuraties op aantal productie failures 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business17
  • 18. Openbaar 1. Quality (conform specificatie) Niet-destructief testen/inspecteren 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business18 Automatische kwaliteitsinspecties: 1. Eerst plaatsen camera (of andere sensoren) 2. Data vergaren over kwaliteit afwijkingen die te linken is aan de data (beelden) 3. Model trainen en gebruiken om alleen interessante gevallen handmatig te doen 4. Op basis van 3 verbeteren en automatiseren • Dit werkt omdat het een ‘smalle taak’ is • Vaak zelfs betere inspectie mogelijk dan de niet-(semi-)automatische variant
  • 19. Openbaar 2. Asset Utilisation • Lean en bottleneck scheduling de basis. • Maar als productie proces complexer: − JIT schedule op de MPS. MRP en planning voor workcenters volgens ‘exploding’ principe? Dan alleen ideaal als er genoeg workcenters zijn. • Echt goed met alle assets omgaan vergt wiskundige planningsoplossing − Interactie van kosten en doorlooptijden 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business19
  • 20. Openbaar Automatisch plannen • Vooral bruikbaar als: − Proces voldoende gestandaardiseerd en gesimplificeerd − Ontwikkeling en adoptie lastig in situaties waar veel informele lijntjes en informele eisen zijn − In essentie moet plannen puzzelen zijn, net als een sudoku (met puntentelling voor kosten) • Termen als Proces simplificatie, routing flexibility en machine flexibility gaan hand in hand met automatisch plannen − Gevolg: sneller en flexibeler leveren, ook in kleine batches, tegen beperkte kosten • Semi-automatische planning leidt tot: − Kosten reductie − Mogelijkheid tot snelle what-if studies samen met simulatie tooling 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business20
  • 21. Openbaar 2. Asset Utilisation Predictive Maintenance/Anomaly Detection De belofte: • Hogere asset utilisation via condition-based maintenance • Uitval gedrag voorspellen op basis van sensor data (IIoT) Echter: • Vaak geen data over failures. − Model kan alleen door combinatie domein kennis en data. − Beste resultaten als de data verzameling strategie al predictive maintenance tot doel heeft • Of door combinatie data science en begrip van de machine Alternatief: • Anomaly detection: Data Science model dat ‘afwijkingen van normale operatie’ detecteert 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business21
  • 22. Openbaar 3. Supply Chain – forecasting Connected company logistics • Forecasting doen we natuurlijk al jaren • Met data science, kun je real-time forecasten met: − Scheiden effecten trend, seizoen, dag van de week etc. − Uitgesplitst per verkooppunt − Weersverwachting als input? − Specifiek rekening houden met vakantiedagen − … • Dit kan veel betekenen voor je supply chain planning − Descision support over descision automation! • Soms in combinatie met IoT: − Connected vending machines, containers, etc. 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business22
  • 23. Openbaar Views voorspellen… 23 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
  • 24. Openbaar 3. Supply Chain – planning Connected company logistics 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business24 • Wiskundig kosten doorrekenen en optimaliseren: − Minimale kilometers, leeg volume, voorraden, etc. − Wanneer bezorgen? Als bijna op, of als toch in de buurt? − Past dat nog in de truck? − Wat betekent dat voor de planning? • Verschil met vroeger: − Real-time informatie verwerken − Met computermodellen kosten volledig optimaliseren • Uitdagingen bij realisatie zitten in: − Inherent onvoorspelbare zaken (sommige files) − Plannen is niet hetzelfde als herplannen − Huidige methodiek vangen in regels
  • 25. Openbaar Industrie: Lean Six Sigma – of Industrie 4.0 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business25
  • 26. Openbaar 2b. Kort: voorbeelden points of contact met consumenten 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business26
  • 27. Openbaar Veel toepassingen in `big data’ m.b.t. consumenten 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business27
  • 28. Openbaar Points of contact met consumenten • Voorspellen: − Personalised Recommendations − Churn / loyalty − Conversie − Beste timing om klant te benaderen • Descriptive/Diagnostic: − Wat wordt er over mijn bedrijf/product gezegd op internet − Topic detectie − Sentiment analyse − Klant profielen opstellen 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business28 Niet alleen Data Science, maar breder Digital Business: Data verzamelen, data beheer, data infrastructuur.
  • 29. Openbaar Veel data science toepassingen in `big data’ m.b.t. consumenten • Als je product een website/platvorm is, dan krijg je dit soort data vanzelf. − Alle verkeer op je website precies volgen − Hiermee kun je profielen opstellen − Vervolgens: inzicht in waarom mandjes niet afgerekend worden, welke producten bekeken worden voordat een product gekocht wordt • Big data consumenten setting kun je creëren met je product (soms via IoT): − Hoe wordt je product gebruikt? Alle knopjes waar op gedrukt wordt loggen? − Predictive maintenance of anderszins support op basis van gebruiksdata? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business29
  • 30. Openbaar Mijn doel voor deze bijeenkomst En tevens de agenda… 1. Wat is Data Science? − Verhouding tussen Data Science en wat men al jaren doet − Nieuwe mogelijkheden met Data Science t.o.v. 10 jaar geleden 2. Legio voorbeelden van toepassingen − Eerst veel voorbeelden uit de industrie, dan consumenten data 3. Waar te beginnen en hoe pak je dat aan − Basis aanpak voor identificeren mogelijkheden − Kort hoe een Data Science project werkt 4. Teleurstellingen en misverstanden over Data Science − Een aantal hardnekkige misverstanden − Het gevaar dat iedereen zich tegenwoordig ‘Data Scientist’ noemt 5. Kort: wat biedt Valid? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business30
  • 31. Openbaar 3a. Waar te beginnen? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business31
  • 32. Openbaar Waar toepassingen te vinden? Data Science: van informatie (data) naar beslissing/actie 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business32
  • 33. Openbaar Waar toepassingen te vinden? Data Science: van informatie (data) naar beslissing/actie • Bekijk de belangrijkste bedrijfspijlers: − Onderdelen van de operatie − Points of contact met klanten/consumenten − Daar waar belangrijke keuzes gemaakt worden • Welke beslissingen worden waar genomen? − Over welke beslissingen hebben we data? − Is die data voldoende om de beslissing te nemen − Kunnen we dit ondersteunen of automatiseren? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business33
  • 34. Openbaar Plekken waar efficiency te winnen is, of beter begrip van de situatie gewenst is 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business34 Niet alleen Data Science, maar breder Digital Business: Data verzamelen, data beheer, data infrastructuur. En: processen zelf simplificeren, standardiseren en flexibeler maken
  • 35. Openbaar 3b. Hoe pak je zoiets aan? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business35
  • 36. Openbaar Data Science onderdeel van Digital Business Zonder digitalisering werkt het niet • Digitalisering uitdagingen: data en infrastructuur − Data kwaliteit en single source of truth − Produceer ik de juiste (relevante) data − Welke data infrastructuur past bij mij? • Proces uitdagingen: standaardisatie en simplificatie! − Meer met Data Science te halen bij flexibele, eenvoudige, gestandaardiseerde processen − Data heeft dan ook meer betekenis t.o.v. het echte proces • Keiharde business involvement nodig − Data Science is geen puur IT feestje – dan is het gedoemd te falen – wel de aansluiting goed regelen − Visie op waar Data Science bedraagt aan strategische doelen 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business36 Nodig: Een moderne datahuishouding en data platvorm
  • 37. Openbaar READY Definieer probleem en randvoorwaarden Schat businesscase en impact, data beschikbaarheid en kwaliteit in Definieer MVP, onderzoek haalbaarheid, stel solution groei plan op SET MVP iteratief uitwerken (1-4 weken cyclus) CRISP-DM model elke fase kort doorlopen Verwachtingen managen: accepteer grillig proces STAY AHEAD Volledige product lifecycle in kaart brengen Gat tussen scalable solution en MVP dichten Start van voor af aan met improvement projecten, groei naar scalable solution Onze data Science methodiek Gestoeld op CRISP-DM en Microsofts ‘Team Data Science Process’ 37 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
  • 38. Openbaar Iedere 1-4 weken in-depth overleg met business − Business owner en data scientist werken intensief samen − Ontwikkel oplossing voor precies het juiste probleem − Tijdens het proces ontstaan altijd nieuwe inzichten Alle zes CRISP-DM fasen per iteratie − Soms heel kort, soms uitgebreid − Vandaar verschil in duur per iteratie. SET: Data Science is een iteratief proces CRISP-DM: CRoss-Industry Standard Process for Data Mining 38 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
  • 39. Openbaar 4. Valkuilen, misverstanden, belemmeringen, etc. Data Science is vaak innovatief dus met enig risico 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business39
  • 40. Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business40
  • 41. How use Decision Making knowledge to improve Data Science impact? Large impact Limited impact Valkuil 1: “Geef de Data Scientist data en hij haalt er waarde uit”.
  • 42. Openbaar Unicorn probleem Iedereen wil Data Scientists, maar deze skills gaan moeilijk samen 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business42
  • 43. Openbaar Het ‘niet data scientist’ prototype dat de aandacht opeist Met rapid prototyping kom je een heel eind 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business43 En dat is ook niet zo erg, als je je verwachtingen daarop aansluit, maar dat doen we doorgaans niet
  • 44. Openbaar Typisch gebeurt er dan dit • Is dit een probleem? − Wel handig, data science zien als API, veel makkelijker − Die black box kun je toch niet perfect begrijpen (wel op hoofdlijnen) − We maken wat moois toch? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business44
  • 45. Openbaar Laten we dit eens naast de toepassingen leggen 1. Descriptive Analytics What happened? • Data visualisatie, exploratie, BI • Niets aan de hand, dit werkt gewoon • Een groot deel van het data science werk zit toch hier 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business45
  • 46. Openbaar Laten we dit eens naast de toepassingen leggen 2. Diagnostic Analytics Why did it happen? • Je kunt niet bepalen hoe groot een verband is − Bijvoorbeeld tussen fouten en oorzaken • Of hoe groot verbanden/effecten zijn: − Seizoenseffecten? Weerseffecten? • Of, of een verband statistisch significant is? Al bovenstaande zijn extreem nuttige kijken op data, waar klanten/projecten verder mee komen! 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business46 Dit is puur statistiek, dit kan alleen white-box
  • 47. Openbaar Laten we dit eens naast de toepassingen leggen 3. Predictive Analytics What will happen? • Voorspellen! De heilige graal van data science − Machine learning - als API en dus Black Box − Bijvoorbeeld: AutoML • Maar wat als: − Data van gisteren afwijkt van data van morgen? Black box kan dat niet snappen − Data over mensen gaat? Wat voor eigenschappen neem je wel en niet mee?  Black box modellen kunnen geen verschil maken tussen correlatie en causale verbanden  Beoordeeld/veroordeeld mensen op basis van ‘birds of a feather’ • Echte bedrijfsbeslissingen worden niet genomen op basis van een getalletje zonder context 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business47
  • 48. Openbaar Laten we dit eens naast de toepassingen leggen 4. Prescriptive analytics What should I do? • Wil ik overslaan − Dit is een vak apart: Operations Research − Api’s bestaan, zijn ook super goed − Als je die goed kunt gebruiken, dan snap je OR ook • Sommige data scientists noemen dit geen ‘data science’ omdat dit een vak apart is 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business48
  • 49. Openbaar We beloven, marketen en hypen dit… Our Foes Data Science and AI We leveren vervolgens dit… 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business49 Omdat ‘Data Scientists’ niet leveren, iets anders leveren of teleurstellingen leveren, wordt Data Science in de markt langzaam een soort BI++, terwijl kansen op succesvolle high-value projecten blijven liggen.
  • 50. Openbaar Teleurstellingen extra aangewakkerd door partners die veel gave tech leveren, maar ook graag API’s pushen 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business50
  • 51. Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business51
  • 52. Openbaar Voorspellen wanneer de pan (over)kookt? Nodig: • Huidige temperatuur • Hoe hard het gas staat 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business52 Wat voor patroon laten we AutoML leren? • Het is nu 40 graden, koken over 20 minuten • Het is nu 46 graden, koken over 18 minuten • Het is nu 20 graden, koken over 10 minuten • … AutoML zoekt een patroon tussen temperatuur en tijd tot koken Hoe hard het gas staat wordt helemaal niet meegenomen Dat komt door hoe wij data aanbieden aan AutoML
  • 53. Openbaar Wat biedt Valid? 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business53
  • 54. Openbaar READY Definieer probleem en randvoorwaarden Schat businesscase en impact, data beschikbaarheid en kwaliteit in Definieer MVP, onderzoek haalbaarheid, stel solution groei plan op SET MVP iteratief uitwerken (1-4 weken cyclus) CRISP-DM model elke fase kort doorlopen Verwachtingen managen: accepteer grillig proces STAY AHEAD Volledige product lifecycle in kaart brengen Gat tussen scalable solution en MVP dichten Start van voor af aan met improvement projecten, groei naar scalable solution Onze data Science methodiek Gestoeld op CRISP-DM en Microsofts ‘Team Data Science Process’ 54 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
  • 55. Openbaar Daarom Data Science bij Valid! Reden Voordeel Stay Ahead = vooroplopen in jouw sector Samen maken wij data science oplossingen die jouw business echt verder helpen Valid is “Echt” Vakmensen, geen cowboys die wiskunde onder de tools niet snappen “Microsoft, tenzij” Snel en niet duur, schakelen op basis van de Microsoft stack... En aanvullende technologieën waar nodig Multi-disciplinair team, minder blinde vlekken Alle activiteiten rondom Data Science zetten wij optimaal in (BI, cloud-infra, applicatie development…) Risico beheersing Bewezen werkwijze op basis van industry standards (CRISP-DM en Team Data Science Process) Valid is de technology provider Maatwerk oplossingen performen in veel domeinen significant beter dan standaard applicaties 55 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
  • 56. Openbaar56 Data Science: Inzicht in mogelijkheden en kansen voor uw business Microsoft Modern Data Platform 12-9-2019
  • 57. Openbaar Data Platform Strategy & Assessment Data Management & Integration Managed Services AnalyticsReporting Data Platform 57 Data Science: Inzicht in mogelijkheden en kansen voor uw business Valid Modern Data Platform 12-9-2019
  • 58. Openbaar IoT at Valid a glance • IoT = connectiviteit, meetbaarheid (sensoren in apparaten), data en actie • Valid levert en integreert Microsoft technologie voor connectiviteit, security en interoperability • Integratie met Moderne Data Platvorm − Reporting • Enabeler voor sommige Data Science en BI toepassingen 58 Data Science: Inzicht in mogelijkheden en kansen voor uw business 12-9-2019
  • 59. Openbaar Conclusie 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business59
  • 60. Openbaar Data Science is een interessante nieuwe ontwikkeling 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business60
  • 61. Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business61 Maar je moet het dan wel goed doen
  • 62. Openbaar 12-9-2019Data Science: Inzicht in mogelijkheden en kansen voor uw business62