SlideShare una empresa de Scribd logo
1 de 11
Descargar para leer sin conexión
Zürcher Fachhochschule 
Data Science – (k)eine Teenagerliebe? Thilo Stadelmann, Swiss ICT Symposium, 05. November 2011
Zürcher Fachhochschule 
2 
Teenagerliebe? 
Quelle: https://www.facebook.com/dan.ariely/posts/904383595868 
 Keiner macht es!? 
Agenda 
•Data Science in der öffentlichen Wahrnehmung 
•Spannende Anwendungsfälle, die vielleicht überraschen  Enorm viele Branchen können profitieren 
Data Science ≠ Big Data ! 
Aber: Hohe Korrelation in der aktuellen öffentlichen Wahrnehmung.
Zürcher Fachhochschule 
3 
Beliebte Data Science Beispiele 
•Kauf-Empfehlungen: Bspw. «Netflix Price» (2009) Quelle: http://www.netflixprize.com/ 
•Abwanderungs-Prognosen: Telkos, Versicherungen, … Quelle: http://engineering.zhaw.ch/de/engineering/forschung/publikationen-t.html?pi=206434&gu=96884 
•Warenkorb-Analyse: Bspw. Windeln & Bier, Bücher, … Quelle: http://web.onetel.net.uk/~hibou/Beer%20and%20Nappies.html 
•Risiko und Missbrauch: Lebensversicherungen, Kreditkarten- nutzung Quelle: Eric Siegel, «Predictive Analytics», John Wiley & Sons, 2013 
Benutzerprofile zur Optimierung des Konsums 
…
Zürcher Fachhochschule 
4 
Datengetriebenes arbeiten und personenbezogene Daten 
Datengetrieben arbeiten heisst: 
•Den gesunden Menschenverstand beiseite lassen 
•Korrelation suchen, nicht direkt Kausalzusammenhänge 
Unbewusste Vorgänge werden normativ Vergessen ist nicht vorgesehen 
Nur das gewöhnliche wird gelernt 
Zum Weiterlesen: Byung-Chul Han, «Psychopolitik», S. Fischer, 2014 
Whatever you are doing with computers, you are changing our world. Is it for the better? 
Quelle: Michael L. Brodie, http://www.michaelbrodie.com/michael_brodie_statement.asp
Zürcher Fachhochschule 
5 
Data Science abseits der Hauptbühne
Zürcher Fachhochschule 
6 
Beispiel automatische Vorhersage 
Was? 
Wer? 
Grippe 
Google Flu Trends: Sagt anhand Suchtrends Zunahme von Grippefällen 7-10 Tage vor der zuständigen staatlichen Seuchenstelle voraus 
Systemfehler 
Argonne National Laboratory: Vorhersage von Rissen im Kühlsystem von AKWs BNSF Railway: Vorhersage defekter Gleise 85%  Verhindert schwere Zugunglücke TTX: Vorhersage von Fehlern in hunderttausenden von Eisenbahnrädern zur Abschätzung des jährlichen Wartungsaufwands (98.5% Genauigkeit) 
Ölfördermenge 
National Iranian South Oil Company: Vorhersage der Tagesproduktion an Öl 
Flugverspätung 
Continental Airlines: Vorhersage der Verspätung von Flügen via Radardaten (Einsparung mehrerer 10 Millionen Dollar) 
Fahrer- ablenkung 
Ford Motor Company, TWT GmbH: Grad der Fahrerablenkung für Autolenker (86% Genauigkeit für Ford-System) 
Quellen: 
•Eric Siegel, «Predictive Analytics», John Wiley & Sons, 2013 
•Thilo Stadelmann et al., «FABELHAFT - Fahrerblenkung: Entwicklung eines Meta-Fahrerassistenzsystems durch Echtzeit-Audioklassifikation», VDI Wissensforum, 2012
Zürcher Fachhochschule 
7 
Beispiel Industrie 4.0
Zürcher Fachhochschule 
8 
Beispiel vorausschauende Wartung 
Ausganslage: Wartung grosser Maschinen ist teuer, Ausfall noch teurer 
Ziel: Wartung, wenn Defekt kurz bevorsteht anstatt präventiv 
Herausforderung: Genereller Ansatz - Tuning auf jede individuelle Maschine vermeiden 
Lösung: 
•Sensoren überwachen Betriebsparameter kontinuierlich 
•Datenanalyse z.B. “in der Cloud” 
•Selbstadaptive Signalverarbeitungsansätze 
•Verfolgen von Änderungen über die Zeit
Zürcher Fachhochschule 
9 
Beispiel Informationsbeschaffung / Suche 
Ausgangslage: Ca. 7’500 Förderstiftungen in der Schweiz 
Ziel: Visuelle Suche anhand eines Förderantrags soll geeignetsten Sponsor zu Tage fördern 
Herausforderung: Quantifizieren & Darstellen der inhaltlichen Ähnlichkeit von Stiftungszwecken 
Lösung: 
•Entwicklung eines mehrsprachigen Suchsystems 
•Extrem kleiner Datensatz für aussagekräftige Suchverfahren (7’500 Stiftungszweck-Dokumente)  Extrem recall-orientiert (Suchleistung vs. Präzision der Ergebnisse) 
•Sehr grosser Datensatz für intuitive Visualisierungen  “Forced Directed Layout” auf Ähnlichkeitsmatrix der Wörter sowie Themenmodellierung
Zürcher Fachhochschule 
10 
Beispiel Open Data Exploration («SODES») 
Ausgangslage: Open Data könnte sich als Goldgrube erweisen – wenn es nicht so zeitaufwändig zu integrieren wäre Ziel: Eine Plattform für einfachen und intuitiven Zugang, Integration und Exploration verschiedener Datenquellen 
Herausforderung: Betrieb der Plattform 
Lösung: 
•Konzept und Methodik vorhanden 
•Betriebspartner gesucht
Zürcher Fachhochschule 
11 
Fazit 
•Fertigungsautomation 
•Vorausschauende Wartung 
•Suche und Informationsbeschaffung 
•Intelligente Vorverarbeitung von Daten 
•… 
 Viele lohnende Anwendungsfälle für Advanced Analytics jenseits von «BI» 
Mehr Data Science? 
•Weiterbildung: dlab.zhaw.ch/teaching 
•Konferenz: dlab.zhaw.ch/sds2015 
•Projekte: datalab@zhaw.ch

Más contenido relacionado

Similar a Data Science - (K)eine Teenagerliebe

Digitale Datenerfassung an der Maschine | Digitale Zukunft Mittelstand Baden-...
Digitale Datenerfassung an der Maschine | Digitale Zukunft Mittelstand Baden-...Digitale Datenerfassung an der Maschine | Digitale Zukunft Mittelstand Baden-...
Digitale Datenerfassung an der Maschine | Digitale Zukunft Mittelstand Baden-...Bechtle
 
Swiss Territorial Data Lab - geo Data Science - colloque swisstopo
Swiss Territorial Data Lab - geo Data Science - colloque swisstopoSwiss Territorial Data Lab - geo Data Science - colloque swisstopo
Swiss Territorial Data Lab - geo Data Science - colloque swisstopoRaphael Rollier
 
BITKOM_Präsentation Data Intelligence Hub -Schwarz-Kouril
BITKOM_Präsentation Data Intelligence Hub -Schwarz-KourilBITKOM_Präsentation Data Intelligence Hub -Schwarz-Kouril
BITKOM_Präsentation Data Intelligence Hub -Schwarz-KourilStefan Schwarz
 
Was die Cloud mit einem brennenden Haus zu tun hat
Was die Cloud mit einem brennenden Haus zu tun hatWas die Cloud mit einem brennenden Haus zu tun hat
Was die Cloud mit einem brennenden Haus zu tun hatNane Kratzke
 
Big Data Discovery + Analytics = Datengetriebene Innovation!
Big Data Discovery + Analytics = Datengetriebene Innovation!Big Data Discovery + Analytics = Datengetriebene Innovation!
Big Data Discovery + Analytics = Datengetriebene Innovation!Harald Erb
 
Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)AWS Germany
 
Datentresor Schweiz und Schlussfolgerungen, volkswirtschaftliche Effekte und ...
Datentresor Schweiz und Schlussfolgerungen, volkswirtschaftliche Effekte und ...Datentresor Schweiz und Schlussfolgerungen, volkswirtschaftliche Effekte und ...
Datentresor Schweiz und Schlussfolgerungen, volkswirtschaftliche Effekte und ...Lea-María Louzada
 
SOCIAL MEDIA MONITORING & ANALYSE ZUR RISIKOPRAEVENTION BEI GROSSVERANSTALTUNGEN
SOCIAL MEDIA MONITORING & ANALYSE ZUR RISIKOPRAEVENTION BEI GROSSVERANSTALTUNGENSOCIAL MEDIA MONITORING & ANALYSE ZUR RISIKOPRAEVENTION BEI GROSSVERANSTALTUNGEN
SOCIAL MEDIA MONITORING & ANALYSE ZUR RISIKOPRAEVENTION BEI GROSSVERANSTALTUNGENRADiOSPHERE
 
scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®
scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid® scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®
scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid® scopeKM GmbH Knowledge Management
 
Webinale 2011 - Das mobile Internet im Jahr 2021
Webinale 2011 - Das mobile Internet im Jahr 2021Webinale 2011 - Das mobile Internet im Jahr 2021
Webinale 2011 - Das mobile Internet im Jahr 2021Matthias C. Schroeder
 
Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenMartin Voigt
 
Bessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity RecognitionBessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity Recognitioncneudecker
 
8 Tipps für eine Cloud Strategie – wie Unternehmen heute die Cloud einsetzen
8 Tipps für eine Cloud Strategie – wie Unternehmen heute die Cloud einsetzen8 Tipps für eine Cloud Strategie – wie Unternehmen heute die Cloud einsetzen
8 Tipps für eine Cloud Strategie – wie Unternehmen heute die Cloud einsetzenAWS Germany
 
Dr. Clemens Wagner-Bruschek, ERP (d-fine Austria)
Dr. Clemens Wagner-Bruschek, ERP (d-fine Austria)Dr. Clemens Wagner-Bruschek, ERP (d-fine Austria)
Dr. Clemens Wagner-Bruschek, ERP (d-fine Austria)Praxistage
 
Mobile Computing and Semantic Web for Medicine and Health Information
Mobile Computing and Semantic Web for Medicine and Health InformationMobile Computing and Semantic Web for Medicine and Health Information
Mobile Computing and Semantic Web for Medicine and Health InformationGuus van den Brekel
 
KI und Predictive Maintenance am Beispiel von DB Cargo
KI und Predictive Maintenance am Beispiel von DB CargoKI und Predictive Maintenance am Beispiel von DB Cargo
KI und Predictive Maintenance am Beispiel von DB CargoInspirient
 
CRO Prozesse mit Data Mining Optimieren
CRO Prozesse mit Data Mining OptimierenCRO Prozesse mit Data Mining Optimieren
CRO Prozesse mit Data Mining OptimierenLaurent Müllender
 
Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Semantic Web Company
 

Similar a Data Science - (K)eine Teenagerliebe (20)

Digitale Datenerfassung an der Maschine | Digitale Zukunft Mittelstand Baden-...
Digitale Datenerfassung an der Maschine | Digitale Zukunft Mittelstand Baden-...Digitale Datenerfassung an der Maschine | Digitale Zukunft Mittelstand Baden-...
Digitale Datenerfassung an der Maschine | Digitale Zukunft Mittelstand Baden-...
 
Zeitreihen in Apache Cassandra
Zeitreihen in Apache CassandraZeitreihen in Apache Cassandra
Zeitreihen in Apache Cassandra
 
Swiss Territorial Data Lab - geo Data Science - colloque swisstopo
Swiss Territorial Data Lab - geo Data Science - colloque swisstopoSwiss Territorial Data Lab - geo Data Science - colloque swisstopo
Swiss Territorial Data Lab - geo Data Science - colloque swisstopo
 
BITKOM_Präsentation Data Intelligence Hub -Schwarz-Kouril
BITKOM_Präsentation Data Intelligence Hub -Schwarz-KourilBITKOM_Präsentation Data Intelligence Hub -Schwarz-Kouril
BITKOM_Präsentation Data Intelligence Hub -Schwarz-Kouril
 
Was die Cloud mit einem brennenden Haus zu tun hat
Was die Cloud mit einem brennenden Haus zu tun hatWas die Cloud mit einem brennenden Haus zu tun hat
Was die Cloud mit einem brennenden Haus zu tun hat
 
Big Data Discovery + Analytics = Datengetriebene Innovation!
Big Data Discovery + Analytics = Datengetriebene Innovation!Big Data Discovery + Analytics = Datengetriebene Innovation!
Big Data Discovery + Analytics = Datengetriebene Innovation!
 
Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)Big Data Webinar (Deutsch)
Big Data Webinar (Deutsch)
 
Datentresor Schweiz und Schlussfolgerungen, volkswirtschaftliche Effekte und ...
Datentresor Schweiz und Schlussfolgerungen, volkswirtschaftliche Effekte und ...Datentresor Schweiz und Schlussfolgerungen, volkswirtschaftliche Effekte und ...
Datentresor Schweiz und Schlussfolgerungen, volkswirtschaftliche Effekte und ...
 
SOCIAL MEDIA MONITORING & ANALYSE ZUR RISIKOPRAEVENTION BEI GROSSVERANSTALTUNGEN
SOCIAL MEDIA MONITORING & ANALYSE ZUR RISIKOPRAEVENTION BEI GROSSVERANSTALTUNGENSOCIAL MEDIA MONITORING & ANALYSE ZUR RISIKOPRAEVENTION BEI GROSSVERANSTALTUNGEN
SOCIAL MEDIA MONITORING & ANALYSE ZUR RISIKOPRAEVENTION BEI GROSSVERANSTALTUNGEN
 
scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®
scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid® scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®
scopeKM: Chancen und Risiken erkennen mit der textanalytischen Lösung Luxid®
 
Webinale 2011 - Das mobile Internet im Jahr 2021
Webinale 2011 - Das mobile Internet im Jahr 2021Webinale 2011 - Das mobile Internet im Jahr 2021
Webinale 2011 - Das mobile Internet im Jahr 2021
 
Einführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in MassendatenEinführung in die semantische Suche in Massendaten
Einführung in die semantische Suche in Massendaten
 
Bessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity RecognitionBessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity Recognition
 
8 Tipps für eine Cloud Strategie – wie Unternehmen heute die Cloud einsetzen
8 Tipps für eine Cloud Strategie – wie Unternehmen heute die Cloud einsetzen8 Tipps für eine Cloud Strategie – wie Unternehmen heute die Cloud einsetzen
8 Tipps für eine Cloud Strategie – wie Unternehmen heute die Cloud einsetzen
 
Dr. Clemens Wagner-Bruschek, ERP (d-fine Austria)
Dr. Clemens Wagner-Bruschek, ERP (d-fine Austria)Dr. Clemens Wagner-Bruschek, ERP (d-fine Austria)
Dr. Clemens Wagner-Bruschek, ERP (d-fine Austria)
 
Mobile Computing and Semantic Web for Medicine and Health Information
Mobile Computing and Semantic Web for Medicine and Health InformationMobile Computing and Semantic Web for Medicine and Health Information
Mobile Computing and Semantic Web for Medicine and Health Information
 
KI und Predictive Maintenance am Beispiel von DB Cargo
KI und Predictive Maintenance am Beispiel von DB CargoKI und Predictive Maintenance am Beispiel von DB Cargo
KI und Predictive Maintenance am Beispiel von DB Cargo
 
CRO Prozesse mit Data Mining Optimieren
CRO Prozesse mit Data Mining OptimierenCRO Prozesse mit Data Mining Optimieren
CRO Prozesse mit Data Mining Optimieren
 
Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?
 
Webinar - Predictive ohne Daten - geht das?
Webinar - Predictive ohne Daten - geht das?Webinar - Predictive ohne Daten - geht das?
Webinar - Predictive ohne Daten - geht das?
 

Data Science - (K)eine Teenagerliebe

  • 1. Zürcher Fachhochschule Data Science – (k)eine Teenagerliebe? Thilo Stadelmann, Swiss ICT Symposium, 05. November 2011
  • 2. Zürcher Fachhochschule 2 Teenagerliebe? Quelle: https://www.facebook.com/dan.ariely/posts/904383595868  Keiner macht es!? Agenda •Data Science in der öffentlichen Wahrnehmung •Spannende Anwendungsfälle, die vielleicht überraschen  Enorm viele Branchen können profitieren Data Science ≠ Big Data ! Aber: Hohe Korrelation in der aktuellen öffentlichen Wahrnehmung.
  • 3. Zürcher Fachhochschule 3 Beliebte Data Science Beispiele •Kauf-Empfehlungen: Bspw. «Netflix Price» (2009) Quelle: http://www.netflixprize.com/ •Abwanderungs-Prognosen: Telkos, Versicherungen, … Quelle: http://engineering.zhaw.ch/de/engineering/forschung/publikationen-t.html?pi=206434&gu=96884 •Warenkorb-Analyse: Bspw. Windeln & Bier, Bücher, … Quelle: http://web.onetel.net.uk/~hibou/Beer%20and%20Nappies.html •Risiko und Missbrauch: Lebensversicherungen, Kreditkarten- nutzung Quelle: Eric Siegel, «Predictive Analytics», John Wiley & Sons, 2013 Benutzerprofile zur Optimierung des Konsums …
  • 4. Zürcher Fachhochschule 4 Datengetriebenes arbeiten und personenbezogene Daten Datengetrieben arbeiten heisst: •Den gesunden Menschenverstand beiseite lassen •Korrelation suchen, nicht direkt Kausalzusammenhänge Unbewusste Vorgänge werden normativ Vergessen ist nicht vorgesehen Nur das gewöhnliche wird gelernt Zum Weiterlesen: Byung-Chul Han, «Psychopolitik», S. Fischer, 2014 Whatever you are doing with computers, you are changing our world. Is it for the better? Quelle: Michael L. Brodie, http://www.michaelbrodie.com/michael_brodie_statement.asp
  • 5. Zürcher Fachhochschule 5 Data Science abseits der Hauptbühne
  • 6. Zürcher Fachhochschule 6 Beispiel automatische Vorhersage Was? Wer? Grippe Google Flu Trends: Sagt anhand Suchtrends Zunahme von Grippefällen 7-10 Tage vor der zuständigen staatlichen Seuchenstelle voraus Systemfehler Argonne National Laboratory: Vorhersage von Rissen im Kühlsystem von AKWs BNSF Railway: Vorhersage defekter Gleise 85%  Verhindert schwere Zugunglücke TTX: Vorhersage von Fehlern in hunderttausenden von Eisenbahnrädern zur Abschätzung des jährlichen Wartungsaufwands (98.5% Genauigkeit) Ölfördermenge National Iranian South Oil Company: Vorhersage der Tagesproduktion an Öl Flugverspätung Continental Airlines: Vorhersage der Verspätung von Flügen via Radardaten (Einsparung mehrerer 10 Millionen Dollar) Fahrer- ablenkung Ford Motor Company, TWT GmbH: Grad der Fahrerablenkung für Autolenker (86% Genauigkeit für Ford-System) Quellen: •Eric Siegel, «Predictive Analytics», John Wiley & Sons, 2013 •Thilo Stadelmann et al., «FABELHAFT - Fahrerblenkung: Entwicklung eines Meta-Fahrerassistenzsystems durch Echtzeit-Audioklassifikation», VDI Wissensforum, 2012
  • 7. Zürcher Fachhochschule 7 Beispiel Industrie 4.0
  • 8. Zürcher Fachhochschule 8 Beispiel vorausschauende Wartung Ausganslage: Wartung grosser Maschinen ist teuer, Ausfall noch teurer Ziel: Wartung, wenn Defekt kurz bevorsteht anstatt präventiv Herausforderung: Genereller Ansatz - Tuning auf jede individuelle Maschine vermeiden Lösung: •Sensoren überwachen Betriebsparameter kontinuierlich •Datenanalyse z.B. “in der Cloud” •Selbstadaptive Signalverarbeitungsansätze •Verfolgen von Änderungen über die Zeit
  • 9. Zürcher Fachhochschule 9 Beispiel Informationsbeschaffung / Suche Ausgangslage: Ca. 7’500 Förderstiftungen in der Schweiz Ziel: Visuelle Suche anhand eines Förderantrags soll geeignetsten Sponsor zu Tage fördern Herausforderung: Quantifizieren & Darstellen der inhaltlichen Ähnlichkeit von Stiftungszwecken Lösung: •Entwicklung eines mehrsprachigen Suchsystems •Extrem kleiner Datensatz für aussagekräftige Suchverfahren (7’500 Stiftungszweck-Dokumente)  Extrem recall-orientiert (Suchleistung vs. Präzision der Ergebnisse) •Sehr grosser Datensatz für intuitive Visualisierungen  “Forced Directed Layout” auf Ähnlichkeitsmatrix der Wörter sowie Themenmodellierung
  • 10. Zürcher Fachhochschule 10 Beispiel Open Data Exploration («SODES») Ausgangslage: Open Data könnte sich als Goldgrube erweisen – wenn es nicht so zeitaufwändig zu integrieren wäre Ziel: Eine Plattform für einfachen und intuitiven Zugang, Integration und Exploration verschiedener Datenquellen Herausforderung: Betrieb der Plattform Lösung: •Konzept und Methodik vorhanden •Betriebspartner gesucht
  • 11. Zürcher Fachhochschule 11 Fazit •Fertigungsautomation •Vorausschauende Wartung •Suche und Informationsbeschaffung •Intelligente Vorverarbeitung von Daten •…  Viele lohnende Anwendungsfälle für Advanced Analytics jenseits von «BI» Mehr Data Science? •Weiterbildung: dlab.zhaw.ch/teaching •Konferenz: dlab.zhaw.ch/sds2015 •Projekte: datalab@zhaw.ch