SlideShare una empresa de Scribd logo
1 de 23
Descargar para leer sin conexión
Algorithmus
Torben Brodt
plista GmbH
23. Januar 2013
Camp Digital, Good School
Inhalt Algorithmus
1. Vorstellung
2. Das Spiel
3. Definition Algorithmus
4. Welche Aufgaben?
5. Welche Daten?
6. Welche Konzepte?
7. Grenzen?
8. Fragen
Vorstellung
● plista GmbH
○ Empfehlungs- & Werbenetzwerk
○ 2008 Gründung, Sitz in Berlin
○ ~3k Recommendations/Sekunde
● Torben Brodt, Head of Data Engineering
○ 2003 Black Hat SEO
○ 2004 Programmier Forum
○ 2005 Studium Informatik
○ 2008 plista
○ 2010 Buch „Collaborative Filtering“
○ TV + Radio „Macht der Algorithmen“
Algorithmus das Spiel
● Es gibt 18 Streichhölzer
● Der erste Spieler nimmt 1, 2 oder 3, der auf
dem Tisch liegenden Streichhölzer
● Danach nimmt der zweite Spieler entweder
1, 2 oder 3 der verbleibenden Hölzer... usw.
● Verloren hat der Spieler, der das letzte
Streichholz vom Tisch nimmt
● Bitte jetzt Paare bilden für Runde 1,
danach treten die Gewinner
gegeneinander an
Algorithmus das Spiel
● Wie lautet die Gewinnformel?
● Intuition?
Algorithmus das Spiel
● Wie lautet die Gewinnformel?
● Intuition? Logik?
Quelle: http://www-i1.informatik.rwth-aachen.de/~algorithmus/algo14.php
Algorithmus der Woche, Jochen Könemann, University of Waterloo
i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
G N J J J N J J J N J J J N J J J N J
i Streichhölzer
G Gewinn möglich
Sequenz wiederholt sich
Definition Algorithmus
● Wortherkunft: arabisches Lehrbuch,
lateinisch übersetzt: „dixit Algorismi“
● Schritt für Schritt Abfolge zur Lösung
eines Problems
● Algorithmus = Gewinnformel
● Simples Beispiel: „Kochrezept“
● „Big Data“: komplexe Probleme mit
großen Datenmengen
Algorithmus
Big Data: Welche Aufgaben?
● Bekannte Nutzer von Big Data Algorithmen
○ Google
○ Facebook
○ Amazon
○ ... uvm
● Konfrontiert mit gigantischer Datenmenge
● Berechnung nach individuellen Bedürfnissen
Big Data: Welche Daten?
● Was wissen "die" eigentlich über euch?
● Context der Anfrage / Parameter der Anfrage
● CRM: Demographie, Kaufkraft, uvm.
● Anonyme Daten: URL, Geolocation, Uhrzeit,
Wochentag, Suchanfrage, Gerät, Betriebssystem,
uvm
● Social Daten: Alter, Geschlecht, Hobbies, etc
○ z.B. „Nach Facebook Login“
● Alle diese Daten werden gesammelt
Big Data: Welche Konzepte?
● Modelle und Herangehensweisen um Daten
nutzbar zu machen
a) Logik
b) Clustering
c) Neighborhood
d) Ausprobieren
e) Mittelwerte
● Das sind Grundlagen, aber es gibt noch
konkretere Algorithmen
Konzept a) Logik & Mathematik
● Wir verlassen uns auf Zahlen, wir nutzen
unser Wissen
○ Welche Relevanz hat eine Website bei Google?
○ 75% 3 von 4 Wörter Suchanfrage zu Text
○ 50% Pagerank 5 von 10
Konzept a) Logik & Mathematik
● Wissensdatenbank
○ Matching zwischen Person und Gegenstand
○ "Frauen besuchen Brigitte.de"
● Parameter berechnen
○ Kreditvergabe:
■ Höhe des Kredits
■ Höhe des Einkommens
■ ...
○ Suchmaschinen Ergebnis
○ Herzinfarkt-Risiko
○ ...
Konzept b) Clustering
● Alle Möglichkeiten abzuwägen wäre
kompliziert
● also fassen wir "Dinge" zu "Clustern"
zusammen
● Vorteil 1: Weniger Komplexität bei
Entscheidungen!
● Vorteil 2: Mehr Datendichte
Konzept b) Clustering
A B
C D
Konzept c) Neighborhood
Konzept c) Neighborhood
Konzept c) Neighborhood
● Gemeinsamkeiten suchen (ähnlich Clustering)
● Bekanntes auf Unbekanntes übertragen
● Allgemeiner Ansatz für Finanz-
Entscheidung, Werbe-Empfehlung,
Herzinfarkt-Risiko
● "Kollektive Intelligenz" - Mit neuen Daten
werden die Empfehlungen automatisch
besser
Konzept d) Ausprobieren
● "Trial and Error"
○ ausprobieren, scheitern, verbessern
● Man sollte fortlaufend beobachten
○ „Live Training“, denn alles ändert sich
○ Dazu technisches System um Erfolge zu
kontrollieren
● A/B Testing
○ Beispiel Telefonmarketing
○ Variable: Ruft eine Frau oder ein Mann an?
● Multivariante A/B Tests
○ Mehr als eine Variable
Konzept e) Mittelwert
Konzept e) Mittelwert
● Wir haben Statistiken für alle Eingabe-
Parameter
○ Wir orientieren uns am Durchschnittswert
○ Wir empfehlen das, was der Mainstream mag
● Kombination verschiedener Mittelwerte je
nach Eingabeparameter
● Welcher Wert für Gender=Frau
● Welche Empfehlung für Publisher=fussball.
de
Wo sind die Grenzen?
● Es gibt keine Grenzen
● Datenmengen bis in Petabyte Dimensionen
○ Das sind viele Otto-Normal-Festplatten ;)
● Auswertungen in Echtzeit
○ Keine Lochkarten Maschinen mehr
● Integration überall dort wo man es braucht
○ Keine Blackboxen mehr, der Mensch will verstehen
● Mehr im "Data Unser"
Fazit
● „Das Spiel“ hat gezeigt, dass Algorithmen
auch mit Intuition gestützt werden können
● Es gibt verschiedene Konzepte, diese sind
auch intuitiv
● Konzepte lassen sich miteinander
kombinieren
● Es gibt viele Daten und alle Daten bieten
Mehrwert,
● Eure Daten sind wertvoll
Mehr Informationen: http://cra.org/ccc/docs/init/bigdatawhitepaper.pdf
Challenges and Opportunities with Big Data, From leading researchers across the United States
Fragen?
www.plista.com
torben.brodt@plista.com
@torbenbrodt
xing.com/profile/Torben_Brodt
http://goo.gl/pvXm5

Más contenido relacionado

Destacado

Mantenimiento de computadores
Mantenimiento de computadoresMantenimiento de computadores
Mantenimiento de computadoresarther000
 
Marketing von Open-Source-Software
Marketing von Open-Source-SoftwareMarketing von Open-Source-Software
Marketing von Open-Source-SoftwareSandro Groganz
 
Procesos lineales e intermitentes
Procesos lineales e intermitentesProcesos lineales e intermitentes
Procesos lineales e intermitentesAleMelgarSett
 
Verknuepfung von Kundenmagazinen und Weblogs
Verknuepfung von Kundenmagazinen und WeblogsVerknuepfung von Kundenmagazinen und Weblogs
Verknuepfung von Kundenmagazinen und WeblogsDirk P.
 
Lo mas carilloso monica melissa gomez
Lo mas carilloso monica melissa gomezLo mas carilloso monica melissa gomez
Lo mas carilloso monica melissa gomezMonica Melissa Gomez
 
Szenarien im Tourismus - Einführung
Szenarien im Tourismus - EinführungSzenarien im Tourismus - Einführung
Szenarien im Tourismus - EinführungInes Seidel
 
大野狼肚子餓
大野狼肚子餓大野狼肚子餓
大野狼肚子餓filexkids
 
Louise caroline bourgeois
Louise caroline bourgeoisLouise caroline bourgeois
Louise caroline bourgeoisdolores-007
 
Global village2014
Global village2014Global village2014
Global village2014CREAMEXICO
 
SEMINARIO FUTUROS LÍDERES EN ENERGÍA SOLAR 2013
SEMINARIO FUTUROS LÍDERES EN ENERGÍA SOLAR 2013SEMINARIO FUTUROS LÍDERES EN ENERGÍA SOLAR 2013
SEMINARIO FUTUROS LÍDERES EN ENERGÍA SOLAR 2013Victor Martinez Camero
 

Destacado (19)

Hadas
HadasHadas
Hadas
 
Mantenimiento de computadores
Mantenimiento de computadoresMantenimiento de computadores
Mantenimiento de computadores
 
Marketing von Open-Source-Software
Marketing von Open-Source-SoftwareMarketing von Open-Source-Software
Marketing von Open-Source-Software
 
Seminario 8
Seminario 8Seminario 8
Seminario 8
 
Procesos lineales e intermitentes
Procesos lineales e intermitentesProcesos lineales e intermitentes
Procesos lineales e intermitentes
 
Serverpräs
ServerpräsServerpräs
Serverpräs
 
Verknuepfung von Kundenmagazinen und Weblogs
Verknuepfung von Kundenmagazinen und WeblogsVerknuepfung von Kundenmagazinen und Weblogs
Verknuepfung von Kundenmagazinen und Weblogs
 
Trabajo Informática
Trabajo InformáticaTrabajo Informática
Trabajo Informática
 
Lo mas carilloso monica melissa gomez
Lo mas carilloso monica melissa gomezLo mas carilloso monica melissa gomez
Lo mas carilloso monica melissa gomez
 
Szenarien im Tourismus - Einführung
Szenarien im Tourismus - EinführungSzenarien im Tourismus - Einführung
Szenarien im Tourismus - Einführung
 
大野狼肚子餓
大野狼肚子餓大野狼肚子餓
大野狼肚子餓
 
IA Presentation
IA PresentationIA Presentation
IA Presentation
 
Trabajo de genesis
Trabajo de  genesisTrabajo de  genesis
Trabajo de genesis
 
De General Conditions
De General ConditionsDe General Conditions
De General Conditions
 
Louise caroline bourgeois
Louise caroline bourgeoisLouise caroline bourgeois
Louise caroline bourgeois
 
Global village2014
Global village2014Global village2014
Global village2014
 
SEMINARIO FUTUROS LÍDERES EN ENERGÍA SOLAR 2013
SEMINARIO FUTUROS LÍDERES EN ENERGÍA SOLAR 2013SEMINARIO FUTUROS LÍDERES EN ENERGÍA SOLAR 2013
SEMINARIO FUTUROS LÍDERES EN ENERGÍA SOLAR 2013
 
Block 3
Block 3Block 3
Block 3
 
Amistad
AmistadAmistad
Amistad
 

Similar a Algorithmus, Good School, Camp Digital

Kurze Einführung in agiles Projektmanagement
Kurze Einführung in agiles ProjektmanagementKurze Einführung in agiles Projektmanagement
Kurze Einführung in agiles Projektmanagementwillz
 
R für Data Science und Machine Learning
R für Data Science und Machine LearningR für Data Science und Machine Learning
R für Data Science und Machine LearningDatamics
 
The Power of Deep Learning in Content Analysis
The Power of Deep Learning in Content AnalysisThe Power of Deep Learning in Content Analysis
The Power of Deep Learning in Content AnalysisMichael Weber
 
Deine Digitale Kundenmaschine
Deine Digitale Kundenmaschine Deine Digitale Kundenmaschine
Deine Digitale Kundenmaschine Clemens Endell
 
Open Data oder Commercial Data im DMA – ein Widerspruch?
Open Data oder Commercial Data im DMA – ein Widerspruch?Open Data oder Commercial Data im DMA – ein Widerspruch?
Open Data oder Commercial Data im DMA – ein Widerspruch?Data Market Austria
 
ProgrammatiCon 2017 - First Party Data - Martin Frotzler, e-dialog
ProgrammatiCon 2017 - First Party Data - Martin Frotzler, e-dialogProgrammatiCon 2017 - First Party Data - Martin Frotzler, e-dialog
ProgrammatiCon 2017 - First Party Data - Martin Frotzler, e-dialoge-dialog GmbH
 
Der Wert von Daten in Zeiten von "Big Data"
Der Wert von Daten in Zeiten von "Big Data"Der Wert von Daten in Zeiten von "Big Data"
Der Wert von Daten in Zeiten von "Big Data"Thilo Stadelmann
 
Impulsseminar werden sie ein kunden unternehmen - wissensraum 20130606
Impulsseminar werden sie ein kunden unternehmen - wissensraum 20130606Impulsseminar werden sie ein kunden unternehmen - wissensraum 20130606
Impulsseminar werden sie ein kunden unternehmen - wissensraum 20130606ihrepartner.ch gmbh
 

Similar a Algorithmus, Good School, Camp Digital (11)

Kurze Einführung in agiles Projektmanagement
Kurze Einführung in agiles ProjektmanagementKurze Einführung in agiles Projektmanagement
Kurze Einführung in agiles Projektmanagement
 
R für Data Science und Machine Learning
R für Data Science und Machine LearningR für Data Science und Machine Learning
R für Data Science und Machine Learning
 
Qualitative Trainingsdaten für Machine Learning effizient gewinnen
Qualitative Trainingsdaten für Machine Learning effizient gewinnenQualitative Trainingsdaten für Machine Learning effizient gewinnen
Qualitative Trainingsdaten für Machine Learning effizient gewinnen
 
The Power of Deep Learning in Content Analysis
The Power of Deep Learning in Content AnalysisThe Power of Deep Learning in Content Analysis
The Power of Deep Learning in Content Analysis
 
Deine Digitale Kundenmaschine
Deine Digitale Kundenmaschine Deine Digitale Kundenmaschine
Deine Digitale Kundenmaschine
 
Open Data oder Commercial Data im DMA – ein Widerspruch?
Open Data oder Commercial Data im DMA – ein Widerspruch?Open Data oder Commercial Data im DMA – ein Widerspruch?
Open Data oder Commercial Data im DMA – ein Widerspruch?
 
2017 06-13 odp meet up dma
2017 06-13 odp meet up dma2017 06-13 odp meet up dma
2017 06-13 odp meet up dma
 
2017-05-04 Data Pioneers NetzPAT
2017-05-04 Data Pioneers NetzPAT2017-05-04 Data Pioneers NetzPAT
2017-05-04 Data Pioneers NetzPAT
 
ProgrammatiCon 2017 - First Party Data - Martin Frotzler, e-dialog
ProgrammatiCon 2017 - First Party Data - Martin Frotzler, e-dialogProgrammatiCon 2017 - First Party Data - Martin Frotzler, e-dialog
ProgrammatiCon 2017 - First Party Data - Martin Frotzler, e-dialog
 
Der Wert von Daten in Zeiten von "Big Data"
Der Wert von Daten in Zeiten von "Big Data"Der Wert von Daten in Zeiten von "Big Data"
Der Wert von Daten in Zeiten von "Big Data"
 
Impulsseminar werden sie ein kunden unternehmen - wissensraum 20130606
Impulsseminar werden sie ein kunden unternehmen - wissensraum 20130606Impulsseminar werden sie ein kunden unternehmen - wissensraum 20130606
Impulsseminar werden sie ein kunden unternehmen - wissensraum 20130606
 

Más de Torben Brodt

Living Labs Challenge Workshop
Living Labs Challenge WorkshopLiving Labs Challenge Workshop
Living Labs Challenge WorkshopTorben Brodt
 
Recommender Trends 2014
Recommender Trends 2014Recommender Trends 2014
Recommender Trends 2014Torben Brodt
 
Paper the plista dataset
Paper  the plista datasetPaper  the plista dataset
Paper the plista datasetTorben Brodt
 
Open recommendation platform
Open recommendation platformOpen recommendation platform
Open recommendation platformTorben Brodt
 
#TOA13 - Tech Opoen Air Recommender Hackathon
#TOA13 - Tech Opoen Air Recommender Hackathon#TOA13 - Tech Opoen Air Recommender Hackathon
#TOA13 - Tech Opoen Air Recommender HackathonTorben Brodt
 
Realtime Recommender with Redis: Hands on
Realtime Recommender with Redis: Hands onRealtime Recommender with Redis: Hands on
Realtime Recommender with Redis: Hands onTorben Brodt
 
Recommender Hackathon @plista 2013/04
Recommender Hackathon @plista 2013/04Recommender Hackathon @plista 2013/04
Recommender Hackathon @plista 2013/04Torben Brodt
 
SIGIR 2013 BARS Keynote - the search for the best live recommender system
SIGIR 2013 BARS Keynote - the search for the best live recommender systemSIGIR 2013 BARS Keynote - the search for the best live recommender system
SIGIR 2013 BARS Keynote - the search for the best live recommender systemTorben Brodt
 
Content recommendations
Content recommendationsContent recommendations
Content recommendationsTorben Brodt
 
RecSys2012 inside the plista contest
RecSys2012   inside the plista contestRecSys2012   inside the plista contest
RecSys2012 inside the plista contestTorben Brodt
 
Webhacks am Beispiel PHP + MySQL
Webhacks am Beispiel PHP + MySQLWebhacks am Beispiel PHP + MySQL
Webhacks am Beispiel PHP + MySQLTorben Brodt
 
Collaborative Filtering.. für automatische Empfehlungen
Collaborative Filtering.. für automatische EmpfehlungenCollaborative Filtering.. für automatische Empfehlungen
Collaborative Filtering.. für automatische EmpfehlungenTorben Brodt
 
Google Web Toolkit
Google Web ToolkitGoogle Web Toolkit
Google Web ToolkitTorben Brodt
 
Geld Verdienen Mit Adsense
Geld Verdienen Mit AdsenseGeld Verdienen Mit Adsense
Geld Verdienen Mit AdsenseTorben Brodt
 
Web 2.0 - "Fluch oder Segen"
Web 2.0 - "Fluch oder Segen"Web 2.0 - "Fluch oder Segen"
Web 2.0 - "Fluch oder Segen"Torben Brodt
 

Más de Torben Brodt (18)

Living Labs Challenge Workshop
Living Labs Challenge WorkshopLiving Labs Challenge Workshop
Living Labs Challenge Workshop
 
Recommender Trends 2014
Recommender Trends 2014Recommender Trends 2014
Recommender Trends 2014
 
Paper the plista dataset
Paper  the plista datasetPaper  the plista dataset
Paper the plista dataset
 
Nrs2013 recap
Nrs2013 recapNrs2013 recap
Nrs2013 recap
 
Open recommendation platform
Open recommendation platformOpen recommendation platform
Open recommendation platform
 
#TOA13 - Tech Opoen Air Recommender Hackathon
#TOA13 - Tech Opoen Air Recommender Hackathon#TOA13 - Tech Opoen Air Recommender Hackathon
#TOA13 - Tech Opoen Air Recommender Hackathon
 
Realtime Recommender with Redis: Hands on
Realtime Recommender with Redis: Hands onRealtime Recommender with Redis: Hands on
Realtime Recommender with Redis: Hands on
 
Recommender Hackathon @plista 2013/04
Recommender Hackathon @plista 2013/04Recommender Hackathon @plista 2013/04
Recommender Hackathon @plista 2013/04
 
SIGIR 2013 BARS Keynote - the search for the best live recommender system
SIGIR 2013 BARS Keynote - the search for the best live recommender systemSIGIR 2013 BARS Keynote - the search for the best live recommender system
SIGIR 2013 BARS Keynote - the search for the best live recommender system
 
Content recommendations
Content recommendationsContent recommendations
Content recommendations
 
RecSys2012 inside the plista contest
RecSys2012   inside the plista contestRecSys2012   inside the plista contest
RecSys2012 inside the plista contest
 
Webhacks am Beispiel PHP + MySQL
Webhacks am Beispiel PHP + MySQLWebhacks am Beispiel PHP + MySQL
Webhacks am Beispiel PHP + MySQL
 
GIT / SVN
GIT / SVNGIT / SVN
GIT / SVN
 
Collaborative Filtering.. für automatische Empfehlungen
Collaborative Filtering.. für automatische EmpfehlungenCollaborative Filtering.. für automatische Empfehlungen
Collaborative Filtering.. für automatische Empfehlungen
 
Google Web Toolkit
Google Web ToolkitGoogle Web Toolkit
Google Web Toolkit
 
Geld Verdienen Mit Adsense
Geld Verdienen Mit AdsenseGeld Verdienen Mit Adsense
Geld Verdienen Mit Adsense
 
AJAX
AJAXAJAX
AJAX
 
Web 2.0 - "Fluch oder Segen"
Web 2.0 - "Fluch oder Segen"Web 2.0 - "Fluch oder Segen"
Web 2.0 - "Fluch oder Segen"
 

Algorithmus, Good School, Camp Digital

  • 1. Algorithmus Torben Brodt plista GmbH 23. Januar 2013 Camp Digital, Good School
  • 2. Inhalt Algorithmus 1. Vorstellung 2. Das Spiel 3. Definition Algorithmus 4. Welche Aufgaben? 5. Welche Daten? 6. Welche Konzepte? 7. Grenzen? 8. Fragen
  • 3. Vorstellung ● plista GmbH ○ Empfehlungs- & Werbenetzwerk ○ 2008 Gründung, Sitz in Berlin ○ ~3k Recommendations/Sekunde ● Torben Brodt, Head of Data Engineering ○ 2003 Black Hat SEO ○ 2004 Programmier Forum ○ 2005 Studium Informatik ○ 2008 plista ○ 2010 Buch „Collaborative Filtering“ ○ TV + Radio „Macht der Algorithmen“
  • 4. Algorithmus das Spiel ● Es gibt 18 Streichhölzer ● Der erste Spieler nimmt 1, 2 oder 3, der auf dem Tisch liegenden Streichhölzer ● Danach nimmt der zweite Spieler entweder 1, 2 oder 3 der verbleibenden Hölzer... usw. ● Verloren hat der Spieler, der das letzte Streichholz vom Tisch nimmt ● Bitte jetzt Paare bilden für Runde 1, danach treten die Gewinner gegeneinander an
  • 5. Algorithmus das Spiel ● Wie lautet die Gewinnformel? ● Intuition?
  • 6. Algorithmus das Spiel ● Wie lautet die Gewinnformel? ● Intuition? Logik? Quelle: http://www-i1.informatik.rwth-aachen.de/~algorithmus/algo14.php Algorithmus der Woche, Jochen Könemann, University of Waterloo i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 G N J J J N J J J N J J J N J J J N J i Streichhölzer G Gewinn möglich Sequenz wiederholt sich
  • 7. Definition Algorithmus ● Wortherkunft: arabisches Lehrbuch, lateinisch übersetzt: „dixit Algorismi“ ● Schritt für Schritt Abfolge zur Lösung eines Problems ● Algorithmus = Gewinnformel ● Simples Beispiel: „Kochrezept“ ● „Big Data“: komplexe Probleme mit großen Datenmengen Algorithmus
  • 8. Big Data: Welche Aufgaben? ● Bekannte Nutzer von Big Data Algorithmen ○ Google ○ Facebook ○ Amazon ○ ... uvm ● Konfrontiert mit gigantischer Datenmenge ● Berechnung nach individuellen Bedürfnissen
  • 9. Big Data: Welche Daten? ● Was wissen "die" eigentlich über euch? ● Context der Anfrage / Parameter der Anfrage ● CRM: Demographie, Kaufkraft, uvm. ● Anonyme Daten: URL, Geolocation, Uhrzeit, Wochentag, Suchanfrage, Gerät, Betriebssystem, uvm ● Social Daten: Alter, Geschlecht, Hobbies, etc ○ z.B. „Nach Facebook Login“ ● Alle diese Daten werden gesammelt
  • 10. Big Data: Welche Konzepte? ● Modelle und Herangehensweisen um Daten nutzbar zu machen a) Logik b) Clustering c) Neighborhood d) Ausprobieren e) Mittelwerte ● Das sind Grundlagen, aber es gibt noch konkretere Algorithmen
  • 11. Konzept a) Logik & Mathematik ● Wir verlassen uns auf Zahlen, wir nutzen unser Wissen ○ Welche Relevanz hat eine Website bei Google? ○ 75% 3 von 4 Wörter Suchanfrage zu Text ○ 50% Pagerank 5 von 10
  • 12. Konzept a) Logik & Mathematik ● Wissensdatenbank ○ Matching zwischen Person und Gegenstand ○ "Frauen besuchen Brigitte.de" ● Parameter berechnen ○ Kreditvergabe: ■ Höhe des Kredits ■ Höhe des Einkommens ■ ... ○ Suchmaschinen Ergebnis ○ Herzinfarkt-Risiko ○ ...
  • 13. Konzept b) Clustering ● Alle Möglichkeiten abzuwägen wäre kompliziert ● also fassen wir "Dinge" zu "Clustern" zusammen ● Vorteil 1: Weniger Komplexität bei Entscheidungen! ● Vorteil 2: Mehr Datendichte
  • 17. Konzept c) Neighborhood ● Gemeinsamkeiten suchen (ähnlich Clustering) ● Bekanntes auf Unbekanntes übertragen ● Allgemeiner Ansatz für Finanz- Entscheidung, Werbe-Empfehlung, Herzinfarkt-Risiko ● "Kollektive Intelligenz" - Mit neuen Daten werden die Empfehlungen automatisch besser
  • 18. Konzept d) Ausprobieren ● "Trial and Error" ○ ausprobieren, scheitern, verbessern ● Man sollte fortlaufend beobachten ○ „Live Training“, denn alles ändert sich ○ Dazu technisches System um Erfolge zu kontrollieren ● A/B Testing ○ Beispiel Telefonmarketing ○ Variable: Ruft eine Frau oder ein Mann an? ● Multivariante A/B Tests ○ Mehr als eine Variable
  • 20. Konzept e) Mittelwert ● Wir haben Statistiken für alle Eingabe- Parameter ○ Wir orientieren uns am Durchschnittswert ○ Wir empfehlen das, was der Mainstream mag ● Kombination verschiedener Mittelwerte je nach Eingabeparameter ● Welcher Wert für Gender=Frau ● Welche Empfehlung für Publisher=fussball. de
  • 21. Wo sind die Grenzen? ● Es gibt keine Grenzen ● Datenmengen bis in Petabyte Dimensionen ○ Das sind viele Otto-Normal-Festplatten ;) ● Auswertungen in Echtzeit ○ Keine Lochkarten Maschinen mehr ● Integration überall dort wo man es braucht ○ Keine Blackboxen mehr, der Mensch will verstehen ● Mehr im "Data Unser"
  • 22. Fazit ● „Das Spiel“ hat gezeigt, dass Algorithmen auch mit Intuition gestützt werden können ● Es gibt verschiedene Konzepte, diese sind auch intuitiv ● Konzepte lassen sich miteinander kombinieren ● Es gibt viele Daten und alle Daten bieten Mehrwert, ● Eure Daten sind wertvoll Mehr Informationen: http://cra.org/ccc/docs/init/bigdatawhitepaper.pdf Challenges and Opportunities with Big Data, From leading researchers across the United States