Recommendations bilden im E-Commerce bereits seit geraumer Zeit eine wichtige und zentrale Rolle. Die Gründe dafür sind vielfältig: Bessere Kundenbindung, höhere Conversion Rates, optimiertes Up- und Cross-Selling Potenzial usw. Doch wie können diese Anreize erreicht werden? Wir zeigen Ihnen, welche Herausforderungen Ihnen begegnen, und wie Sie diese meistern können. Open Source hilft Ihnen dabei.
Jax 2012 - Apache Solr as Enterprise Search Platform
Neue Potentiale durch Recommendations erschliessen und Conversions steigern (Webinar)
1. Technology
Drives
Business
NEUE POTENTIALE DURCH RECOMMENDATIONS
ERSCHLIEßEN / CONVERSIONS STEIGERN
Daniel Wrigley
Apache Solr, Solr, Apache Lucene, Lucene and their logos are trademarks of the Apache Software Foundation.
Elasticsearch, Kibana, Marvel, Logstash are trademarks of Elasticsearch BV, registered in the U.S. and in other countries.
2. DANIEL WRIGLEY
Consultant für Search & Big Data Technologies
Computerlinguist
Durch LucidWorks zertifizierter Apache Solr Trainer
Autor zahlreicher Blogs und
Coautor des Buchs „Einführung in Apache Solr“
@wrigley_dan
3. UNSERE MISSION
Seit 1994 hersteller-unabhängiges Unternehmen für IT Consulting und Software
Engineering.
Wir bieten Lösungen rund um Semantic Search, Big Data und Explorative
Datenanalyse auf der Basis etablierter Open-Source Software.
Wir stellen Werkzeuge bereit, die durch optimale Nutzung der Technologie und Daten
unsere Kunden beim Erreichen Ihrer Geschäftsziele unterstützen.
4. Heute
2013
2011
SEIT 1994
Hersteller-unabhängiges Unternehmen. Lösungen rund um
Suche, Navigation und Datenanalyse mit Fokus auf Open Source.
Partnerschaft mit Smartlogic
Partnerschaft mit LucidWorks
2000 Erste Projekte mit Open Source
1994 Unternehmensgründung und Entwicklung eines Produkts
6. WAS WIR TUN
MIT SERVICES
DURCH
ANWENDUNG
DES KNOW-HOWS
REALISIEREN
LÖSUNGEN
ZUR
OPTIMALEN
NUTZUNG
VON DATEN
• Strategy Consulting
• Technical Consulting
• Architecture Review
• Development Support
• Team Enablement
Through Workshops and
Trainings
• Technology Comparison
• Tuning & Troubleshooting
• Migration Services
• Experts to Hire
• Service Level Agreements
• Software Architecture
• Coding Services for Java,
C++/C, .NET, PHP for
multiple OSs.
• Continuous Integration
and Test Driven
Development
• Managing Software
Project Lifecycle
• Commerce Search
• Intranet Portal Search
• Website Search
• Search Knowledge
Management
• Explorative Datenanalyse
• Social Media Monitoring
Tools
UND
ETABLIERTEN
PRODUKTEN
UND
PARTNERN
• Apache Solr/Lucene
• Apache Mahout
• Apache Hadoop, Pig, Hive
• LucidWorks Search
• LucidWorks Search Big Data
7. KONTAKT
SHI GmbH & Co. KG
Curt-Frenzel-Str. 12
D - 86167 Augsburg
info@shi-gmbh.com
+49.821.74 82 633 - 0
@SHIEngineers
Michael Marheineke Markus Klose Daniel Wrigley
10. WARUM BEGEGNEN WIR
RECOMMENDATIONS?
Auffindbarkeit von Produkten
Usability
Inspiration
Erhöhter Komfort
Zufriedenheit &
Begeisterung
Kundensicht
11. HERAUSFORDERUNGEN
Auswahl der Daten
(Vor)Verarbeitung der Daten
Transport der Daten
Anbieten der Recommendations
Auslösen der Recommendations
Unterschiedliche Arten Recommendations
Komplexität
Mathematik & Algorithmen
15. WELCHE DATEN EIGNEN SICH
FÜR RECOMMENDATIONS?
Kaufverhalten?
gekauft:
dazu passend:
16. WELCHE DATEN EIGNEN SICH
FÜR RECOMMENDATIONS?
Suchverhalten?
Häufig geklickte Filter:
> Elektronik
> 250-300€
> Kamera
Berücksichtigung für zukünftige Suchen
17. WELCHE DATEN EIGNEN SICH
FÜR RECOMMENDATIONS?
Weg zum Produkt?
Woher kam der Kunde?
Was hat er gesucht?
Welche Filter hat er benutzt?
An welcher Stelle der Trefferliste stand das
Produkt?
18. WELCHE DATEN EIGNEN SICH
FÜR RECOMMENDATIONS?
Praktische Produktverknüpfungen?
19. WELCHE DATEN EIGNEN SICH
FÜR RECOMMENDATIONS?
Faktische Produktverknüpfungen?
+ Handyvertrag
Versicherung
21. WIE WERDEN DATEN ZU
RECOMMENDATIONS?
Rohe Daten Artikel, User generiert,…
Pre-Processing Datenformat
History Matrix Was hat wer gekauft?
Co-Occurrence Matrix Was wurde
zusammen gekauft?
Indicator Matrix Interessante Werte?
Gewichtung der Werte Optimierung
Speichern der gewichteten Werte
Recommendations Search Index
22. WIE WERDEN DATEN ZU
RECOMMENDATIONS?
Nutzerverhalten (Suche, Produktauswahl, …)
Triggering der Recommendations
"Holen" der Recommendations
Anzeigen der Recommendations
Nutzung der Recommendations aufzeichnen
Auswertung der Nutzungsdaten
Verbesserung der Recommendations
23. MEHR ALS EIN GUTER
RICHTWERT…
Was Kunden tun zählt, nicht was sie sagen
Indikator: Gemeinsames Auftreten von
Verhalten
Text-Retrieval-Methoden
Komplexität beachten!
Offline: Berechnungen, ETL
Online: Auslösen der Recommendations
27. FAZIT
Innovativ ≠ Neu
Meinungen und Rezensionen
Gewichtung der Daten
Auslösen der Recommendations
Geschwindigkeit (Offline-Berechnung)
"Plan B" für Produkte ohne
Recommendations
Monitoring der Benutzung der
Recommendations
28. WAS SHI IHNEN BIETET
1. Wissen: E-Commerce Leitfaden,
LucidWorks, Elasticsearch, Smartlogic
2. Technik: Langjährige Open Source
Erfahrung
3. Beratung: Herstellerunabhängigkeit
4. Basisprodukt: einfache Integration
5. Projektierung: Zertifiziertes Personal
30. KONTAKT
SHI GmbH & Co. KG
Curt-Frenzel-Str. 12
D - 86167 Augsburg
info@shi-gmbh.com
+49.821.74 82 633 - 0
@SHIEngineers
Michael Marheineke Markus Klose Daniel Wrigley
Notas del editor
Dieses Webinar wird aufgezeichnet und auf unseren Youtube-Channel gestellt
Die Folien über unseren Slideshare-Account veröffentlicht
Deutsche Folien?
Conversion Rates steigern sich, wenn den Kunden das vorgeschlagen wird, was sie kaufen wollen.
Gute Vorschläge veranlassen Kunden dazu, wieder zu kommen. Denn was einmal gut funktioniert, funktioniert auch zweimal gut
Produktvorschläge erhöhen einfach dadurch die Verweildauer der Kunden, weil ihnen dadurch eine bequeme Möglichkeit geliefert wird, ohne neu suchen zu müssen im Shop zu browsen.
Passendes Zubehör vorschlagen, höherwertige Produkte vorschlagen, unter Umständen sogar Produkte, von denen die Kunden vorher noch nichts wussten steigern das Potenzial mehr zu verkaufen
Auffindbarkeit von Produkten dadurch erhöhen, dass sie vorgeschlagen werden.
Es ist durch vorhandene Techniken und Technologien, die sich im Bereich Data Mining, Machine Learning gebildet haben, kein Hexenwerk mehr, Recommendations umzusetzen. Dazu zählen bestimmte Ansätze wie Collaborative Filtering oder auch Open Soure Projekte wie Apache Mahout, die solche Ansätze versuchen umzusetzen, um Anwendern algorithmisches Handwerkszeug zu geben.
Auffindbarkeit von Produkten wird durch gezieltes Vorschlagen von Produkten erhöht, besonders, wenn Kunden nicht genau wissen, was sie suchen. Dieses "nicht wissen" kann natürlich auch neue Trends und Produkte beinhalten.
Wenn ich weniger suchen muss, finde ich schneller zum gewünschten Produkt.
Inspiration: Geschenkbeispiel; unkonkret –> konkret
Erhöhung des Benutzerkomforts. Vorschläge können Suchen ersetzen bzw. zumindest ergänzen.
Kundenzufriedenheit dadurch erhöhen, dass sie die richtigen Produkte vorgeschlagen werden.
Welche Daten eignen sich für Recommendations
Wie müssen diese Daten verarbeitet werden
Diese Daten müssen transportiert werden.
Recommendations sind vorhanden, wie biete ich diese an?
Aktionen müssen durchgeführt werden, damit Recommendations ausgelöst werden können
Recommendations gibt es in unterschiedlichen Variationen, nicht alle Variationen passen zu mir und meinem Online-Shop. Hier müssen Entscheidungen getroffen werden.
Folgende Frage müssen Sie beantworten können: Wann ist Komplexität eine Verbesserung, die sich für die entstehenden Kosten lohnt?
Komplexität kann hilfreich sein. Die Herausforderung besteht darin, zu erkennen, wann sich Komplexität auszahlt und wann eher weniger.
Mathematik & Algorithmen sind nur ein kleiner Teil dieser Herausforderungen
Ziel: Das Finden der einfachsten Lösung, die gut genug für das Erreichen der eigenen Ziele ist.
Nur ein Bruchteil der Kunden teilt seine Meinung über ein Produkt/eine Leistung mit
Hier zu sehen: Eine wenig objektive, sondern stark subjektive Meinung eines Kunden über ein Produkt. Hier ist es schwierig, diese Meinung in Recommendations einfließen zu lassen
Ratings/Rezensionen sind tendenziell entweder stark negativ oder stark positiv; Kunden, die etwas neutral gegenüber stehen, geben weniger oft eine Meinung ab
Hier zu sehen: Eine Klage gegen einen Kunden, der eine schlechte Rezension abgegeben hat. Sowas kann zukünftig natürlich auch abschreckend sein, wenn bekannt ist, dass eine schlechte Rezension im Nachhinein bestraft werden kann.
Hier zu sehen: Bewertungen für zwei unterschiedliche Produkte. Im Durchschnitt haben beide einen nahezu identischen Wert. Das eine Produkt ist jedoch nur einmal bewertet worden, das andere knapp 1000 mal. Eine offensichtliche Schlussfolgerung ist auch hier schwer zu treffen. Vielleicht handelt es sich auf der linken Seite um ein sehr neues Produkt, daher so wenig Bewertungen. Vielleich aber auch nur um ein Nischenprodukt.
Nicht das, was der Kunde sagt, ist interessant. Das, was er tut, ist interessant
Basierend auf einer Handlung (dem Kauf eines Produkts) können gezielt passende Vorschläge gemacht werden.
Auch hier lassen sich gute Rückschlüsse ziehen. Ein Kunde, der viel in Elektronik stöbert, ist vielleicht weniger im Bekleidungssortiment unterwegs. Und daher eignen sich solche Produkte unter Umständen weniger für Recommendations. Eine Kamera für 250-300€ lässt ebenso darauf schließen, dass sich der Kunde nicht unbedingt im High-End Segment bewegt, sondern eher im Mittelfeld.
Man weiß, dass eine Tasche und eine Speicherkarte gute Ergänzungen für eine Kamera sind. Das kann aber mit manuellem Pflegeaufwand verbunden sein. Außerdem gibt es typischerweise auch mehrere Produkte, die diese Kriterien erfüllen. Welches soll dann angeboten werden? Daher eignen sich solche praktischen Verknüpfungen nicht bedingungslos für Recommendations
Hier geht es ebenfalls um domänenspezifisches Wissen, das erforderlich ist. Einen Handyvertrag kann ich nur in Zusammenhang mit Handys anbieten.
Manueller Aufwand
Manueller Aufwand
Nicht immer gleich gut aus Daten ersichtlich
Rohe Daten können bereits vorhanden sein z.B. Abgeschlossene Warenkörbe.
Diese Daten liegen aber wahrscheinlich bzw. nicht notwendigerweise im richtigen Format vor, müssen also vorverarbeitet werden, damit sie dem Mechanismus zur Berechnung der Recommendations übergeben werden können.
Das Ergebnis eines ersten Schrittes ist die History-Matrix, die darstellt, welche Produkte gekauft wurden.
Aus dieser Matrix kann berechnet werden, welche Artikel zusammen bzw. vom gleichen Kunden gekauft wurden.
Indicator Matrix: Hier müssen diejenigen Werte ausgeschlossen werden, die nicht interessant oder relevant sind. Beispiel Supermarkt: Jeder, der in einem Supermarkt einkaufen geht, kauft Alltagsgegenstände ein, z.B. Hygieneartikel. Produkte, die jeder einkauft, sind Produkte, die sich eher weniger für Recommendations eignen.
Unter den Werten, die als interessant gelten, gibt es auch mehr oder weniger interessante. Um dieses "mehr oder weniger" interessant darzustellen, müssen die übrig gebliebenen Werte gewichtet werden. Das spielt auch bei neuen Produkten eine Rolle, denn diese können noch nicht allzu oft mit anderen Artikeln gekauft worden sein.
Warum in einem Suchindex speichern? Geschwindigkeit, Berechnung und Suche unabhängig voneinander.
Verhalten des Nutzers muss die Recommendations irgendwie auslösen. Wenn ein Nutzer mehr als einmal pro Woche nach Blu-Ray-Playern im Preissegment zwischen 250-300 € sucht, kann es sinnvoll sein, ihm einen spezifischen Blu-Ray-Player-Newsletter zukommen zu lassen, der eben solche Geräte beinhaltet. Legt ein Nutzer etwas in seinem Warenkorb ab, müssen ihm dazu spezifische Vorschläge gemacht werden usw.
Holen bzw. Anzeige der Recommendations muss auch noch eine Einschränkung haben: Sinnvollerweise werden keine Produkte vorgeschlagen, von denen Sie wissen, dass sie der Kunde bereits gekauft hat bzw. besitzt. Schlagen Sie dem Kunden ein paar Mal etwas vor, das er schon über Ihren Shop bezogen hat und alle zukünftigen Recommendations sind praktisch wertlos, denn das Vertrauen in Funktionalitäten geht schnell verloren, wenn das Resultat nicht dem gewünschten entspricht.
Wenn ich nicht beobachte, was die Nutzer meiner Applikation mit Recommendations machen, werde ich sie nie verbessern können. Aus Betreibersicht können meine Recommendations die besten der Welt sein, weil die Produkte vorgeschlagen werden, die sich am besten verkaufen, am besten bewertet sind, am wenigsten zurückgeschickt werden etc. Wenn das aber nicht von den Nutzern angenommen bzw. anders gesehen wird, helfen mir auch die aus meiner Sicht "besten" Recommendations nichts.
Kundendaten (Alter, Ort, Geschlecht) einbeziehen. Bessere Vorschläge ohne eingeloggt zu sein. Bisherigen Weg einfließen lassen. Clusteringprozess
Meinungen und Ratings können helfen, indem sie beispielsweise für die Gewichtung von Recommendations verwendet werden. Sie sind aber in der Regel kein so guter Indikator wie das Verhalten der Nutzer. Es zählt also was Kunden im Warenkorb ablegen, im Shop ansehen, in der Trefferliste auswählen etc.
Top-Level-Projekt der Apache Software Foundation
In Java geschrieben
Was für uns bzw. für dieses Webinar interessant ist: Recommender Systeme
Hohe Skalierbarkeit: Wer sich in der Big Data Welt ein bisschen auskennt, kennt den Elefanten, der das Logo von Hadoop ist. Der Reiter, der hier auf dem Elefanten zu sehen ist, ist der Namensgeber für dieses Projekt, denn übersetzt bedeutet Mahout Elefantenreiter. Mahout kann aktuell als Aufsatz von Hadoop gesehen werden, d.h. die Verarbeitung großer Datenmenge stellt für Mahout eine lösbare Herausforderung dar.
Item-based collaborative filtering wurde entwickelt von Amazon
User-based collaborative filtering
Kunde-Produkt-Matrix: Welcher Kunde hat was (zusammen) gekauft?
Kunde X nehmen und prüfen, welcher Kunde diesem am ähnlichsten ist. Basierend auf dem ähnlichsten Kunden können dann Vorschläge gemacht werden.
Domänenunabhängig, eignet sich daher gut als Ansatz zum Cross-Selling
Keine Kenntnisse über Produkte und deren Attribute notwendig
Benutzer werden miteinander "verbunden", wenn sie ähnliches Verhalten zeigen
Item-based collaborative filtering
Produkt-Produkt-Matrix: Welche Produkte wurden zusammen (von einem Kunden) gekauft?
Ähnlichkeit von Produkten untereinander wird ermittelt. Anhand welcher Attribute diese Ähnlichkeit ermittelt wird, ist nicht festgelegt. Bei der Berechnung der Ähnlichkeit zwischen zwei Produkten aus unterschiedlichen Domänen wird man aber keine guten Resultate erzielen können, wenn man die Eigenschaften für diese Berechnung verwenden möchte. Daher kann es sich auch hier anbieten, zu ermitteln, welche Produkte zusammen gekauft wurden. Nur ist hier das Ergebnis nicht, welcher Kunde einem anderen am ähnlichsten ist, sondern welches Produkt einem anderen am ähnlichsten ist.
Innovativ heißt nicht unbedingt neu, innovativ kann genauso einfach heißen.
Meinungen und Rezensionen sind weniger wert als Nutzerverhalten, Bewertungen, Meinungen und Rezensionen können jedoch für die Gewichtung verwendet werden.
Aktionen müssen Recommendations auslösen
Geschwindigkeit ist wichtig, Offline Berechnungen notwendig.
Neue Produkte haben unter Umständen keine Recommendations, hier ist ein Plan B notwendig
Die Verwendung meiner Recs sollte ich im Auge behalten, damit ich diese im Laufe der Zeit verbessern kann.
Wir haben das Wissen. Branchenspezifisch, dadurch, dass wir Partner des E-Commerce Leitfadens sind. Technologisch, dadurch, dass wir in der Vergangenheit Partnerschaften geschlossen haben.
Technisch wissen wir auch, was wir tun, nachdem wir bereits zahlreiche Projekte im Open Source Bereich durchgeführt haben.