SlideShare una empresa de Scribd logo
1 de 20
Real-time prediktivní
analytika na webu
Jiří Brázda
13. 6. 2012
Data mining
Logistická regrese
Principal component analysis
# PREDICTION
d.te$predProb <- predict(cs.m3bf, newdata=d.te, type="response"); #predict on testing set
tapply(d.te$predProb, d.te$yPurchase, mean, na.rm=T); #probability mean by response group

# CROSSVALIDATION
d.te$predYPurchase <- ifelse(
           d.te$predProb < val.prob(d.te$predProb, as.numeric(d.te$yPurchase),cex=.5)[2], #ROC
           0,1);
Případová studie
 4. největší pojišťovna dle předepsaného pojistného v
    neživotním pojištění v ČR



   Naše case study [PDF]
    2011: http://j.mp/csobpoj-redesign
    2010: http://j.mp/csobpoj-omniture

Real-time prediktivní analytika na webu | Optimics         4
Real-time prediktivní analytika na webu | Optimics   5
1 2 3 4 5 6




Real-time prediktivní analytika na webu | Optimics   6
V momentě výpočtu ceny se pokoušíme o predikci, zda
                                   tato návštěva skončí sjednáním pojistky či nikoliv




Real-time prediktivní analytika na webu | Optimics                                       7
Postup vytvoření prediktivního modelu
   Definice zadání a výběr proměnných
   Příprava dat z Adobe SiteCatalyst
   Rozdělení dat na training / test
   Vytvoření modelu na training datech (logistická
    regrese)
   Ověření modelu na test datech
   Návrh aplikace modelu do praxe na webu
        – zvýšení konverzního poměru
        – zvýšení průměrného pojistného

Real-time prediktivní analytika na webu | Optimics    8
Predikce x skutečnost




Real-time prediktivní analytika na webu | Optimics   9
Prediktivní analytika je jako popelka…
  … snaží se oddělit hrách a čočku do dvou ošatek
                                                             hrách




                                                     čočka

Real-time prediktivní analytika na webu | Optimics                   10
Jaký faktor zdaleka nejvíce
zvyšuje pravděpodobnost
sjednání pojistky?

 A. Cena (čím nižší cena, tím větší
    pravděpodobnost)
 B. Předchozí nákup (tj. zákazník v minulosti již
    sjednal cestovní pojištění)
 C. Počet dětí na pojistce (čím více dětí, tím
    větší pravděpodobnost)
Sjednání pojistky v minulosti




Real-time prediktivní analytika na webu | Optimics   12
Hodnocení modelu
ROC




Real-time prediktivní analytika na webu | Optimics         14
Konzervativní model




Real-time prediktivní analytika na webu | Optimics          15
Liberální model




Real-time prediktivní analytika na webu | Optimics         16
Volba modelu závisí na aplikaci!!!
   Volba modelu závisí na jeho aplikaci v reálném
    světě (a typicky nákladech spojených s false
    positives):
        – Ve zdravotnictví mohou mít false positives vážné
          následky
        – Na webu lze (relativně) beztrestně A/B testovat
   Kritériem úspěšnosti modelu může být accuracy
   Kritériem úspěšnosti prediktivní analytiky by měly
    být metriky související s prodeji / náklady /
    spokojeností zákazníků

Real-time prediktivní analytika na webu | Optimics           17
Co bude teď dalším krokem pro
ČSOB Pojišťovnu?

 A. Ladit model k dokonalosti. Zvyšovat
    kvalitativní parametry a přesnost modelu.
 B. Aplikovat model do praxe v rámci svého
    programu A/B testování na webu.
Na dlouhé večery…
   R                              http://www.r-project.org/

   RapidMiner                     http://rapid-i.com/

   Intro to ROC                   http://j.mp/introROC

   Intro to DM                    http://j.mp/introDM

   Data Mining                    http://j.mp/DMtechniques
    Techniques

Real-time prediktivní analytika na webu | Optimics             19
Děkuji za pozornost!

          +420 602345620
        jiri.brazda@optimics.cz

Más contenido relacionado

Similar a Real-time prediktivni analytika na webu

Prípadová štúdia implementácie Omniture v ČSOB Pojišťovně
Prípadová štúdia implementácie Omniture v ČSOB PojišťovněPrípadová štúdia implementácie Omniture v ČSOB Pojišťovně
Prípadová štúdia implementácie Omniture v ČSOB PojišťovněWeb Analytics Wednesday Bratislava
 
Pripadova studie implementace Omniture v CSOB Pojistovne
Pripadova studie implementace Omniture v CSOB PojistovnePripadova studie implementace Omniture v CSOB Pojistovne
Pripadova studie implementace Omniture v CSOB PojistovneOptimics s.r.o.
 
Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)Sherpas
 
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016Profinit
 
I internet uz je Direct Marketing (SAS Forum 2010)
I internet uz je Direct Marketing (SAS Forum 2010)I internet uz je Direct Marketing (SAS Forum 2010)
I internet uz je Direct Marketing (SAS Forum 2010)Optimics s.r.o.
 
Jak testovat weby a reklamní kampaně, máte-li málo peněz, času, případně obojího
Jak testovat weby a reklamní kampaně, máte-li málo peněz, času, případně obojíhoJak testovat weby a reklamní kampaně, máte-li málo peněz, času, případně obojího
Jak testovat weby a reklamní kampaně, máte-li málo peněz, času, případně obojíhoRobertNemec.com
 
Pokročilá segementace webových návštěvníků (Jan Matoušek)
Pokročilá segementace webových návštěvníků (Jan Matoušek)Pokročilá segementace webových návštěvníků (Jan Matoušek)
Pokročilá segementace webových návštěvníků (Jan Matoušek)Taste Medio
 
Pevný termín, pevná cena
Pevný termín, pevná cenaPevný termín, pevná cena
Pevný termín, pevná cenaOndrej Kucera
 
Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020Taste Medio
 
Efektivní vývoj produktů a prioritizace backlogu
Efektivní vývoj produktů a prioritizace backloguEfektivní vývoj produktů a prioritizace backlogu
Efektivní vývoj produktů a prioritizace backloguDesingdev
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyneProfinit
 
Whitepaper MoniMark s.r.o._CZ
Whitepaper MoniMark s.r.o._CZWhitepaper MoniMark s.r.o._CZ
Whitepaper MoniMark s.r.o._CZJiKovrnk
 
Cloud talks vol. 4 - Jak vyhodnocovat změnu / kampaně
Cloud talks vol. 4 -  Jak vyhodnocovat změnu / kampaněCloud talks vol. 4 -  Jak vyhodnocovat změnu / kampaně
Cloud talks vol. 4 - Jak vyhodnocovat změnu / kampaněigloonet
 
Jak vyhodnocovat SEO v rámci atribucí
Jak vyhodnocovat SEO v rámci atribucíJak vyhodnocovat SEO v rámci atribucí
Jak vyhodnocovat SEO v rámci atribucíSEO jako Brno
 
Rychlá analýza zahraničních trhů (Martin Šimko)
Rychlá analýza zahraničních trhů (Martin Šimko)Rychlá analýza zahraničních trhů (Martin Šimko)
Rychlá analýza zahraničních trhů (Martin Šimko)Taste Medio
 
Jak nevyhodit čas a peníze při redesignu webu
Jak nevyhodit čas a peníze při redesignu webuJak nevyhodit čas a peníze při redesignu webu
Jak nevyhodit čas a peníze při redesignu webuAITOM Digital s.r.o.
 
Jak nastavit procesy v digitální analytice tak, aby vám generovala výnosy
Jak nastavit procesy v digitální analytice tak, aby vám generovala výnosyJak nastavit procesy v digitální analytice tak, aby vám generovala výnosy
Jak nastavit procesy v digitální analytice tak, aby vám generovala výnosyRobertNemec.com
 
Webová analytika: 15 chyb, které děláte při práci s Google Analytics
Webová analytika: 15 chyb, které děláte při práci s Google AnalyticsWebová analytika: 15 chyb, které děláte při práci s Google Analytics
Webová analytika: 15 chyb, které děláte při práci s Google AnalyticsRobertNemec.com
 
Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?Taste Medio
 

Similar a Real-time prediktivni analytika na webu (20)

Prípadová štúdia implementácie Omniture v ČSOB Pojišťovně
Prípadová štúdia implementácie Omniture v ČSOB PojišťovněPrípadová štúdia implementácie Omniture v ČSOB Pojišťovně
Prípadová štúdia implementácie Omniture v ČSOB Pojišťovně
 
Pripadova studie implementace Omniture v CSOB Pojistovne
Pripadova studie implementace Omniture v CSOB PojistovnePripadova studie implementace Omniture v CSOB Pojistovne
Pripadova studie implementace Omniture v CSOB Pojistovne
 
Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)Webová analytika (ČZU - Webdesign, 11. 12. 2013)
Webová analytika (ČZU - Webdesign, 11. 12. 2013)
 
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
 
I internet uz je Direct Marketing (SAS Forum 2010)
I internet uz je Direct Marketing (SAS Forum 2010)I internet uz je Direct Marketing (SAS Forum 2010)
I internet uz je Direct Marketing (SAS Forum 2010)
 
Jak testovat weby a reklamní kampaně, máte-li málo peněz, času, případně obojího
Jak testovat weby a reklamní kampaně, máte-li málo peněz, času, případně obojíhoJak testovat weby a reklamní kampaně, máte-li málo peněz, času, případně obojího
Jak testovat weby a reklamní kampaně, máte-li málo peněz, času, případně obojího
 
Pokročilá segementace webových návštěvníků (Jan Matoušek)
Pokročilá segementace webových návštěvníků (Jan Matoušek)Pokročilá segementace webových návštěvníků (Jan Matoušek)
Pokročilá segementace webových návštěvníků (Jan Matoušek)
 
Pevný termín, pevná cena
Pevný termín, pevná cenaPevný termín, pevná cena
Pevný termín, pevná cena
 
Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020Prediktivní analytika pro rok 2020
Prediktivní analytika pro rok 2020
 
Efektivní vývoj produktů a prioritizace backlogu
Efektivní vývoj produktů a prioritizace backloguEfektivní vývoj produktů a prioritizace backlogu
Efektivní vývoj produktů a prioritizace backlogu
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne
 
Whitepaper MoniMark s.r.o._CZ
Whitepaper MoniMark s.r.o._CZWhitepaper MoniMark s.r.o._CZ
Whitepaper MoniMark s.r.o._CZ
 
Cloud talks vol. 4 - Jak vyhodnocovat změnu / kampaně
Cloud talks vol. 4 -  Jak vyhodnocovat změnu / kampaněCloud talks vol. 4 -  Jak vyhodnocovat změnu / kampaně
Cloud talks vol. 4 - Jak vyhodnocovat změnu / kampaně
 
Jak vyhodnocovat SEO v rámci atribucí
Jak vyhodnocovat SEO v rámci atribucíJak vyhodnocovat SEO v rámci atribucí
Jak vyhodnocovat SEO v rámci atribucí
 
Rychlá analýza zahraničních trhů (Martin Šimko)
Rychlá analýza zahraničních trhů (Martin Šimko)Rychlá analýza zahraničních trhů (Martin Šimko)
Rychlá analýza zahraničních trhů (Martin Šimko)
 
Jak nevyhodit čas a peníze při redesignu webu
Jak nevyhodit čas a peníze při redesignu webuJak nevyhodit čas a peníze při redesignu webu
Jak nevyhodit čas a peníze při redesignu webu
 
Advertures Maly
Advertures MalyAdvertures Maly
Advertures Maly
 
Jak nastavit procesy v digitální analytice tak, aby vám generovala výnosy
Jak nastavit procesy v digitální analytice tak, aby vám generovala výnosyJak nastavit procesy v digitální analytice tak, aby vám generovala výnosy
Jak nastavit procesy v digitální analytice tak, aby vám generovala výnosy
 
Webová analytika: 15 chyb, které děláte při práci s Google Analytics
Webová analytika: 15 chyb, které děláte při práci s Google AnalyticsWebová analytika: 15 chyb, které děláte při práci s Google Analytics
Webová analytika: 15 chyb, které děláte při práci s Google Analytics
 
Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?Marketing a data. Umíme v nich najít hodnotu?
Marketing a data. Umíme v nich najít hodnotu?
 

Más de Optimics s.r.o.

Let’s make web analytics more customer centric!
Let’s make web analytics more customer centric!Let’s make web analytics more customer centric!
Let’s make web analytics more customer centric!Optimics s.r.o.
 
Email ve sluzbach retence
Email ve sluzbach retenceEmail ve sluzbach retence
Email ve sluzbach retenceOptimics s.r.o.
 
Fakta a mýty o vyhodnocování online kampaní
Fakta a mýty o vyhodnocování  online kampaníFakta a mýty o vyhodnocování  online kampaní
Fakta a mýty o vyhodnocování online kampaníOptimics s.r.o.
 
Nejdůlezitejsi metrika v zivote startupu
Nejdůlezitejsi metrika v zivote startupuNejdůlezitejsi metrika v zivote startupu
Nejdůlezitejsi metrika v zivote startupuOptimics s.r.o.
 
Pragmatický návrh webu aneb co dělá UX špatně
Pragmatický návrh webu aneb co dělá UX špatněPragmatický návrh webu aneb co dělá UX špatně
Pragmatický návrh webu aneb co dělá UX špatněOptimics s.r.o.
 
Kam driv skocit: konverze nebo retence?
Kam driv skocit: konverze nebo retence?Kam driv skocit: konverze nebo retence?
Kam driv skocit: konverze nebo retence?Optimics s.r.o.
 
Jak nastartovat program optimalizace webu
Jak nastartovat program optimalizace webuJak nastartovat program optimalizace webu
Jak nastartovat program optimalizace webuOptimics s.r.o.
 
Analytics + optimization = data driven website
Analytics + optimization = data driven websiteAnalytics + optimization = data driven website
Analytics + optimization = data driven websiteOptimics s.r.o.
 
Education, training and career development in online analytics
Education, training and career development in online analyticsEducation, training and career development in online analytics
Education, training and career development in online analyticsOptimics s.r.o.
 
Jak na optimalizaci webu
Jak na optimalizaci webuJak na optimalizaci webu
Jak na optimalizaci webuOptimics s.r.o.
 
Vyhody pokrocilych nastroju webove analytiky
Vyhody pokrocilych nastroju webove analytikyVyhody pokrocilych nastroju webove analytiky
Vyhody pokrocilych nastroju webove analytikyOptimics s.r.o.
 
Testing & Targeting Tools
Testing & Targeting ToolsTesting & Targeting Tools
Testing & Targeting ToolsOptimics s.r.o.
 
Optimalizace webu www.kentico.com
Optimalizace webu www.kentico.comOptimalizace webu www.kentico.com
Optimalizace webu www.kentico.comOptimics s.r.o.
 

Más de Optimics s.r.o. (14)

Let’s make web analytics more customer centric!
Let’s make web analytics more customer centric!Let’s make web analytics more customer centric!
Let’s make web analytics more customer centric!
 
Email ve sluzbach retence
Email ve sluzbach retenceEmail ve sluzbach retence
Email ve sluzbach retence
 
Fakta a mýty o vyhodnocování online kampaní
Fakta a mýty o vyhodnocování  online kampaníFakta a mýty o vyhodnocování  online kampaní
Fakta a mýty o vyhodnocování online kampaní
 
Nejdůlezitejsi metrika v zivote startupu
Nejdůlezitejsi metrika v zivote startupuNejdůlezitejsi metrika v zivote startupu
Nejdůlezitejsi metrika v zivote startupu
 
Pragmatický návrh webu aneb co dělá UX špatně
Pragmatický návrh webu aneb co dělá UX špatněPragmatický návrh webu aneb co dělá UX špatně
Pragmatický návrh webu aneb co dělá UX špatně
 
Kam driv skocit: konverze nebo retence?
Kam driv skocit: konverze nebo retence?Kam driv skocit: konverze nebo retence?
Kam driv skocit: konverze nebo retence?
 
Jak nastartovat program optimalizace webu
Jak nastartovat program optimalizace webuJak nastartovat program optimalizace webu
Jak nastartovat program optimalizace webu
 
Analytics + optimization = data driven website
Analytics + optimization = data driven websiteAnalytics + optimization = data driven website
Analytics + optimization = data driven website
 
Education, training and career development in online analytics
Education, training and career development in online analyticsEducation, training and career development in online analytics
Education, training and career development in online analytics
 
Jak na optimalizaci webu
Jak na optimalizaci webuJak na optimalizaci webu
Jak na optimalizaci webu
 
Mereni socialnich medii
Mereni socialnich mediiMereni socialnich medii
Mereni socialnich medii
 
Vyhody pokrocilych nastroju webove analytiky
Vyhody pokrocilych nastroju webove analytikyVyhody pokrocilych nastroju webove analytiky
Vyhody pokrocilych nastroju webove analytiky
 
Testing & Targeting Tools
Testing & Targeting ToolsTesting & Targeting Tools
Testing & Targeting Tools
 
Optimalizace webu www.kentico.com
Optimalizace webu www.kentico.comOptimalizace webu www.kentico.com
Optimalizace webu www.kentico.com
 

Real-time prediktivni analytika na webu

  • 1. Real-time prediktivní analytika na webu Jiří Brázda 13. 6. 2012
  • 2. Data mining Logistická regrese Principal component analysis # PREDICTION d.te$predProb <- predict(cs.m3bf, newdata=d.te, type="response"); #predict on testing set tapply(d.te$predProb, d.te$yPurchase, mean, na.rm=T); #probability mean by response group # CROSSVALIDATION d.te$predYPurchase <- ifelse( d.te$predProb < val.prob(d.te$predProb, as.numeric(d.te$yPurchase),cex=.5)[2], #ROC 0,1);
  • 4.  4. největší pojišťovna dle předepsaného pojistného v neživotním pojištění v ČR  Naše case study [PDF] 2011: http://j.mp/csobpoj-redesign 2010: http://j.mp/csobpoj-omniture Real-time prediktivní analytika na webu | Optimics 4
  • 5. Real-time prediktivní analytika na webu | Optimics 5
  • 6. 1 2 3 4 5 6 Real-time prediktivní analytika na webu | Optimics 6
  • 7. V momentě výpočtu ceny se pokoušíme o predikci, zda tato návštěva skončí sjednáním pojistky či nikoliv Real-time prediktivní analytika na webu | Optimics 7
  • 8. Postup vytvoření prediktivního modelu  Definice zadání a výběr proměnných  Příprava dat z Adobe SiteCatalyst  Rozdělení dat na training / test  Vytvoření modelu na training datech (logistická regrese)  Ověření modelu na test datech  Návrh aplikace modelu do praxe na webu – zvýšení konverzního poměru – zvýšení průměrného pojistného Real-time prediktivní analytika na webu | Optimics 8
  • 9. Predikce x skutečnost Real-time prediktivní analytika na webu | Optimics 9
  • 10. Prediktivní analytika je jako popelka… … snaží se oddělit hrách a čočku do dvou ošatek hrách čočka Real-time prediktivní analytika na webu | Optimics 10
  • 11. Jaký faktor zdaleka nejvíce zvyšuje pravděpodobnost sjednání pojistky? A. Cena (čím nižší cena, tím větší pravděpodobnost) B. Předchozí nákup (tj. zákazník v minulosti již sjednal cestovní pojištění) C. Počet dětí na pojistce (čím více dětí, tím větší pravděpodobnost)
  • 12. Sjednání pojistky v minulosti Real-time prediktivní analytika na webu | Optimics 12
  • 14. ROC Real-time prediktivní analytika na webu | Optimics 14
  • 15. Konzervativní model Real-time prediktivní analytika na webu | Optimics 15
  • 16. Liberální model Real-time prediktivní analytika na webu | Optimics 16
  • 17. Volba modelu závisí na aplikaci!!!  Volba modelu závisí na jeho aplikaci v reálném světě (a typicky nákladech spojených s false positives): – Ve zdravotnictví mohou mít false positives vážné následky – Na webu lze (relativně) beztrestně A/B testovat  Kritériem úspěšnosti modelu může být accuracy  Kritériem úspěšnosti prediktivní analytiky by měly být metriky související s prodeji / náklady / spokojeností zákazníků Real-time prediktivní analytika na webu | Optimics 17
  • 18. Co bude teď dalším krokem pro ČSOB Pojišťovnu? A. Ladit model k dokonalosti. Zvyšovat kvalitativní parametry a přesnost modelu. B. Aplikovat model do praxe v rámci svého programu A/B testování na webu.
  • 19. Na dlouhé večery…  R http://www.r-project.org/  RapidMiner http://rapid-i.com/  Intro to ROC http://j.mp/introROC  Intro to DM http://j.mp/introDM  Data Mining http://j.mp/DMtechniques Techniques Real-time prediktivní analytika na webu | Optimics 19
  • 20. Děkuji za pozornost! +420 602345620 jiri.brazda@optimics.cz