3. Obsah
1. Kdo používá strojové učení?
2. Kde ho můžete použít vy
3a. Jaké modely používat?
3b. Dva jednoduché příklady
4. Co s tím děláme my
5. Shrnutí
11. Skladovost
● Které zboží mám nakoupit na sklad?
● Cíl:
– Minimalizace ceny skladovaného zboží
– Při maximalizace prodejů
12. Cenotvorba
● Jakou mám nastavit marži?
(u konkrétního výrobku)
● Cíl:
– Maximální celkový zisk
(přičemž nižší cena znamená více prodejů, ale s nižší marží...)
13. Parametry zboží
● Mám desítky tisíc produktů v e-shopu, jak k nim
doplnit informace (technické specifikace)?
● Cíl:
– Informovat zákazníka a umožnit vyhledávání
– Ale minimalizovat náklady na získání informací
16. Co je to vlastně model?
Krabička
● Má vstupy
● Má výstup(y)
● a „uvnitř je chytrá“
17. Jak model vznikne?
Učením!
1. Vyberete algoritmus (a jeho parametry)
2. Natrénujete model (na minulých datech)
3. Pak jej používáte (na nových datech)
18. Lineární regrese
1. Každý vstup má přiřazenou váhu
2. Vstupy prostě vynásobím váhou.
A všechno to sečtu.
3. A mám výsledek.
20. Lineární regrese - pokračování
Co udělá strojové učení lépe než člověk?
● zanalyzuje obrovská data
● určí koeficienty „matematicky optimálně“
● vybere ty správné vstupy
● může to vše dělat každou noc automaticky
23. Neuronová síť
Velmi obecná
- využitelná pro mnoho různých problémů
- špičkové výsledky zejména pro obraz a zvuk
Nelineární
Deep learning
- obrovský trend
- viz mj. i moje přednáška
Hodně „magie“
- těžká na interpretaci
- vyžaduje zkušenosti s nastavením
24. Kde si s ním hrajeme my
Magictable
Brandiozo
Golem
a jeden neveřejný projekt
26. Případně data rovnou dodáme
Robot to udělá
- levněji než lidé
- rychleji a na větších datech
- stejně přesně nebo lépe
Člověk zůstane v roli dohledu/učitele,
nedělá už rutinní práci.
28. Jak jej používáme – vysvětlení
1. Ručně navržené algoritmy spárují zdroje
Konkrétně parametry z různých zdrojů (e-shopů, webů)
2. Strojové učení umí předpovědět
které spárování je správně a které nejspíš chybně.
S přesností 97 %
3. Chybná/podezřelá spárování potlačíme
Dáme jim nižší váhu v souhrnném reportu
29. Open source nástroje
Neuronové sítě:
theano, keras, tensorflow, cuda-convnet
Další algoritmy:
gbm, libsvm, vowpal wabbit, sofia-kmeans, gensim
Nástroje s GUI:
weka, orange, rapid miner
Cloudové služby (proprietární):
Amazon, Azure, Google, BigML