SlideShare una empresa de Scribd logo
1 de 20
Descargar para leer sin conexión
Úvod do Strojového Učení

        David Filip
Obsah Přednášky

 
    • Úvod
       o Vysvětlení pojmu
       o Motivační příklad
    • Přehled typických úloh
    • Jak začít
       o Prerekvizity
       o Implementace
       o Knihy + odkazy
 
Zaměřeno na zodpovězení otázky “Proč?”, opomíjí “Jak?”
Strojové Učení

Metodologie pro získávání informací z dat.
 
Mezní obor mezi umělou inteligencí a statistikou.
 
Oblasti strojového učení:
  • Klasifikace
  • Seskupování
  • Vyhledávání
  • Doporučování
  • Hledání vzorů chování
  • a další (počítačové vidění, robotika)
 

 
Roboti (1/3)
Potřebujeme najít pravidla pro rozeznání přátelských a nepřátelských robotů.
Roboti (2/3)



Tvar Hlavy    Úsměv   Ozdoba krku   Tvar těla     Předmět v ruce   Přátelský?

   Kruh        ne       kravata      čtverec          šavle           ne

 Čtverec       ano      motýlek      čtverec           nic            ano

   Kruh        ne       motýlek        kruh           šavle           ano

Trojúhelník    ne       kravata      čtverec          balón           ne

   Kruh        ano        nic       trojúhelník      květina          ne

Trojúhelník    ne         nic       trojúhelník       balón           ano

Trojúhelník    ano      kravata        kruh            nic            ne

   Kruh        ano      kravata        kruh            nic            ano
Roboti (3/3)
Něco Reálnějšího

Máme web a chceme optimalizovat landing page pro
aktuálního uživatele.
 
1. Získáme a identifikujeme důležité (historické)
   
     Referrer, page views, přečtení stránky About
1. Vybudujeme rozhodovací strom
2. Sledujeme chování návštšníka a nabízíme promotion

 
Promotion:
   
     Zvýraznění nejpravděpodobnějšího plánu
   
     Nabídka slevy
   
     ...
 
Typické Úlohy
Typické Využití Strojového Učení

    •   Cílený marketing
    •   Cross selling
    •   Predikce odchodu zákazníků
    •   Fraud detection
    •   Credit risk
    •   Spam filtering
    •   Recommendation engines
    •   Farmacie
 
Klasifikace


Určení třídy objektu:
• Příklad s roboty (rozhodovací stromy)
• Spam filter (naive Bayes)
• Inteligentní výběr zajímavých článků
Clustering

 
Hledání skupin objektů v datech:
  • Google News
  • Výsledky průzkumů a anket
  • Informace o chování zákazníků
  • Seznam kupovaných výrobků 
 
 
V omezeném rozsahu možno využít SQL, pro lepší výsledky
   existují specializované algoritmy.
Filtering


Výběr potencionálně zajímavých objektů:
  • na základě shody obsahu
  • na základě podobnosti uživatelů
 
  • Doporučování na Amazonu
  • Last.fm doporučení hudebních skupin
  • Netflix
  • News feed na Facebooku
Jak začít
Proč se věnovat strojovému učení

 
    • Součastná řešení jsou tak naivní, že nedá práci vytvořit
      lepší
    • I ve velmi malém týmu je možno vytvořit velké věci
    • Vysoká bariéra pro vstup nových hráčů
    • Nenasycenost trhu
Prerekvizity

• Znalost formálního zápisu a důkazů (!)
• Matematika:
   o Lineární algebra
   o Pravděpodobnost
   o Statistika
• Informatika:
   o Logika (stačí výroková a predikátová)
   o Analýza algoritmů, datové struktury, ...
   o Teorie grafů
Implementace

    • Nutná znalost algoritmů
    • Většina práce je předzpracování dat a ladění parametrů
 
 
    • Knihovny pro většinu jazyků:
      o Ruby: ai4r
      o Python: PyML, SciPy
      o Java: Weka, Java-ML
 
    • Nástroje:
      o Free: Weka, R, Orange, ...
      o Placené: Matlab, SAS, SPSS, Mathematica, ...
Typické Problémy

Velké nebezpečí u lidí, kteří tomu rozumí "tak trochem".
 
  • Validita Modelu:
    o jsou výsledky správné?
    o black-box metody
 
  • Neintuitivnost většiny problémů
 
Knihy




Česky: Dobývání znalostí z databází
Odkazy

Anglicky:
  http://www.autonlab.org/tutorials/index.html
  http://www.cs.utexas.edu/~mooney/cs391L/
  http://www.stanford.edu/class/cs229/materials.html

Česky:
  http://sorry.vse.cz/~berka/4IZ450/
Otázky?



  davidfilip@gmail.com
     twitter.com/dejv
          dejv.eu
Slidy: slideshare.net/dejv

Más contenido relacionado

Similar a Uvod Do Strojoveho Uceni

ANAsurvey at Barcamp Brno, Czech rep.
ANAsurvey at Barcamp Brno, Czech rep.ANAsurvey at Barcamp Brno, Czech rep.
ANAsurvey at Barcamp Brno, Czech rep.
ANAsurvey project!
 
SEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávačeSEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávače
seznamVyvojari
 
Interaktivní mapy
Interaktivní mapyInteraktivní mapy
Interaktivní mapy
korel_cz
 

Similar a Uvod Do Strojoveho Uceni (20)

Vodafone Nápad roku, 21. 4. 2016: Jak na obsah, který prodává
Vodafone Nápad roku, 21. 4. 2016: Jak na obsah, který prodáváVodafone Nápad roku, 21. 4. 2016: Jak na obsah, který prodává
Vodafone Nápad roku, 21. 4. 2016: Jak na obsah, který prodává
 
ANAsurvey at Barcamp Brno, Czech rep.
ANAsurvey at Barcamp Brno, Czech rep.ANAsurvey at Barcamp Brno, Czech rep.
ANAsurvey at Barcamp Brno, Czech rep.
 
Platforma Yeseter / Memepower 2013
Platforma Yeseter / Memepower 2013Platforma Yeseter / Memepower 2013
Platforma Yeseter / Memepower 2013
 
Prototypování webových aplikací
Prototypování webových aplikacíPrototypování webových aplikací
Prototypování webových aplikací
 
Jiří Komár, AdVisio, Redesignujete e-shop? Nedělejte zbytečné chyby.
Jiří Komár, AdVisio, Redesignujete e-shop? Nedělejte zbytečné chyby.Jiří Komár, AdVisio, Redesignujete e-shop? Nedělejte zbytečné chyby.
Jiří Komár, AdVisio, Redesignujete e-shop? Nedělejte zbytečné chyby.
 
Analýza kvalitativních dat
Analýza kvalitativních datAnalýza kvalitativních dat
Analýza kvalitativních dat
 
Souhrnný workshop MVSS
Souhrnný workshop MVSSSouhrnný workshop MVSS
Souhrnný workshop MVSS
 
SEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávačeSEO - optimalizace pro vyhledávače
SEO - optimalizace pro vyhledávače
 
Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...
Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...
Životopis budoucnosti – jak si získat každého šéfa přes sociální síť? | LIDÉ ...
 
Interaktivní mapy
Interaktivní mapyInteraktivní mapy
Interaktivní mapy
 
LinkedIn na steroidech: Jak vymáčknout maximum z LinkedIn People Search [BizF...
LinkedIn na steroidech: Jak vymáčknout maximum z LinkedIn People Search [BizF...LinkedIn na steroidech: Jak vymáčknout maximum z LinkedIn People Search [BizF...
LinkedIn na steroidech: Jak vymáčknout maximum z LinkedIn People Search [BizF...
 
Zapojte uživatele do návrhu webu
Zapojte uživatele do návrhu webuZapojte uživatele do návrhu webu
Zapojte uživatele do návrhu webu
 
Průvodce databází EMERALD a publikováním ve světových odborných časopisech
Průvodce databází EMERALD a publikováním ve světových odborných časopisechPrůvodce databází EMERALD a publikováním ve světových odborných časopisech
Průvodce databází EMERALD a publikováním ve světových odborných časopisech
 
UX monday - uživatelské testování
UX monday - uživatelské testováníUX monday - uživatelské testování
UX monday - uživatelské testování
 
Základy strojového učení
Základy strojového učeníZáklady strojového učení
Základy strojového učení
 
Rozumí zákazníci vašemu webu
Rozumí zákazníci vašemu webuRozumí zákazníci vašemu webu
Rozumí zákazníci vašemu webu
 
Matěj Novák - pro neziskovky
Matěj Novák - pro neziskovkyMatěj Novák - pro neziskovky
Matěj Novák - pro neziskovky
 
Analýza klíčových slov - Plzeňský Barcamp 2015
Analýza klíčových slov - Plzeňský Barcamp 2015Analýza klíčových slov - Plzeňský Barcamp 2015
Analýza klíčových slov - Plzeňský Barcamp 2015
 
Skoleni b3 socialni_media
Skoleni b3 socialni_mediaSkoleni b3 socialni_media
Skoleni b3 socialni_media
 
Coe2019 | Jak poznat svého zákazníka
Coe2019 |  Jak poznat svého zákazníkaCoe2019 |  Jak poznat svého zákazníka
Coe2019 | Jak poznat svého zákazníka
 

Uvod Do Strojoveho Uceni

  • 1. Úvod do Strojového Učení David Filip
  • 2. Obsah Přednášky   • Úvod o Vysvětlení pojmu o Motivační příklad • Přehled typických úloh • Jak začít o Prerekvizity o Implementace o Knihy + odkazy   Zaměřeno na zodpovězení otázky “Proč?”, opomíjí “Jak?”
  • 3. Strojové Učení Metodologie pro získávání informací z dat.   Mezní obor mezi umělou inteligencí a statistikou.   Oblasti strojového učení: • Klasifikace • Seskupování • Vyhledávání • Doporučování • Hledání vzorů chování • a další (počítačové vidění, robotika)    
  • 4. Roboti (1/3) Potřebujeme najít pravidla pro rozeznání přátelských a nepřátelských robotů.
  • 5. Roboti (2/3) Tvar Hlavy Úsměv Ozdoba krku Tvar těla Předmět v ruce Přátelský? Kruh ne kravata čtverec šavle ne Čtverec ano motýlek čtverec nic ano Kruh ne motýlek kruh šavle ano Trojúhelník ne kravata čtverec balón ne Kruh ano nic trojúhelník květina ne Trojúhelník ne nic trojúhelník balón ano Trojúhelník ano kravata kruh nic ne Kruh ano kravata kruh nic ano
  • 7. Něco Reálnějšího Máme web a chceme optimalizovat landing page pro aktuálního uživatele.   1. Získáme a identifikujeme důležité (historické)  Referrer, page views, přečtení stránky About 1. Vybudujeme rozhodovací strom 2. Sledujeme chování návštšníka a nabízíme promotion   Promotion:  Zvýraznění nejpravděpodobnějšího plánu  Nabídka slevy  ...  
  • 9. Typické Využití Strojového Učení • Cílený marketing • Cross selling • Predikce odchodu zákazníků • Fraud detection • Credit risk • Spam filtering • Recommendation engines • Farmacie  
  • 10. Klasifikace Určení třídy objektu: • Příklad s roboty (rozhodovací stromy) • Spam filter (naive Bayes) • Inteligentní výběr zajímavých článků
  • 11. Clustering   Hledání skupin objektů v datech: • Google News • Výsledky průzkumů a anket • Informace o chování zákazníků • Seznam kupovaných výrobků      V omezeném rozsahu možno využít SQL, pro lepší výsledky existují specializované algoritmy.
  • 12. Filtering Výběr potencionálně zajímavých objektů: • na základě shody obsahu • na základě podobnosti uživatelů   • Doporučování na Amazonu • Last.fm doporučení hudebních skupin • Netflix • News feed na Facebooku
  • 14. Proč se věnovat strojovému učení   • Součastná řešení jsou tak naivní, že nedá práci vytvořit lepší • I ve velmi malém týmu je možno vytvořit velké věci • Vysoká bariéra pro vstup nových hráčů • Nenasycenost trhu
  • 15. Prerekvizity • Znalost formálního zápisu a důkazů (!) • Matematika: o Lineární algebra o Pravděpodobnost o Statistika • Informatika: o Logika (stačí výroková a predikátová) o Analýza algoritmů, datové struktury, ... o Teorie grafů
  • 16. Implementace • Nutná znalost algoritmů • Většina práce je předzpracování dat a ladění parametrů     • Knihovny pro většinu jazyků: o Ruby: ai4r o Python: PyML, SciPy o Java: Weka, Java-ML   • Nástroje: o Free: Weka, R, Orange, ... o Placené: Matlab, SAS, SPSS, Mathematica, ...
  • 17. Typické Problémy Velké nebezpečí u lidí, kteří tomu rozumí "tak trochem".   • Validita Modelu: o jsou výsledky správné? o black-box metody   • Neintuitivnost většiny problémů  
  • 19. Odkazy Anglicky: http://www.autonlab.org/tutorials/index.html http://www.cs.utexas.edu/~mooney/cs391L/ http://www.stanford.edu/class/cs229/materials.html Česky: http://sorry.vse.cz/~berka/4IZ450/
  • 20. Otázky? davidfilip@gmail.com twitter.com/dejv dejv.eu Slidy: slideshare.net/dejv