Vojtěch Matoušek na konferenci Data Restart 2019.
Jak se chovají uživatelé Seznam.cz? Jaký obsah je zajímá? Ukážeme vám, jak v Seznamu segmentujeme obsah i publikum pomocí klastrové analýzy. Zaměříme se na kategorizaci obsahu na základě zjištěných segmentů a charakteristik uživatelů a využití této segmentace pro doporučení rozšíření nabízeného obsahu.
4. Segmentace na základě předdefinovaných kategorií
• Segmentace obsahu
Jaký počet dimenzí je dost?
Jak detailní by měly segmenty být?
• Segmentace uživatelů
Demografické údaje (neměnné)
Zájmy (měnné)
Segmentace na základě vztahů
• Segmentace obsahu na základě uživatelů
Clustrová analýza
Segmentace
5. Explorace (nalézání) zcela nových témat
Expanze (rozšiřování) současných témat
Konexe (propojování) současných témat ?
Možné cesty při rozšiřování obsahu
?
?
6. Clusterová analýza
Vícedimenzionální analýza, která se používá ke klasifikaci objektů.
Segmentujeme obsah na základě chování uživatelů.
Získané klastry mají určitou specifickou charakteristiku jak v dimenzi
obsahu tak uživatelů.
Na co si dát pozor!
• Clusterová analýza může propojovat i tam, kde propojení není!
• Získané klastry může spojovat na základě jiné dimenze než
předpokládáme.
18. Konfrontace statistiky s ostatními informacemi
Je publikum, které přitahujeme, relevantní pro danou službu?
Je takto vybrané téma vhodné pro publikaci obecně?
Je pro nás možné vybrané téma realizovat na dostatečné
úrovni kvality?
19. Návrhy možných nových témat
Na základě témat:
• Moderní historické bitvy
• Současná vojenská technika
Na základě znalosti publika
• Survival
• Extrémní sporty