Slides de ma présentation sur le thème du Machine Learning lors du SEO Camp'US Paris 2016, le 8 avril dernier.
Au programme : quelques explications sur le Machine Learning et ses principes, des exemples concrets d'utilisation, et quelques pistes pour aller plus loin.
Plus d'infos : http://blog.1-clic.info/referencement/machine-learning-seocampus-paris-2016/
2. Julien Deneuville
• 27 ans
• Monte des sites depuis 2004
• SEO pro depuis 2011
• Twitter : @diije
• Blog : http://blog.1-clic.info/
• Musique
• Vélo
Qui suis-je ?
Hello, World!
3. De quoi parle-t-on ?
Exemple 1 : analyse sémantique
Exemple 2 : segmentation d’utilisateurs
Exemple 3 : catégorisation d’URLs
Aller plus loin
3
Machine Learning
Sommaire
6. Machine Learning
Machine Learning : Field of study that gives computers the
ability to learn without being explicitly programmed.
Arthur Samuel, pionnier de l’intelligence artificielle
6
Dessine-moi un mouton
7. Machine Learning
Mettre au point des algorithmes permettant de déterminer
des caractéristiques pour de nouvelles données en se basant
sur la connaissance de données d’apprentissage.
7
Pour de vrai
9. Les régressions
• Prédire une valeur « continue »
• Exemple type : calculer le prix de vente
d’une maison
Les classifications
• Déterminer une valeur « discrète »
• Exemple type : catégoriser des données
9
Deux grands types de méthodes
Machine Learning 101
10. Découper de manière algorithmique
un ensemble de données en classes ou
clusters :
• Classes : connues à l’avance
• Clusters : déterminés par la machine
En théorie :
• Des objets d’un même ensemble sont
similaires
• Des objets d’ensembles différents sont
dissimilaires
10
Classification
Kézako ?
13. Regrouper des mots clés
Objectif : regrouper des mots clés par proximité sémantique
Sur quels critères ?
• Analyse syntaxique
• Cooccurrence
• TF*IDF
• …
Avec quelle méthode ?
• K-means : le classique
Clustering
15. Les avantages
• Un classique du clustering
• Simple à implémenter
• Résultats rapides
Les inconvénients
• Résultats aléatoires
• Nécessite d’indiquer à l’avance le nombre
de classes
15
http://Scikit-Learn.org/
K-means
Quelques explications
17. Quelles applications ?
Explorer un univers sémantique
Analyser la visibilité de votre site sur cet univers
Détecter des opportunités
Identifier les mots clés à utiliser
…
17
Idées d’utilisation
19. Segmenter une base d’utilisateurs
Mise en situation : vous éditez un site qui propose des contenus sur différentes
thématiques (sport, jeux vidéos, cinéma …).
Vos données :
• Une liste d’utilisateurs
• Leurs affinités avec vos thématiques
Votre objectif :
• Regrouper vos utilisateurs par affinités
19
Trouver mes influenceurs
21. Réutiliser ces données
Objectif : mettre en place un système de recommandation
1. Identifier les « influenceurs » : les utilisateurs typiques d’une affinité
2. Identifier les « suiveurs » : les utilisateurs proches de ces influenceurs
3. Si un contenu plaît aux influenceurs, il plaira probablement aux suiveurs
21
Think different
24. Catégoriser des URLs
Objectif : catégoriser les pages d’un site, sans se baser sur les URLs
Schema classique :
• http://www.example.com/category/page.htm
• Catégorie : /category/
Données d’entrée :
• Liste des pages
• Liens entre ces pages
24
Brasse coulée
25. Logiciel open source, gratuit, français.
Visualisation de graphes
Algorithmes intégrés
Documentation
25
https://gephi.org/
Gephi
Couteau Suisse
26. Step 1 : intégrer les données dans Gephi
26
Nœuds et liens
27. Step 2 : catégorisation instantanée
27
Modularity Class
29. Les Frères Peyronnet
• https://freres.peyronnet.eu/
• @speyronnet et @gpeyronnet
Aurélien Berrut
• http://www.htitipi.com/blog/
• @htitipidotcom
Vincent Terrasi
• http://data-seo.com/
• @vincentterrasi
29
De bonnes infos
Blogs et personnes à suivre
30. www.1-clic.info
Merci de votre attention !
Bon appétit J
Mail
julien@1-clic.info
Blog
http://blog.1-clic.info/
Twitter
@diije