Conférence du 21/01/11
Véronique Mesguich & Armelle Thomas ont reçu le prix "Intelligence économique et compétitivité" 2010 pour leur ouvrage "Net Recherche: le guide pour rechercher l\'information utile et surveiller le web", paru aux éditions ADBS.
La veille financière et stratégique est devenue une arme de compétitivité incontournable pour les entreprises, grands comptes ou PME, mais aussi pour les professionnels de la finance et du marketing. De nouvelles méthodes se sont développées, de nouvelles sources sont apparues, les logiciels de veille se sont démocratisés. Des enjeux importants se dessinent autour de la veille temps réel et de l\'exploitation des réseaux sociaux. La conférence permettra de faire le point sur des sources à valeur ajoutée en matière d\'information économique et financière, de dresser un panorama des moteurs de recherche les plus performants dans ce domaine, ainsi que des logiciels de surveillance automatisée du web.
Competitic - Surveillez votre marché et vos concurrents avec internet - numer...
Recherche avancée et veille en finance par Véronique Mesguich
1. AFI CNAM
Recherche avancée et veille en finance
Véronique MESGUICH
WWW.DEVINCI.FR
veronique.mesguich@devinci.fr
21 janvier 2011
1
Mastère Spécialisé Intelligence des Risques & Innovations / IE www.FormationContinue-ISEP.fr
2. La société de l information
Surabondance de l information,
« infobésité »
Hyperspécialisation qui
empêche une vision d ensemble
et a tendance à cloisonner
Montée de l incertitude,
difficulté à prévoir
Influence et désinformation
Ubiquité, immédiateté
Mondialisation de l information
et de la communication
2
4. Du web de documents au
web de conversations
« Web de données »
Web « de conversations »
Web sémantique Web
« de documents » Web multimédia
1994-
2004-
Web mobile temps réel
2008-
5. Ne pas confondre le web et
Internet
Selon le magazine
américain Wired, les
applications de type
smartphone
pourraient remplacer
à terme les sites web
Le web n est qu un
élément parmi
d autres d Internet
7. Les 3 niveaux d information
Information blanche:
Facile et accessible à tous (pas toujours
gratuite!)
Nécessite sélection et traitement manuel ou
automatisée
ex : le web, les ouvrages, les médias
Information grise : a l origine, ce qui échappe
aux circuits classiques de l édition. Par
extension, les sources informelles
Information noire : confidentielle, obtenue via
moyens illégaux
7
8. L évolution des usages de la
veille, des supports et des outils
Années 70
Veille technologique Bases de données Paramétrage d alertes sur
scientifiques, bases de données
Années 80 brevets
Veille concurrentielle et
stratégique - business Bases de données Systèmes d aide à la
intelligence info électronique décision
professionnelle
Années 90
Intelligence économique Agents intelligents
Développement du
web Logiciels de surveillance
automatisée
Années 2000 :
Veille collaborative Plates forme de veille
Veille d opinion -Veille Web 2.0
intégrée
personnelle Intelligence
d entreprise Outils de text mining
Web 3.0 Flux RSS Monitoring mots
Années 2010: clés réseaux sociaux
Veille temps réel -
multimédia Addons navigateurs Firefox
Outils d analyse opinion
9. Veille : Différencier les
besoins d information
Type de Besoin Besoin Besoin
besoin d information d information d information
instrumental conceptuelle décisionnelle
Objectif Rôle Enrichissement Rôle d influence
opérationnel de la dans le
dans un connaissance et processus de
processus de la réflexion décision
d action
Mise en Recherche Recherche ou Veille
oeuvre d informations: veille stratégique :
recherche documentaire:
Recherche de
factuelle, Recherche de documents,
recherche de documents, recherche de
documents collecte sources, collecte
régulière régulière
d information d information,
analyse
stratégique
10. Collecte : Les principes de base
Rechercher l information à la source
Les notions de serendipité : art de trouver des
informations pertinentes sans les chercher
Utiliser différentes sources et différents supports
(on ne trouve pas tout sur Internet !)
Recouper les sources d information
Respecter les règles de la déontologie (SCIP,
Fepie www.fepie.org)
11. Recherche web :
deux approches
méthodologiques
L approche « mots clés » : recherche par mots
clés sur texte intégral des pages web. La qualité de
la recherche dépendra du choix des mots clés :
nombre de mots clés, degré de précision, langue,
combinaison avec opérateurs booléens...
Inconvénient : le manque d exhaustivité des
moteurs et méta-moteurs (« web invisible »)
L approche « exploration des sources » :
identifier les sources d information les plus
pertinentes par rapport à la requête, utiliser ensuite
les outils de recherche intégrés à ces sources,
l exploration de liens...
Inconvénient : suppose une bonne connaissance
des sources 11
12. Recherche d information sur
Internet : se méfier des idées
reçues
Les moteurs de recherche, même les plus
puissants, n indexent qu une partie du web
(notion de pages dynamiques, « web invisible »)
Les moteurs de recherche n indexent pas le
web en temps réel et ne sont pas à jour
L outil n est pas tout : rechercher l information
« à la source » : portails spécialisés, portails
géographiques...
13. Les différentes générations
1ère génération Altavista
de moteurs
Vieillissement de l index.
(apparus en 95-96) Hotbot Voilà Algorithmes de pertinence pas
Lycos toujours efficaces.
2ème génération Google Bonne pertinence, index important.
(apparus en 98- Yahoo
99 ou plus) MSN Bing
Ask
3ème génération Wisenut Fonctionnalités de visualisation souvent
(apparus à partir de Exalead originales Kartoo, Cuil et Wisenut ont
2001) Kartoo désormais disparu
Cuil
4ème génération GG Custom Les moteurs personnalisables, créés par
Search l utilisateur
Powerset Les moteurs sémantiques
Wolfram
Alpha
Les moteurs multimédias
Truveo
123people La recherche de personnes
Social Les moteurs temps réel 13
Mention
14. Tendances
Représentation cartographique
des résultats (Touchgraph, Social
Computing, Kartoo, Exalead
Constellations,Pikko )
Développement des moteurs
verticaux ou spécialisés (Scirus,
Google Scholar, Medworm )
Interrogation en langage naturel
(True Knowledge, Powerset)
Recherche multilingue
(Google Translated search)
Recherche « mobile »
et « temps réel » (Twitter,
Friendfeed)
Recherche de données
factuelles
(Wolfram Alpha, Google Squared)
Moteurs spécialisés par pays
(Yandex pour la Russie, Baidu pour
la Chine..) 14
www.searchenginecolossus.com
15. Tendances
Regroupement des acteurs.
Simplification de la syntaxe
Personnalisation (Google Custom
Search, Yahoo BOSS, Swicki,
Mozbot, )
Développement des outils de
partage (web social ou « 2.0 » :
bookmarking social, wikis, réseaux
sociaux, moteurs collaboratifs )
Clustering et catégorisation
automatique (Exalead, Vivisimo )
Diffusion de l information via des
flux (formats RSS ou Atom)
Moteurs multimédias (Truveo,
Blinkx, Voxalead )
15
16. Recherche multimédia
Nombreux moteurs audio
et video : Blinkx, Truveo
Technologies
« Speech to text » Exalead
: lancement de Voxalead
Google Audio Indexing
Options de recherche
avancée d images
(Google, Bing, Exalead ).
Reconnaissance des
couleurs
Recherche par similarité
d image : Like.com, Cydral,
Google Similar Images,
Tineye 16
17. La prédominance de Google
Près de 90 % de part de marché en France
début 2011 (source : ATMonitor)
Les raisons du décollage : rapidité, pertinence
(algorithme du page rank), simplicité (opérateur
ET par défaut), orientation « pur moteur »,
marketing viral
Les raisons du maintien à la première place :
diversification, liens sponsorisés (Adwords),
bons investissements, culture d entreprise
originale
17
18. Les principaux critères de
pertinence des moteurs
- Occurrence et densité des mots-clés
- Présence dans l URL, dans le titre ou
positionnement dans la page
- Proximité et ordre des mots-clés
- Taille et styles de polices
- Présence dans les méta-données
(meta-keywords, meta-description)
balise metakeyword désormais obsolète
sur Google, Yahoo et Bing
Critères « off the page » :
- Indice de popularité (page 18
rank jusqu à quand?)
19. Moteurs de recherche :
la syntaxe
OR : permet de chercher des synonymes
ou termes proches
Guillemets : pour rechercher une
expression exacte
+ : imposer l orthographe d un mot
- : pour exclure un mot
Limitations de recherche sur Google et
Yahoo : type de doc, date (attention,
date de dernière maj) 19
20. Méta-moteurs :quand les utiliser
Les méta-moteurs « on-line » sont parfois trop aléatoires. De
nombreux méta-moteurs en ligne ont disparu ou ont évolué
vers d autres fonctions
A utiliser pour des termes « rares » ou au contraire, pour
avoir un premier aperçu des résultats pour des termes plus
généraux
Les méta-moteurs comparateurs de résultats (Allplus, Jux2,
Releton )
L avenir des méta-moteurs clients (Copernic )
20
21. Internet versus bases de
données
Intérêt d Internet : Intérêt des bases de
. Multiplicité des sources données :
d information . Fiabilité de l information
. Interactivité . Données à valeur ajoutée
. Couverture internationale . Forme structurée
A utiliser pour : A utiliser pour :
. Actualité immédiate . Archives de presse
. Analyse sites des . Bilans entreprises
entreprises . Etudes de marché
. Infos sur pays
. Fédérations
professionnelles - portails
spécialisés
22. Principales bases de données
utiles pour la veille
concurrentielle/marketing
Agrégateurs presse : Lexis, Factiva,
Business Source Premier (Monde), Pressed
(France), Europresse, Pikanews (Europe)
Etudes de marché : Xerfi
(France/Europe/Monde), Eurostaf-Les Echos;
Marketline Datamonitor, Reuter Business
Insight, Thomson Business Intelligence
(Monde)
Info financière : Diane (France), Amadeus
(Europe), Osiris, Infinantials, Altares,
Dun&Bradstreet (Monde)
23. Agrégateurs de presse et
newsletters
Google actualités 40
éditions mondiales
Des agrégateurs « 2.0 »
: Wikio, Synthesio,
Pikanews
Les newsletters : peu à
peu supplantées par les
flux mais toujours utiles
24. Astuces !
Remonter dans le temps
(retrouver des pages
disparues) : Wayback
machine www.archive.org
Identifier un nom de domaine
(www.indom.com)
25. Activer la sérendipité
Trouver des sites portails
ou fédérateurs Trouver des sites pointant
vers une source connue
Trouver des sites « similaires »
à une source connue
Trouver des listes de liens
déjà constituées
26. Trouver des sites « pointant »
vers une source déjà connue
Ex : la fonction link dans Google à partir d une URL
connue
Sur Yahoo, utiliser Linkdomain
Ex : "journée
nationale des études"
linkdomain:www.adetem.org
.
27. Trouver des sites
« similaires » à une source
connue
Cartographie
des liens
avec Touchgraph
(ou Kartoo,
Exalead Constellations )
28. Trouver des sites
« similaires » à une source
connue
Fonction « related » chez Google
29. Recherche d experts
Recherche sur les sites
universitaires (Google Recherche de thèses :
Scholar, extraction de Dissertation abstracts
noms) (monde) ou Sudoc
(France)
Recherche sur les blogs Limitation aux
documents PPT dans la
Recherche dans les recherche avancée de
réseaux sociaux via Google ou recherche de
Google documents Powerpoint via
Ex : geosciences www.slideshare.net
site:www.linkedin.com OR Moteurs de recherches
site:www.viadeo.com de personnes
www.123people.com
www.zoominfo.com
www.pipl.com
30. Personnaliser les flux RSS
avec Yahoo Pipes
Yahoo Pipes permet
de filtrer les flux
RSS à partir d un
mot clé, de les
fusionner, de les
trier
31. Les nouveaux médias
sociaux
Nouveaux médias sociaux : le
phénomène Twitter
Une « caisse de résonance » mondiale
pour suivre les tendances
Près de 20 % des messages sur Twitter
mentionnent le nom d une marque
(source : Penn State University)
Vers une veille
« temps réel » ? Développement des
« livestreams » permettant de mixer des
données issues de plusieurs réservoirs
32. L homme est un document
comme les autres
La redocumentarisation du
monde
« Les réseaux sociaux
posent aujourd'hui, au
sens propre, la question
documentaire appliquée
au facteur humain »
(Olivier Ertzscheid)
33. Professionnel
Réseaux sociaux professionnels Mashup de flux
Viadeo, Linkedin Yahoo Pipes
Moteurs personnalisables
Google Custom Search
Bookmarking social
Delicious, Diigo
Flux RSS et Atom Blogs d experts
Wikis Mashups
Wikipedia
Mutualisation Réseaux sociaux amicaux Personnalisation
Facebook, Myspace
Microblogging
Twitter
Partage photos, vidéos
Flickr, Youtube Agrégateurs d actualité
Wikio, Digg
Blogs
Grand public
34. Syndication de contenu : les
fils RSS
Un fil RSS (Really simple syndication
ou Rich Site Summary) est un fichier
XML qui permet de publier des titres de
nouvelles ou d'articles, exploitables
dynamiquement.
Ils permettent d être alerté en
permanence sur un domaine
d actualité ou sur les nouveautés
apparaissant sur un site précis.
Format RSS ou ATOM
35. Accéder aux fils RSS :pas
d outil miracle
Intégration aux navigateurs Firefox, IE, (versions
récentes), Safari, Chrome Clic sur l icone RSS
Utilisation d un agrégateur en ligne (ex : Netvibes,
Google Reader, RSS Bandit, Bloglines, Newsgator,
Feedreader ) www.bloglines.com
www.netvibes.com
Agrégateur des flux de médias francophones :
Alertinfo www.geste.fr
Options personnalisées de Google ou Yahoo (mon
Yahoo)
Logiciels de messagerie (Thunderbird, Outlook )
36. Monitoring mots clés :
Google actualités
http://news.google.fr/
Recherche mots clés
Alerte par mail ou flux (clic sur RSS)
36
37. Monitoring mots clés :
Google Alerts
www.google.fr/alerts
Choix des mots clés
Actualité, pages web, forums
Envoi par mail ou sous forme de flux
37
39. Google Reader
www.google.fr/reader
Pour ajouter un flux
Flux classés par thèmes
39
Mastère Spécialisé Intelligence des Risques & Innovations / IE www.FormationContinue-ISEP.fr
40. Twitter pour la veille?
Diffusion d informations
depuis des sites de
média,
blogs, réseaux
sociaux
Recherche et veille
(alertes)
e-reputation, suivi
d une personne
physique ou morale,
d un sujet, veille
marketing
40
41. La recherche « temps réel »
Social Mention :
recherche sur blogs, Analyse automatique du
microblogging, « sentiment » positif,
bookmarking social, neutre ou négatif
vidéos
41
www.FormationContinue-ISEP.fr
42. Recherche simultanée sur
plusieurs réseaux sociaux
Recherche par nom de personne ou
d entreprise
Moteurs de recherche de personnes:
123people, Zoominfo, Wink, Yoname,
Pipl
Recherche temps réel : Social Mention
Yoono : extension Firefox pour faciliter
l accès à des réseaux sociaux
42
43. Exemple : veille d opinion
Surveiller l image de la société
Carrefour dans les médias chinois
Comment dit on « Carrefour » en
chinois ?
43
www.FormationContinue-ISEP.fr