SlideShare una empresa de Scribd logo
1 de 46
AFI CNAM

      Recherche avancée et veille en finance

                                       Véronique MESGUICH

                                  WWW.DEVINCI.FR
                            veronique.mesguich@devinci.fr

                                                     21 janvier 2011
                                                                                                  1
Mastère Spécialisé Intelligence des Risques & Innovations / IE    www.FormationContinue-ISEP.fr
La société de l information
Surabondance de l information,
 « infobésité »
Hyperspécialisation qui
empêche une vision d ensemble
et a tendance à cloisonner
Montée de l incertitude,
difficulté à prévoir
Influence et désinformation
Ubiquité, immédiateté
Mondialisation de l information
et de la communication
                                  2
Surabondance d outils
Surabondance
d outils aux
fonctionnalités
souvent redondantes
Quelle pérennité ?
Comment effectuer
les bons choix ?
Du web de documents au
             web de conversations
                    « Web de données »



                 Web « de conversations »


Web sémantique              Web
                     « de documents »       Web multimédia
                           1994-

                           2004-


                  Web mobile   temps réel

                          2008-
Ne pas confondre le web et
         Internet
              Selon le magazine
              américain Wired, les
              applications de type
              smartphone
              pourraient remplacer
              à terme les sites web
              Le web n est qu un
              élément parmi
              d autres d Internet
The « Hype Cycle »
Gartner Group 2010
Les 3 niveaux d information
Information blanche:
Facile et accessible à tous (pas toujours
gratuite!)
Nécessite sélection et traitement manuel ou
automatisée
ex : le web, les ouvrages, les médias
Information grise : a l origine, ce qui échappe
aux circuits classiques de l édition. Par
extension, les sources informelles
Information noire : confidentielle, obtenue via
moyens illégaux

                                                  7
L évolution des usages de la
veille, des supports et des outils
 Années 70
 Veille technologique        Bases de données      Paramétrage d alertes sur
                                scientifiques,        bases de données
 Années 80                      brevets
 Veille concurrentielle et
 stratégique - business      Bases de données      Systèmes d aide à la
 intelligence                info électronique        décision
                                 professionnelle
 Années 90
 Intelligence économique                           Agents intelligents
                             Développement du
                               web                 Logiciels de surveillance
                                                      automatisée
 Années 2000 :
 Veille collaborative                              Plates forme de veille
 Veille d opinion -Veille     Web 2.0
                                                   intégrée
 personnelle Intelligence
 d entreprise                                      Outils de text mining
                             Web 3.0               Flux RSS Monitoring mots
 Années 2010:                                         clés réseaux sociaux
 Veille temps réel -
 multimédia                                        Addons navigateurs Firefox
                                                   Outils d analyse opinion
Veille : Différencier les
           besoins d information
Type de    Besoin        Besoin             Besoin
besoin     d information d information      d information
           instrumental conceptuelle        décisionnelle
Objectif   Rôle           Enrichissement    Rôle d influence
           opérationnel   de la             dans le
           dans un        connaissance et   processus de
           processus      de la réflexion   décision
           d action
Mise en    Recherche       Recherche ou     Veille
oeuvre     d informations: veille           stratégique :
           recherche       documentaire:
                                            Recherche de
           factuelle,     Recherche de      documents,
           recherche de   documents,        recherche de
           documents      collecte          sources, collecte
                          régulière         régulière
                          d information     d information,
                                            analyse
                                            stratégique
Collecte : Les principes de base
Rechercher l information à la source
Les notions de serendipité : art de trouver des
informations pertinentes sans les chercher
Utiliser différentes sources et différents supports
(on ne trouve pas tout sur Internet !)
Recouper les sources d information
Respecter les règles de la déontologie (SCIP,
Fepie www.fepie.org)
Recherche web :
        deux approches
       méthodologiques
L approche « mots clés » : recherche par mots
clés sur texte intégral des pages web. La qualité de
la recherche dépendra du choix des mots clés :
nombre de mots clés, degré de précision, langue,
combinaison avec opérateurs booléens...
Inconvénient : le manque d exhaustivité des
moteurs et méta-moteurs (« web invisible »)

L approche « exploration des sources » :
identifier les sources d information les plus
pertinentes par rapport à la requête, utiliser ensuite
les outils de recherche intégrés à ces sources,
l exploration de liens...
Inconvénient : suppose une bonne connaissance
des sources                                              11
Recherche d information sur
  Internet : se méfier des idées
              reçues
Les moteurs de recherche, même les plus
puissants, n indexent qu une partie du web
(notion de pages dynamiques, « web invisible »)
Les moteurs de recherche n indexent pas le
web en temps réel et ne sont pas à jour
L outil n est pas tout : rechercher l information
« à la source » : portails spécialisés, portails
géographiques...
Les différentes générations
1ère génération    Altavista
                             de moteurs
                             Vieillissement de l index.
(apparus en 95-96)   Hotbot Voilà   Algorithmes de pertinence pas
                     Lycos          toujours efficaces.
2ème génération      Google         Bonne pertinence, index important.
(apparus en 98-      Yahoo
99 ou plus)          MSN Bing
                     Ask

3ème génération      Wisenut        Fonctionnalités de visualisation souvent
(apparus à partir de Exalead        originales Kartoo, Cuil et Wisenut ont
2001)                Kartoo         désormais disparu
                     Cuil

4ème génération      GG Custom      Les moteurs personnalisables, créés par
                     Search         l utilisateur
                     Powerset       Les moteurs sémantiques
                     Wolfram
                     Alpha
                                    Les moteurs multimédias
                     Truveo
                     123people      La recherche de personnes
                     Social         Les moteurs temps réel                     13
                     Mention
Tendances
Représentation cartographique
des résultats (Touchgraph, Social
Computing, Kartoo, Exalead
Constellations,Pikko )

Développement des moteurs
verticaux ou spécialisés (Scirus,
Google Scholar, Medworm )

Interrogation en langage naturel
(True Knowledge, Powerset)

Recherche multilingue
(Google Translated search)

Recherche « mobile »
et « temps réel » (Twitter,
Friendfeed)

Recherche de données
factuelles
(Wolfram Alpha, Google Squared)

Moteurs spécialisés par pays
(Yandex pour la Russie, Baidu pour
la Chine..)                                 14
www.searchenginecolossus.com
Tendances
Regroupement des acteurs.
Simplification de la syntaxe

Personnalisation (Google Custom
Search, Yahoo BOSS, Swicki,
Mozbot, )

Développement des outils de
partage (web social ou « 2.0 » :
bookmarking social, wikis, réseaux
sociaux, moteurs collaboratifs )

Clustering et catégorisation
automatique (Exalead, Vivisimo )

Diffusion de l information via des
flux (formats RSS ou Atom)

Moteurs multimédias (Truveo,
Blinkx, Voxalead )

                                     15
Recherche multimédia
Nombreux moteurs audio
et video : Blinkx, Truveo

Technologies
« Speech to text » Exalead
: lancement de Voxalead
Google Audio Indexing

Options de recherche
avancée d images
(Google, Bing, Exalead ).
Reconnaissance des
couleurs

Recherche par similarité
d image : Like.com, Cydral,
Google Similar Images,
Tineye                                16
La prédominance de Google
 Près de 90 % de part de marché en France
 début 2011 (source : ATMonitor)
 Les raisons du décollage : rapidité, pertinence
 (algorithme du page rank), simplicité (opérateur
 ET par défaut), orientation « pur moteur »,
 marketing viral
 Les raisons du maintien à la première place :
 diversification, liens sponsorisés (Adwords),
 bons investissements, culture d entreprise
 originale

                                               17
Les principaux critères de
 pertinence des moteurs
- Occurrence et densité des mots-clés
- Présence dans l URL, dans le titre ou
positionnement dans la page
- Proximité et ordre des mots-clés
- Taille et styles de polices
- Présence dans les méta-données
(meta-keywords, meta-description)
balise metakeyword désormais obsolète
sur Google, Yahoo et Bing
Critères « off the page » :
- Indice de popularité (page              18

rank jusqu à quand?)
Moteurs de recherche :
        la syntaxe
OR : permet de chercher des synonymes
ou termes proches
Guillemets : pour rechercher une
expression exacte
+ : imposer l orthographe d un mot
- : pour exclure un mot
Limitations de recherche sur Google et
Yahoo : type de doc, date (attention,
date de dernière maj)                  19
Méta-moteurs :quand les utiliser
Les méta-moteurs « on-line » sont parfois trop aléatoires. De
nombreux méta-moteurs en ligne ont disparu ou ont évolué
vers d autres fonctions
A utiliser pour des termes « rares » ou au contraire, pour
avoir un premier aperçu des résultats pour des termes plus
généraux
Les méta-moteurs comparateurs de résultats (Allplus, Jux2,
Releton )
L avenir des méta-moteurs clients (Copernic )



                                                        20
Internet versus bases de
         données
 Intérêt d Internet :          Intérêt des bases de
 . Multiplicité des sources    données :
 d information                 . Fiabilité de l information
 . Interactivité               . Données à valeur ajoutée
 . Couverture internationale   . Forme structurée
 A utiliser pour :             A utiliser pour :
 . Actualité immédiate         . Archives de presse
 . Analyse sites des           . Bilans entreprises
 entreprises                   . Etudes de marché
 . Infos sur pays
 . Fédérations
 professionnelles - portails
 spécialisés
Principales bases de données
      utiles pour la veille
  concurrentielle/marketing
  Agrégateurs presse : Lexis, Factiva,
  Business Source Premier (Monde), Pressed
  (France), Europresse, Pikanews (Europe)
  Etudes de marché : Xerfi
  (France/Europe/Monde), Eurostaf-Les Echos;
  Marketline Datamonitor, Reuter Business
  Insight, Thomson Business Intelligence
  (Monde)
  Info financière : Diane (France), Amadeus
  (Europe), Osiris, Infinantials, Altares,
  Dun&Bradstreet (Monde)
Agrégateurs de presse et
        newsletters
Google actualités 40
éditions mondiales
Des agrégateurs « 2.0 »
: Wikio, Synthesio,
Pikanews
Les newsletters : peu à
peu supplantées par les
flux mais toujours utiles
Astuces !

Remonter dans le temps
(retrouver des pages
disparues) : Wayback
machine www.archive.org

Identifier un nom de domaine
(www.indom.com)
Activer la sérendipité
Trouver des sites portails
     ou fédérateurs             Trouver des sites pointant
                                 vers une source connue




                               Trouver des sites « similaires »
                                    à une source connue
 Trouver des listes de liens
     déjà constituées
Trouver des sites « pointant »
vers une source déjà connue
  Ex : la fonction link dans Google à partir d une URL
  connue
  Sur Yahoo, utiliser Linkdomain
  Ex : "journée
              nationale des études"
  linkdomain:www.adetem.org
  .
Trouver des sites
      « similaires » à une source
                connue

Cartographie
des liens
avec Touchgraph
(ou Kartoo,
Exalead Constellations )
Trouver des sites
  « similaires » à une source
                  connue
Fonction « related » chez Google
Recherche d experts
Recherche sur les sites
universitaires (Google     Recherche de thèses :
Scholar, extraction de     Dissertation abstracts
noms)                      (monde) ou Sudoc
                           (France)
Recherche sur les blogs    Limitation aux
                           documents PPT dans la
Recherche dans les         recherche avancée de
réseaux sociaux via        Google ou recherche de
Google                     documents Powerpoint via
Ex : geosciences           www.slideshare.net
site:www.linkedin.com OR   Moteurs de recherches
site:www.viadeo.com        de personnes
                           www.123people.com
                           www.zoominfo.com
                           www.pipl.com
Personnaliser les flux RSS
     avec Yahoo Pipes

Yahoo Pipes permet
  de filtrer les flux
  RSS à partir d un
  mot clé, de les
  fusionner, de les
  trier
Les nouveaux médias
              sociaux
Nouveaux médias sociaux : le
phénomène Twitter

Une « caisse de résonance » mondiale
pour suivre les tendances

Près de 20 % des messages sur Twitter
mentionnent le nom d une marque
(source : Penn State University)
Vers une veille
« temps réel » ? Développement des
« livestreams » permettant de mixer des
données issues de plusieurs réservoirs
L homme est un document
      comme les autres
La redocumentarisation du
monde
« Les réseaux sociaux
posent aujourd'hui, au
sens propre, la question
documentaire appliquée
au facteur humain »
(Olivier Ertzscheid)
Professionnel



                Réseaux sociaux professionnels       Mashup de flux
                            Viadeo, Linkedin          Yahoo Pipes

                                            Moteurs personnalisables
                                         Google Custom Search
          Bookmarking social
                   Delicious, Diigo
                        Flux RSS et Atom             Blogs d experts
                Wikis                               Mashups
       Wikipedia
Mutualisation            Réseaux sociaux amicaux                Personnalisation
                             Facebook, Myspace
                                                     Microblogging
                                                     Twitter
        Partage photos, vidéos
              Flickr, Youtube         Agrégateurs d actualité
                                          Wikio, Digg
                                                                  Blogs
                                 Grand public
Syndication de contenu : les
          fils RSS
    Un fil RSS (Really simple syndication
    ou Rich Site Summary) est un fichier
    XML qui permet de publier des titres de
    nouvelles ou d'articles, exploitables
    dynamiquement.
    Ils permettent d être alerté en
    permanence sur un domaine
    d actualité ou sur les nouveautés
    apparaissant sur un site précis.
    Format RSS ou ATOM
Accéder aux fils RSS :pas
    d outil miracle
  Intégration aux navigateurs Firefox, IE, (versions
  récentes), Safari, Chrome Clic sur l icone RSS

  Utilisation d un agrégateur en ligne (ex : Netvibes,
  Google Reader, RSS Bandit, Bloglines, Newsgator,
  Feedreader ) www.bloglines.com
  www.netvibes.com

  Agrégateur des flux de médias francophones :
  Alertinfo www.geste.fr

  Options personnalisées de Google ou Yahoo (mon
  Yahoo)
  Logiciels de messagerie (Thunderbird, Outlook )
Monitoring mots clés :
       Google actualités
     http://news.google.fr/
                                   Recherche mots clés




Alerte par mail ou flux (clic sur RSS)
                                                         36
Monitoring mots clés :
   Google Alerts
www.google.fr/alerts

                      Choix des mots clés

                     Actualité, pages web, forums




       Envoi par mail ou sous forme de flux


                                              37
Netvibes : syndication de flux




                        38
Google Reader
                             www.google.fr/reader
                                  Pour ajouter un flux




                              Flux classés par thèmes




                                                                                                 39
Mastère Spécialisé Intelligence des Risques & Innovations / IE   www.FormationContinue-ISEP.fr
Twitter pour la veille?
Diffusion d informations
depuis des sites de
  média,
  blogs, réseaux
  sociaux

                           Recherche et veille
                            (alertes)
                            e-reputation, suivi
                            d une personne
                            physique ou morale,
                            d un sujet, veille
                            marketing
                                                  40
La recherche « temps réel »
Social Mention :
  recherche sur blogs,   Analyse automatique du
  microblogging,           « sentiment » positif,
  bookmarking social,      neutre ou négatif
  vidéos




                                                           41
                           www.FormationContinue-ISEP.fr
Recherche simultanée sur
plusieurs réseaux sociaux
Recherche par nom de personne ou
d entreprise
Moteurs de recherche de personnes:
123people, Zoominfo, Wink, Yoname,
Pipl
Recherche temps réel : Social Mention
Yoono : extension Firefox pour faciliter
l accès à des réseaux sociaux
                                           42
Exemple : veille d opinion
Surveiller l image de la société
Carrefour dans les médias chinois
Comment dit on « Carrefour » en
chinois ?




                                                            43
                            www.FormationContinue-ISEP.fr
Recherche dans le Google
           news
 Chine et création du flux




                             44
Traduction des flux via Google
           Reader




                            45
Résultat




           46

Más contenido relacionado

Similar a Recherche avancée et veille en finance par Véronique Mesguich

Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Claude Martin
 
Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le webechangeurba
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBibliolab
 
Quels enjeux pour la veille de demain ?
Quels enjeux pour la veille de demain ?Quels enjeux pour la veille de demain ?
Quels enjeux pour la veille de demain ?Camille A
 
Conferencen4 cciderennes-130410072856-phpapp02[1]
Conferencen4 cciderennes-130410072856-phpapp02[1]Conferencen4 cciderennes-130410072856-phpapp02[1]
Conferencen4 cciderennes-130410072856-phpapp02[1]Isabelle Heuzé
 
Atelier réseaux sociaux sur la veille
Atelier réseaux sociaux sur la veilleAtelier réseaux sociaux sur la veille
Atelier réseaux sociaux sur la veilleWebpatron
 
L’évolution du métier de veilleur
L’évolution du métier de veilleur L’évolution du métier de veilleur
L’évolution du métier de veilleur Camille A
 
Tech connaissance 2012
Tech connaissance 2012Tech connaissance 2012
Tech connaissance 2012VeilleMag
 
Veille sur Internet, les outils qui font gagner du temps
Veille sur Internet, les outils qui font gagner du tempsVeille sur Internet, les outils qui font gagner du temps
Veille sur Internet, les outils qui font gagner du tempsVincent Pereira
 
Veille sur Internet, les outils qui font gagner du temps
Veille sur Internet, les outils qui font gagner du tempsVeille sur Internet, les outils qui font gagner du temps
Veille sur Internet, les outils qui font gagner du tempsVincent Pereira
 
Les nouveaux habits de la veille
Les nouveaux habits de la veilleLes nouveaux habits de la veille
Les nouveaux habits de la veilleBoostzone Institute
 
2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...
2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...
2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...COMPETITIC
 
Cours en Master 2 IEP Journalisme 2009-2010
Cours en Master 2 IEP Journalisme 2009-2010Cours en Master 2 IEP Journalisme 2009-2010
Cours en Master 2 IEP Journalisme 2009-2010Alexandre Serres
 
Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?Aref Jdey
 
Competitic - Surveillez votre marché et vos concurrents avec internet - numer...
Competitic - Surveillez votre marché et vos concurrents avec internet - numer...Competitic - Surveillez votre marché et vos concurrents avec internet - numer...
Competitic - Surveillez votre marché et vos concurrents avec internet - numer...COMPETITIC
 

Similar a Recherche avancée et veille en finance par Véronique Mesguich (20)

Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01Veille2012 avec-copies-ecran-120416110404-phpapp01
Veille2012 avec-copies-ecran-120416110404-phpapp01
 
Les outils de recherche et veille sur le web
Les outils de recherche et veille sur le webLes outils de recherche et veille sur le web
Les outils de recherche et veille sur le web
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique Mesguich
 
Quels enjeux pour la veille de demain ?
Quels enjeux pour la veille de demain ?Quels enjeux pour la veille de demain ?
Quels enjeux pour la veille de demain ?
 
Conferencen4 cciderennes-130410072856-phpapp02[1]
Conferencen4 cciderennes-130410072856-phpapp02[1]Conferencen4 cciderennes-130410072856-phpapp02[1]
Conferencen4 cciderennes-130410072856-phpapp02[1]
 
Atelier réseaux sociaux sur la veille
Atelier réseaux sociaux sur la veilleAtelier réseaux sociaux sur la veille
Atelier réseaux sociaux sur la veille
 
Cm internet 2010 2011
Cm internet 2010 2011Cm internet 2010 2011
Cm internet 2010 2011
 
L’évolution du métier de veilleur
L’évolution du métier de veilleur L’évolution du métier de veilleur
L’évolution du métier de veilleur
 
Tech connaissance 2012
Tech connaissance 2012Tech connaissance 2012
Tech connaissance 2012
 
Veille sur Internet, les outils qui font gagner du temps
Veille sur Internet, les outils qui font gagner du tempsVeille sur Internet, les outils qui font gagner du temps
Veille sur Internet, les outils qui font gagner du temps
 
Veille sur Internet, les outils qui font gagner du temps
Veille sur Internet, les outils qui font gagner du tempsVeille sur Internet, les outils qui font gagner du temps
Veille sur Internet, les outils qui font gagner du temps
 
Les nouveaux habits de la veille
Les nouveaux habits de la veilleLes nouveaux habits de la veille
Les nouveaux habits de la veille
 
Wurfing8
Wurfing8Wurfing8
Wurfing8
 
2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...
2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...
2011 05 26 Anticipez les évolutions de votre environnement pour adapter votre...
 
Tech connaissance 2012
Tech connaissance 2012Tech connaissance 2012
Tech connaissance 2012
 
Cours en Master 2 IEP Journalisme 2009-2010
Cours en Master 2 IEP Journalisme 2009-2010Cours en Master 2 IEP Journalisme 2009-2010
Cours en Master 2 IEP Journalisme 2009-2010
 
Oeinria
OeinriaOeinria
Oeinria
 
Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?
 
Mediacamp
MediacampMediacamp
Mediacamp
 
Competitic - Surveillez votre marché et vos concurrents avec internet - numer...
Competitic - Surveillez votre marché et vos concurrents avec internet - numer...Competitic - Surveillez votre marché et vos concurrents avec internet - numer...
Competitic - Surveillez votre marché et vos concurrents avec internet - numer...
 

Recherche avancée et veille en finance par Véronique Mesguich

  • 1. AFI CNAM Recherche avancée et veille en finance Véronique MESGUICH WWW.DEVINCI.FR veronique.mesguich@devinci.fr 21 janvier 2011 1 Mastère Spécialisé Intelligence des Risques & Innovations / IE www.FormationContinue-ISEP.fr
  • 2. La société de l information Surabondance de l information, « infobésité » Hyperspécialisation qui empêche une vision d ensemble et a tendance à cloisonner Montée de l incertitude, difficulté à prévoir Influence et désinformation Ubiquité, immédiateté Mondialisation de l information et de la communication 2
  • 3. Surabondance d outils Surabondance d outils aux fonctionnalités souvent redondantes Quelle pérennité ? Comment effectuer les bons choix ?
  • 4. Du web de documents au web de conversations « Web de données » Web « de conversations » Web sémantique Web « de documents » Web multimédia 1994- 2004- Web mobile temps réel 2008-
  • 5. Ne pas confondre le web et Internet Selon le magazine américain Wired, les applications de type smartphone pourraient remplacer à terme les sites web Le web n est qu un élément parmi d autres d Internet
  • 6. The « Hype Cycle » Gartner Group 2010
  • 7. Les 3 niveaux d information Information blanche: Facile et accessible à tous (pas toujours gratuite!) Nécessite sélection et traitement manuel ou automatisée ex : le web, les ouvrages, les médias Information grise : a l origine, ce qui échappe aux circuits classiques de l édition. Par extension, les sources informelles Information noire : confidentielle, obtenue via moyens illégaux 7
  • 8. L évolution des usages de la veille, des supports et des outils Années 70 Veille technologique Bases de données Paramétrage d alertes sur scientifiques, bases de données Années 80 brevets Veille concurrentielle et stratégique - business Bases de données Systèmes d aide à la intelligence info électronique décision professionnelle Années 90 Intelligence économique Agents intelligents Développement du web Logiciels de surveillance automatisée Années 2000 : Veille collaborative Plates forme de veille Veille d opinion -Veille Web 2.0 intégrée personnelle Intelligence d entreprise Outils de text mining Web 3.0 Flux RSS Monitoring mots Années 2010: clés réseaux sociaux Veille temps réel - multimédia Addons navigateurs Firefox Outils d analyse opinion
  • 9. Veille : Différencier les besoins d information Type de Besoin Besoin Besoin besoin d information d information d information instrumental conceptuelle décisionnelle Objectif Rôle Enrichissement Rôle d influence opérationnel de la dans le dans un connaissance et processus de processus de la réflexion décision d action Mise en Recherche Recherche ou Veille oeuvre d informations: veille stratégique : recherche documentaire: Recherche de factuelle, Recherche de documents, recherche de documents, recherche de documents collecte sources, collecte régulière régulière d information d information, analyse stratégique
  • 10. Collecte : Les principes de base Rechercher l information à la source Les notions de serendipité : art de trouver des informations pertinentes sans les chercher Utiliser différentes sources et différents supports (on ne trouve pas tout sur Internet !) Recouper les sources d information Respecter les règles de la déontologie (SCIP, Fepie www.fepie.org)
  • 11. Recherche web : deux approches méthodologiques L approche « mots clés » : recherche par mots clés sur texte intégral des pages web. La qualité de la recherche dépendra du choix des mots clés : nombre de mots clés, degré de précision, langue, combinaison avec opérateurs booléens... Inconvénient : le manque d exhaustivité des moteurs et méta-moteurs (« web invisible ») L approche « exploration des sources » : identifier les sources d information les plus pertinentes par rapport à la requête, utiliser ensuite les outils de recherche intégrés à ces sources, l exploration de liens... Inconvénient : suppose une bonne connaissance des sources 11
  • 12. Recherche d information sur Internet : se méfier des idées reçues Les moteurs de recherche, même les plus puissants, n indexent qu une partie du web (notion de pages dynamiques, « web invisible ») Les moteurs de recherche n indexent pas le web en temps réel et ne sont pas à jour L outil n est pas tout : rechercher l information « à la source » : portails spécialisés, portails géographiques...
  • 13. Les différentes générations 1ère génération Altavista de moteurs Vieillissement de l index. (apparus en 95-96) Hotbot Voilà Algorithmes de pertinence pas Lycos toujours efficaces. 2ème génération Google Bonne pertinence, index important. (apparus en 98- Yahoo 99 ou plus) MSN Bing Ask 3ème génération Wisenut Fonctionnalités de visualisation souvent (apparus à partir de Exalead originales Kartoo, Cuil et Wisenut ont 2001) Kartoo désormais disparu Cuil 4ème génération GG Custom Les moteurs personnalisables, créés par Search l utilisateur Powerset Les moteurs sémantiques Wolfram Alpha Les moteurs multimédias Truveo 123people La recherche de personnes Social Les moteurs temps réel 13 Mention
  • 14. Tendances Représentation cartographique des résultats (Touchgraph, Social Computing, Kartoo, Exalead Constellations,Pikko ) Développement des moteurs verticaux ou spécialisés (Scirus, Google Scholar, Medworm ) Interrogation en langage naturel (True Knowledge, Powerset) Recherche multilingue (Google Translated search) Recherche « mobile » et « temps réel » (Twitter, Friendfeed) Recherche de données factuelles (Wolfram Alpha, Google Squared) Moteurs spécialisés par pays (Yandex pour la Russie, Baidu pour la Chine..) 14 www.searchenginecolossus.com
  • 15. Tendances Regroupement des acteurs. Simplification de la syntaxe Personnalisation (Google Custom Search, Yahoo BOSS, Swicki, Mozbot, ) Développement des outils de partage (web social ou « 2.0 » : bookmarking social, wikis, réseaux sociaux, moteurs collaboratifs ) Clustering et catégorisation automatique (Exalead, Vivisimo ) Diffusion de l information via des flux (formats RSS ou Atom) Moteurs multimédias (Truveo, Blinkx, Voxalead ) 15
  • 16. Recherche multimédia Nombreux moteurs audio et video : Blinkx, Truveo Technologies « Speech to text » Exalead : lancement de Voxalead Google Audio Indexing Options de recherche avancée d images (Google, Bing, Exalead ). Reconnaissance des couleurs Recherche par similarité d image : Like.com, Cydral, Google Similar Images, Tineye 16
  • 17. La prédominance de Google Près de 90 % de part de marché en France début 2011 (source : ATMonitor) Les raisons du décollage : rapidité, pertinence (algorithme du page rank), simplicité (opérateur ET par défaut), orientation « pur moteur », marketing viral Les raisons du maintien à la première place : diversification, liens sponsorisés (Adwords), bons investissements, culture d entreprise originale 17
  • 18. Les principaux critères de pertinence des moteurs - Occurrence et densité des mots-clés - Présence dans l URL, dans le titre ou positionnement dans la page - Proximité et ordre des mots-clés - Taille et styles de polices - Présence dans les méta-données (meta-keywords, meta-description) balise metakeyword désormais obsolète sur Google, Yahoo et Bing Critères « off the page » : - Indice de popularité (page 18 rank jusqu à quand?)
  • 19. Moteurs de recherche : la syntaxe OR : permet de chercher des synonymes ou termes proches Guillemets : pour rechercher une expression exacte + : imposer l orthographe d un mot - : pour exclure un mot Limitations de recherche sur Google et Yahoo : type de doc, date (attention, date de dernière maj) 19
  • 20. Méta-moteurs :quand les utiliser Les méta-moteurs « on-line » sont parfois trop aléatoires. De nombreux méta-moteurs en ligne ont disparu ou ont évolué vers d autres fonctions A utiliser pour des termes « rares » ou au contraire, pour avoir un premier aperçu des résultats pour des termes plus généraux Les méta-moteurs comparateurs de résultats (Allplus, Jux2, Releton ) L avenir des méta-moteurs clients (Copernic ) 20
  • 21. Internet versus bases de données Intérêt d Internet : Intérêt des bases de . Multiplicité des sources données : d information . Fiabilité de l information . Interactivité . Données à valeur ajoutée . Couverture internationale . Forme structurée A utiliser pour : A utiliser pour : . Actualité immédiate . Archives de presse . Analyse sites des . Bilans entreprises entreprises . Etudes de marché . Infos sur pays . Fédérations professionnelles - portails spécialisés
  • 22. Principales bases de données utiles pour la veille concurrentielle/marketing Agrégateurs presse : Lexis, Factiva, Business Source Premier (Monde), Pressed (France), Europresse, Pikanews (Europe) Etudes de marché : Xerfi (France/Europe/Monde), Eurostaf-Les Echos; Marketline Datamonitor, Reuter Business Insight, Thomson Business Intelligence (Monde) Info financière : Diane (France), Amadeus (Europe), Osiris, Infinantials, Altares, Dun&Bradstreet (Monde)
  • 23. Agrégateurs de presse et newsletters Google actualités 40 éditions mondiales Des agrégateurs « 2.0 » : Wikio, Synthesio, Pikanews Les newsletters : peu à peu supplantées par les flux mais toujours utiles
  • 24. Astuces ! Remonter dans le temps (retrouver des pages disparues) : Wayback machine www.archive.org Identifier un nom de domaine (www.indom.com)
  • 25. Activer la sérendipité Trouver des sites portails ou fédérateurs Trouver des sites pointant vers une source connue Trouver des sites « similaires » à une source connue Trouver des listes de liens déjà constituées
  • 26. Trouver des sites « pointant » vers une source déjà connue Ex : la fonction link dans Google à partir d une URL connue Sur Yahoo, utiliser Linkdomain Ex : "journée nationale des études" linkdomain:www.adetem.org .
  • 27. Trouver des sites « similaires » à une source connue Cartographie des liens avec Touchgraph (ou Kartoo, Exalead Constellations )
  • 28. Trouver des sites « similaires » à une source connue Fonction « related » chez Google
  • 29. Recherche d experts Recherche sur les sites universitaires (Google Recherche de thèses : Scholar, extraction de Dissertation abstracts noms) (monde) ou Sudoc (France) Recherche sur les blogs Limitation aux documents PPT dans la Recherche dans les recherche avancée de réseaux sociaux via Google ou recherche de Google documents Powerpoint via Ex : geosciences www.slideshare.net site:www.linkedin.com OR Moteurs de recherches site:www.viadeo.com de personnes www.123people.com www.zoominfo.com www.pipl.com
  • 30. Personnaliser les flux RSS avec Yahoo Pipes Yahoo Pipes permet de filtrer les flux RSS à partir d un mot clé, de les fusionner, de les trier
  • 31. Les nouveaux médias sociaux Nouveaux médias sociaux : le phénomène Twitter Une « caisse de résonance » mondiale pour suivre les tendances Près de 20 % des messages sur Twitter mentionnent le nom d une marque (source : Penn State University) Vers une veille « temps réel » ? Développement des « livestreams » permettant de mixer des données issues de plusieurs réservoirs
  • 32. L homme est un document comme les autres La redocumentarisation du monde « Les réseaux sociaux posent aujourd'hui, au sens propre, la question documentaire appliquée au facteur humain » (Olivier Ertzscheid)
  • 33. Professionnel Réseaux sociaux professionnels Mashup de flux Viadeo, Linkedin Yahoo Pipes Moteurs personnalisables Google Custom Search Bookmarking social Delicious, Diigo Flux RSS et Atom Blogs d experts Wikis Mashups Wikipedia Mutualisation Réseaux sociaux amicaux Personnalisation Facebook, Myspace Microblogging Twitter Partage photos, vidéos Flickr, Youtube Agrégateurs d actualité Wikio, Digg Blogs Grand public
  • 34. Syndication de contenu : les fils RSS Un fil RSS (Really simple syndication ou Rich Site Summary) est un fichier XML qui permet de publier des titres de nouvelles ou d'articles, exploitables dynamiquement. Ils permettent d être alerté en permanence sur un domaine d actualité ou sur les nouveautés apparaissant sur un site précis. Format RSS ou ATOM
  • 35. Accéder aux fils RSS :pas d outil miracle Intégration aux navigateurs Firefox, IE, (versions récentes), Safari, Chrome Clic sur l icone RSS Utilisation d un agrégateur en ligne (ex : Netvibes, Google Reader, RSS Bandit, Bloglines, Newsgator, Feedreader ) www.bloglines.com www.netvibes.com Agrégateur des flux de médias francophones : Alertinfo www.geste.fr Options personnalisées de Google ou Yahoo (mon Yahoo) Logiciels de messagerie (Thunderbird, Outlook )
  • 36. Monitoring mots clés : Google actualités http://news.google.fr/ Recherche mots clés Alerte par mail ou flux (clic sur RSS) 36
  • 37. Monitoring mots clés : Google Alerts www.google.fr/alerts Choix des mots clés Actualité, pages web, forums Envoi par mail ou sous forme de flux 37
  • 39. Google Reader www.google.fr/reader Pour ajouter un flux Flux classés par thèmes 39 Mastère Spécialisé Intelligence des Risques & Innovations / IE www.FormationContinue-ISEP.fr
  • 40. Twitter pour la veille? Diffusion d informations depuis des sites de média, blogs, réseaux sociaux Recherche et veille (alertes) e-reputation, suivi d une personne physique ou morale, d un sujet, veille marketing 40
  • 41. La recherche « temps réel » Social Mention : recherche sur blogs, Analyse automatique du microblogging, « sentiment » positif, bookmarking social, neutre ou négatif vidéos 41 www.FormationContinue-ISEP.fr
  • 42. Recherche simultanée sur plusieurs réseaux sociaux Recherche par nom de personne ou d entreprise Moteurs de recherche de personnes: 123people, Zoominfo, Wink, Yoname, Pipl Recherche temps réel : Social Mention Yoono : extension Firefox pour faciliter l accès à des réseaux sociaux 42
  • 43. Exemple : veille d opinion Surveiller l image de la société Carrefour dans les médias chinois Comment dit on « Carrefour » en chinois ? 43 www.FormationContinue-ISEP.fr
  • 44. Recherche dans le Google news Chine et création du flux 44
  • 45. Traduction des flux via Google Reader 45
  • 46. Résultat 46