SlideShare una empresa de Scribd logo
1 de 37
Descargar para leer sin conexión
Université AbdelmalekEssadi Faculté des Sciences de Tétouan Département Mathématiques  et Informatiques Année univ. : 2010-2011 Filière : SMP S4   2 – Exploration du Web Anouar Abtoy anouar.abtoy@uae.ma 1
Introduction Internet :  vaste champ d’information. Connecte des millions d’ordinateurs entre eux à travers le monde. 2
Introduction L’information peut provenir de différents sources: Institutions (librairies, universités, gouvernements, musées…) Organisations informelles (groupe d'intérêts, forums, blogs, liste de diffusion…) Publications (livres, journaux, revues, rapports…) Médias (TV, radio,vidéos,DVD,MP3…) Individus (enseignants, bibliothécaires, experts, amis…) 3
Introduction L’utilisation d’Internet pour rechercher de l’information s’impose comme un passage obligé. Les difficultés d’utilisation: Le choix d’un mauvais outil de recherche. Mal stratégie de recherche. Le choix des mauvaises mots-clés. Mal expression des requêtes. 4
Histoire d’Internet 1957: lancement du premier Spoutnik par les russes  ( pleine Guerre froide). Le président Eisenhower des USA décida de créer l’ARPA ( Advanced ResearchProjectsAgency) au sien de DoD (Department of Defense). Objectif: créer un système de communication décentralisé pour l’armée américaine dans le cas de destruction de l’ensemble des réseaux de communication par des ogives atomiques soviétiques.. 5
Histoire d’Internet 1967: les premiers fondements théoriques de ARPANET. Ne disposait que du service de courrier électronique. 1969: l’utilisation de ARPANET dans le domaine public. ARPANET relie 4 instituts universitaires ( Standford, UCLA, Santa barbara et Utah) 6
Qu’est-ce qu’Internet ? Le réseau des réseaux. Acheminer l’information d’une machine vers une autre. L’un des protocoles qui a marqué l’impulsion d’Internet est TCP/IP 7
Le Web En anglais : WroldWide Web la « toile (d’araignée) mondiale » communément appelé le Web, parfois la Toile ou le WWW (3W). Le Web n’est qu’une des applications d’Internet 8
Le Web Origine: 1989 Tim Berners Lee propose de créer su le site internet du CERN ( Centre européen pour la recherche nucléaire) un ensemble de documents reliés les uns aux autres par des liens hypertextes. 9 Tim Berners Lee
Le Web Le WWW: Utilise le protocole HTTP pour transférer les documents. Les documents ( pages) sont écrits dans un langage HTML(HypertextMarkupLanguage) 10 Hypertexte: un lien qui consiste à lier ou pointer un document vers un autre
Le Web	 Document HTML Page Web Extension : .html Ensemble de pages Web == un site Web. 11
Le Web	 Un site Web doit être hébergé par un serveur. Un certain nombre d’outils sont à installer: Un Serveur Web (Ex: Apache) Un langage de script (Ex: PHP)  Un serveur de base de données (Ex: MySQL) … 12
Le Web Pour consulter une page Web, il faut disposer d’un navigateur: MozillaFirefox Internet Explorer Google Chrome Apple Safari …… 13
Le Web Visible Le web dit visible ou surfacique est en fait constitué de toutes les pages indexées par les moteurs de recherche Google, Yahoo, Bing…). Indexation :  14 un moteur de recherche "aspire" les pages et les indexe dans des bases de données contenues sur des servers. Lorsqu'un quelconque utilisateur effectue une recherche, il lance dans le même temps une requête sur la base de donnée.  Ex: Google indexe environ 9 à 10 % du web entier  ces 10% qui constituent le web visible
Le Web invisible Dit aussi le web caché (en anglais Hidden web ) ou le web profond (deep web). C’est la partie du web accessible en ligne, mais non indexée par les moteurs de recherche classiques généralistes.  inaccessible aux moteur de recherche. 15
Le Web invisible Selon CompletePlanet*, le web profond serait 500 fois plus grand que le web de surface ( visible). 16 *:http://aip.completeplanet.com/
Le Web invisible Typologie du contenu des sites: Les bases de données (BD) spécialisées par sujet: 	Ex: des BD médicales, de physique, de brevets; Les BD internes à des sites volumineux: 	Ces pages sont générées dynamiquement. 	Ex: la base de connaissance des sites Microsoft  17
Le Web invisible Typologie du contenu des sites: Les publications: les BD interrogeables ( via un moteur interne) donnant accès à des articles, des extraits d’ouvrages, des thèses, des livres blancs… 	Ex: FindArticles et books.google; 18
Le Web invisible Typologie du contenu des sites: Les bibliothèques en ligne.  	Ex: la bibliothèques du Congés des États-Unis; 19
Le Web invisible Typologie du contenu des sites: Les pages jaunes et blanches: répertoires de personnes morales et physiques. 	Ex: www.pj.ma 20
Le Web invisible Comment identifier les sites du web invisibles ? Quelques outils : Outils de recherche spécialisés: Yahoo! SearchSubscriptions ( recherche thématique) Incywincy ( moteur de recherche du web invisible) 21
Le Web invisible FindArticles( moteur de recherche d’articles, de journaux, de magazines, etc…) Google Scholar(moteur de recherche des travaux universitaires) 22
Le Web invisible High Beam( moteur de recherche, à usage académique et professionnel, de journaux, magazines, et d’autres publications) HighWirePress(spécialisé dans la numérisation des publications scientifiques : journaux, ouvrages et autres) 23
Le Web invisible Les répertoires de moteurs: Allsearchengines( spécialisé dans la recherche sur le web britannique) Finderseeker(moteur de recherche des moteur de recherche) 24
Le Web invisible Les bases de données interrogeables: The Internet Archive ( librairie numérique offrant l’accès universel aux ouvrages, vidéos, musiques…) 25
Le Web invisible Les Bibliothèques en ligne: Libdex( annuaire des librairies) 26
Les outils de recherche 27
Les moteurs de recherche Indexent régulièrement des millions de pages web dans une base de données. La plupart des moteurs de recherche disposant de 3 composantes : Un logiciel de indexation: appelés aussi robots, spiders ou crawlers. Un logiciel de recherche Un index Ex: 28
Les moteurs de recherche chaque moteur de recherche propose une formulaire simple de recherche. La recherche s’effectue dans la base de données du moteur et nonsur la totalité d’Internet. 29
Les moteurs de recherche Classement des résultats: on peut distinguer deux grandes classes de méthodes de tri: Le tri par pertinence: les résultats d’une requête sont affichés selon un ordre déterminé par le calcul d’un score pour chaque réponse. Le tri par popularité: deux méthodes principales: La méthode basée sur la co-citation: utilise le nombre de liens pointant sur les pages. La méthode basée sur la mesure d’audience: tri les pages en fonction du nombre de visites qu’elles reçoivent 30
Les annuaires Annuaires ou répertoires ≠ moteurs de recherche. Recensent des sites web classés par catégories et sous catégorises. 2 types :  généralistes et spécialisé. Ex: annuaire généraliste Résultats: Par mots-clés Par forme de catégories 31
Les métamoteurs est un logiciel qui puise ses informations à travers plusieurs moteurs de recherche. le métamoteur envoie ses Requêtes à plusieurs moteurs de recherche, et retourne les résultats de chacun d'eux. Ex: 32
D’autres outils Les encyclopédies: elles présentent des informations validées, sûres et de qualité. Site fédérateurs et guides: ils indexent des sites validés pour leur qualité dans des domaines précis appartenant au web visible et invisible. Les webrings: est une collection de sites web et sont souvent composés de sites aux thèmes similaires. 33
Les techniques de recherche 34
Méthodologies de recherche Définition du besoin d’information: L’identification des composantes. La priorisation des composantes. La formulation des composantes : ex: les synonymes. Limitations: Linguistique : plus de 85% du web sont en anglais. Chronologique:  date de publication et période couverte. Géographique : origine des pages web. 35
Opérateurs de recherche Opérateurs logiques (booléens): OR (ou), AND(et),NOT(sauf). Recherche d’expressions:  l’utilisations des guillemets(« … »). Les parenthèses:  sont utilisées pour forcer l’ordre d’exécution des opérateurs. Ex:    (cours OR TD )ET (physique ET quantique) 36
Opérateurs de recherche Opérateurs avancés: Title, intitle ou allintitle: rehcercher les mots-clés uniquement dans le titre des pages web 	Ex: 	intitle:licence professionnelle Filetype: lancer des rehcercher selon le type et e format de fichier. 	Ex: 	cours algèbre filetype:pdf Site: réaliser des recherches au niveau d’un site dont le contenu et très volumineux. 	Ex:	cours réseaux site:www.siteduzero.net D’autres opérateurs, visiter : 				www.searchengineshowdown.com 37

Más contenido relacionado

La actualidad más candente

Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)Alain Marois
 
Les blogs de chercheurs : espaces de réflexion et de communication pour la re...
Les blogs de chercheurs : espaces de réflexion et de communication pour la re...Les blogs de chercheurs : espaces de réflexion et de communication pour la re...
Les blogs de chercheurs : espaces de réflexion et de communication pour la re...OpenEdition
 
Présentation du Web Invisible
Présentation du Web InvisiblePrésentation du Web Invisible
Présentation du Web InvisibleIANTE Réunion
 
Suivre l'actu et lire la presse en ligne Atelier Doc mai 2017
Suivre l'actu et lire la presse en ligne Atelier Doc mai 2017Suivre l'actu et lire la presse en ligne Atelier Doc mai 2017
Suivre l'actu et lire la presse en ligne Atelier Doc mai 2017Alain Marois
 
Principe de recherche scientifique ( matene )
Principe de recherche scientifique ( matene )Principe de recherche scientifique ( matene )
Principe de recherche scientifique ( matene )MATENE ELHACENE
 
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017Alain Marois
 
Recherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponiblesRecherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponiblesURFIST de Paris
 
Pour une recherche bibliographique efficace.pptx
Pour une recherche bibliographique efficace.pptxPour une recherche bibliographique efficace.pptx
Pour une recherche bibliographique efficace.pptxBELVEZE Damien
 
Blogosphère scientifique en SHS : présentation de la plateforme Hypothèses
Blogosphère scientifique en SHS : présentation de la plateforme HypothèsesBlogosphère scientifique en SHS : présentation de la plateforme Hypothèses
Blogosphère scientifique en SHS : présentation de la plateforme HypothèsesURFIST de Rennes
 
Sources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’InformationSources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’InformationLeghnimi Zouhair
 
Méthodologie de Recherche sur Internet - 2001 - Vintage
Méthodologie de Recherche sur Internet - 2001 - VintageMéthodologie de Recherche sur Internet - 2001 - Vintage
Méthodologie de Recherche sur Internet - 2001 - Vintagejeromeguedon
 
Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecBibliolab
 
Outils pour la recherche documentaire en psychologie et sciences cognitives -...
Outils pour la recherche documentaire en psychologie et sciences cognitives -...Outils pour la recherche documentaire en psychologie et sciences cognitives -...
Outils pour la recherche documentaire en psychologie et sciences cognitives -...Alain Marois
 
Cours recherche google
Cours recherche googleCours recherche google
Cours recherche googlemounirtemp
 

La actualidad más candente (20)

Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)
 
Méthodologie de la recherche documentaire M1 Anglais
Méthodologie de la recherche documentaire M1 AnglaisMéthodologie de la recherche documentaire M1 Anglais
Méthodologie de la recherche documentaire M1 Anglais
 
Méthodologie de la recherche documentaire M1 Langues romanes
Méthodologie de la recherche documentaire M1 Langues romanesMéthodologie de la recherche documentaire M1 Langues romanes
Méthodologie de la recherche documentaire M1 Langues romanes
 
Les blogs de chercheurs : espaces de réflexion et de communication pour la re...
Les blogs de chercheurs : espaces de réflexion et de communication pour la re...Les blogs de chercheurs : espaces de réflexion et de communication pour la re...
Les blogs de chercheurs : espaces de réflexion et de communication pour la re...
 
Présentation du Web Invisible
Présentation du Web InvisiblePrésentation du Web Invisible
Présentation du Web Invisible
 
Recherche scientifique
Recherche scientifiqueRecherche scientifique
Recherche scientifique
 
Suivre l'actu et lire la presse en ligne Atelier Doc mai 2017
Suivre l'actu et lire la presse en ligne Atelier Doc mai 2017Suivre l'actu et lire la presse en ligne Atelier Doc mai 2017
Suivre l'actu et lire la presse en ligne Atelier Doc mai 2017
 
Principe de recherche scientifique ( matene )
Principe de recherche scientifique ( matene )Principe de recherche scientifique ( matene )
Principe de recherche scientifique ( matene )
 
Polytech geii sept2016
Polytech geii sept2016Polytech geii sept2016
Polytech geii sept2016
 
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
Recherche documentaire : méthode, outils. Master info-com Lyon2 - Mars 2017
 
Web invisible
Web invisibleWeb invisible
Web invisible
 
Recherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponiblesRecherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponibles
 
Pour une recherche bibliographique efficace.pptx
Pour une recherche bibliographique efficace.pptxPour une recherche bibliographique efficace.pptx
Pour une recherche bibliographique efficace.pptx
 
Blogosphère scientifique en SHS : présentation de la plateforme Hypothèses
Blogosphère scientifique en SHS : présentation de la plateforme HypothèsesBlogosphère scientifique en SHS : présentation de la plateforme Hypothèses
Blogosphère scientifique en SHS : présentation de la plateforme Hypothèses
 
Sources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’InformationSources D’Information Et MéThodologie De Recherche De L’Information
Sources D’Information Et MéThodologie De Recherche De L’Information
 
Méthodologie de Recherche sur Internet - 2001 - Vintage
Méthodologie de Recherche sur Internet - 2001 - VintageMéthodologie de Recherche sur Internet - 2001 - Vintage
Méthodologie de Recherche sur Internet - 2001 - Vintage
 
Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 Dec
 
Recherche documentaire Master 2 GEMA
Recherche documentaire Master 2 GEMARecherche documentaire Master 2 GEMA
Recherche documentaire Master 2 GEMA
 
Outils pour la recherche documentaire en psychologie et sciences cognitives -...
Outils pour la recherche documentaire en psychologie et sciences cognitives -...Outils pour la recherche documentaire en psychologie et sciences cognitives -...
Outils pour la recherche documentaire en psychologie et sciences cognitives -...
 
Cours recherche google
Cours recherche googleCours recherche google
Cours recherche google
 

Destacado

Catalogue ateliers, formations & séminaires you & me consulting 2012
Catalogue ateliers, formations & séminaires you & me consulting 2012Catalogue ateliers, formations & séminaires you & me consulting 2012
Catalogue ateliers, formations & séminaires you & me consulting 2012Mohamed REFFADI
 
IN TIME. GAMIFICACIÓN
IN TIME. GAMIFICACIÓNIN TIME. GAMIFICACIÓN
IN TIME. GAMIFICACIÓNCarlosmora1992
 
Diapositivas computacion 2015
Diapositivas computacion 2015Diapositivas computacion 2015
Diapositivas computacion 2015Luisito36
 
La informatica conceptos fundamentales
La informatica  conceptos fundamentalesLa informatica  conceptos fundamentales
La informatica conceptos fundamentalesTomás Piazza
 
PARAMORE
PARAMOREPARAMORE
PARAMOREMelldr
 
Programa en lenguaje c
Programa en lenguaje cPrograma en lenguaje c
Programa en lenguaje cErik Gonzalez
 
Synthese pjd legislative 2011
Synthese pjd legislative 2011Synthese pjd legislative 2011
Synthese pjd legislative 2011Anas El Filali B.
 
Presentación1
Presentación1Presentación1
Presentación1DAX222222
 
Les evolutions du cluster west
Les evolutions du cluster westLes evolutions du cluster west
Les evolutions du cluster westClusterWest
 
Competitic marketing mobile - numerique en entreprise
Competitic   marketing mobile - numerique en entrepriseCompetitic   marketing mobile - numerique en entreprise
Competitic marketing mobile - numerique en entrepriseCOMPETITIC
 
Tecnología Colegio Juan José Passo
Tecnología Colegio Juan José Passo Tecnología Colegio Juan José Passo
Tecnología Colegio Juan José Passo BiancaRossi015
 
Sensibilisation au Design de Services pour La Fabrique de l'Hospitalité du CH...
Sensibilisation au Design de Services pour La Fabrique de l'Hospitalité du CH...Sensibilisation au Design de Services pour La Fabrique de l'Hospitalité du CH...
Sensibilisation au Design de Services pour La Fabrique de l'Hospitalité du CH...User Studio
 

Destacado (20)

Catalogue ateliers, formations & séminaires you & me consulting 2012
Catalogue ateliers, formations & séminaires you & me consulting 2012Catalogue ateliers, formations & séminaires you & me consulting 2012
Catalogue ateliers, formations & séminaires you & me consulting 2012
 
IN TIME. GAMIFICACIÓN
IN TIME. GAMIFICACIÓNIN TIME. GAMIFICACIÓN
IN TIME. GAMIFICACIÓN
 
Diapositivas computacion 2015
Diapositivas computacion 2015Diapositivas computacion 2015
Diapositivas computacion 2015
 
Nanotecnologia
NanotecnologiaNanotecnologia
Nanotecnologia
 
La informatica conceptos fundamentales
La informatica  conceptos fundamentalesLa informatica  conceptos fundamentales
La informatica conceptos fundamentales
 
Balbuena maria marcela
Balbuena maria marcelaBalbuena maria marcela
Balbuena maria marcela
 
PARAMORE
PARAMOREPARAMORE
PARAMORE
 
Jóvenes en apuros
Jóvenes en apurosJóvenes en apuros
Jóvenes en apuros
 
Digital et son empreinte
Digital et son empreinteDigital et son empreinte
Digital et son empreinte
 
Tics
TicsTics
Tics
 
Programa en lenguaje c
Programa en lenguaje cPrograma en lenguaje c
Programa en lenguaje c
 
Synthese pjd legislative 2011
Synthese pjd legislative 2011Synthese pjd legislative 2011
Synthese pjd legislative 2011
 
Presentación1
Presentación1Presentación1
Presentación1
 
Blog
BlogBlog
Blog
 
Annuario IncontriModa 2012
Annuario IncontriModa 2012Annuario IncontriModa 2012
Annuario IncontriModa 2012
 
Les evolutions du cluster west
Les evolutions du cluster westLes evolutions du cluster west
Les evolutions du cluster west
 
Cahier du cevipof - special 2012
Cahier du cevipof - special 2012Cahier du cevipof - special 2012
Cahier du cevipof - special 2012
 
Competitic marketing mobile - numerique en entreprise
Competitic   marketing mobile - numerique en entrepriseCompetitic   marketing mobile - numerique en entreprise
Competitic marketing mobile - numerique en entreprise
 
Tecnología Colegio Juan José Passo
Tecnología Colegio Juan José Passo Tecnología Colegio Juan José Passo
Tecnología Colegio Juan José Passo
 
Sensibilisation au Design de Services pour La Fabrique de l'Hospitalité du CH...
Sensibilisation au Design de Services pour La Fabrique de l'Hospitalité du CH...Sensibilisation au Design de Services pour La Fabrique de l'Hospitalité du CH...
Sensibilisation au Design de Services pour La Fabrique de l'Hospitalité du CH...
 

Similar a (exploration du web)

2 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt20112 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt2011Fleury Christine
 
La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internetalexartiste
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesnonue12
 
Moteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesMoteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesAref Jdey
 
Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010Letaillieur
 
Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010Letaillieur
 
2 focus web
2 focus web2 focus web
2 focus webABES
 
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Anne-Gaëlle Gaudion
 
Information et communication
Information et communication Information et communication
Information et communication jihen damerji
 
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...juriconnexion
 
CRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesCRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesnonue12
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBibliolab
 
Formation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIMFormation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIMMagalie Le Gall
 
Documentation hypotheses.org-0.3.2
Documentation hypotheses.org-0.3.2Documentation hypotheses.org-0.3.2
Documentation hypotheses.org-0.3.2Mathieu_Trouve
 
Documentation de prise en main Hypotheses.org, version 0.3.2, août 2011
Documentation de prise en main Hypotheses.org, version 0.3.2, août 2011Documentation de prise en main Hypotheses.org, version 0.3.2, août 2011
Documentation de prise en main Hypotheses.org, version 0.3.2, août 2011OpenEdition
 
infrastructure numerique_focusweb_cnfpt2011
 infrastructure numerique_focusweb_cnfpt2011 infrastructure numerique_focusweb_cnfpt2011
infrastructure numerique_focusweb_cnfpt2011Fleury Christine
 

Similar a (exploration du web) (20)

2 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt20112 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt2011
 
La recherche d\'information sur internet
La recherche d\'information sur internetLa recherche d\'information sur internet
La recherche d\'information sur internet
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
 
Moteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçuesMoteurs de recherche, finir avec les idées reçues
Moteurs de recherche, finir avec les idées reçues
 
Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010Formation Internet isop 7 juin 2010
Formation Internet isop 7 juin 2010
 
Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010Formation Internet Isop 7 juin 2010
Formation Internet Isop 7 juin 2010
 
Ch4 internet
Ch4   internetCh4   internet
Ch4 internet
 
2 focus web
2 focus web2 focus web
2 focus web
 
BDD sciences & techniques docto-janvier2018
BDD sciences & techniques docto-janvier2018BDD sciences & techniques docto-janvier2018
BDD sciences & techniques docto-janvier2018
 
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
 
Information et communication
Information et communication Information et communication
Information et communication
 
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
 
CRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesCRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de données
 
Bnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique MesguichBnf 15 Dec Véronique Mesguich
Bnf 15 Dec Véronique Mesguich
 
Urfist Web2 0
Urfist Web2 0Urfist Web2 0
Urfist Web2 0
 
Formation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIMFormation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIM
 
Documentation hypotheses.org-0.3.2
Documentation hypotheses.org-0.3.2Documentation hypotheses.org-0.3.2
Documentation hypotheses.org-0.3.2
 
Documentation de prise en main Hypotheses.org, version 0.3.2, août 2011
Documentation de prise en main Hypotheses.org, version 0.3.2, août 2011Documentation de prise en main Hypotheses.org, version 0.3.2, août 2011
Documentation de prise en main Hypotheses.org, version 0.3.2, août 2011
 
infrastructure numerique_focusweb_cnfpt2011
 infrastructure numerique_focusweb_cnfpt2011 infrastructure numerique_focusweb_cnfpt2011
infrastructure numerique_focusweb_cnfpt2011
 
Présentation1.pptx
Présentation1.pptxPrésentation1.pptx
Présentation1.pptx
 

Más de Anouar Abtoy

(travail collaboratif et e learning)
(travail collaboratif et e learning)(travail collaboratif et e learning)
(travail collaboratif et e learning)Anouar Abtoy
 
(enjeux de l'utilisation des TIC)
(enjeux de l'utilisation des TIC)(enjeux de l'utilisation des TIC)
(enjeux de l'utilisation des TIC)Anouar Abtoy
 
(équipements réseau)
(équipements réseau)(équipements réseau)
(équipements réseau)Anouar Abtoy
 
(Médias de communications)
(Médias de communications)(Médias de communications)
(Médias de communications)Anouar Abtoy
 
(Généralités 2)
(Généralités 2)(Généralités 2)
(Généralités 2)Anouar Abtoy
 
(Généralités 1)
(Généralités 1)(Généralités 1)
(Généralités 1)Anouar Abtoy
 

Más de Anouar Abtoy (9)

(travail collaboratif et e learning)
(travail collaboratif et e learning)(travail collaboratif et e learning)
(travail collaboratif et e learning)
 
(enjeux de l'utilisation des TIC)
(enjeux de l'utilisation des TIC)(enjeux de l'utilisation des TIC)
(enjeux de l'utilisation des TIC)
 
(services)
(services)(services)
(services)
 
(adressage)
(adressage)(adressage)
(adressage)
 
(protocoles)
(protocoles)(protocoles)
(protocoles)
 
(équipements réseau)
(équipements réseau)(équipements réseau)
(équipements réseau)
 
(Médias de communications)
(Médias de communications)(Médias de communications)
(Médias de communications)
 
(Généralités 2)
(Généralités 2)(Généralités 2)
(Généralités 2)
 
(Généralités 1)
(Généralités 1)(Généralités 1)
(Généralités 1)
 

(exploration du web)

  • 1. Université AbdelmalekEssadi Faculté des Sciences de Tétouan Département Mathématiques et Informatiques Année univ. : 2010-2011 Filière : SMP S4 2 – Exploration du Web Anouar Abtoy anouar.abtoy@uae.ma 1
  • 2. Introduction Internet : vaste champ d’information. Connecte des millions d’ordinateurs entre eux à travers le monde. 2
  • 3. Introduction L’information peut provenir de différents sources: Institutions (librairies, universités, gouvernements, musées…) Organisations informelles (groupe d'intérêts, forums, blogs, liste de diffusion…) Publications (livres, journaux, revues, rapports…) Médias (TV, radio,vidéos,DVD,MP3…) Individus (enseignants, bibliothécaires, experts, amis…) 3
  • 4. Introduction L’utilisation d’Internet pour rechercher de l’information s’impose comme un passage obligé. Les difficultés d’utilisation: Le choix d’un mauvais outil de recherche. Mal stratégie de recherche. Le choix des mauvaises mots-clés. Mal expression des requêtes. 4
  • 5. Histoire d’Internet 1957: lancement du premier Spoutnik par les russes ( pleine Guerre froide). Le président Eisenhower des USA décida de créer l’ARPA ( Advanced ResearchProjectsAgency) au sien de DoD (Department of Defense). Objectif: créer un système de communication décentralisé pour l’armée américaine dans le cas de destruction de l’ensemble des réseaux de communication par des ogives atomiques soviétiques.. 5
  • 6. Histoire d’Internet 1967: les premiers fondements théoriques de ARPANET. Ne disposait que du service de courrier électronique. 1969: l’utilisation de ARPANET dans le domaine public. ARPANET relie 4 instituts universitaires ( Standford, UCLA, Santa barbara et Utah) 6
  • 7. Qu’est-ce qu’Internet ? Le réseau des réseaux. Acheminer l’information d’une machine vers une autre. L’un des protocoles qui a marqué l’impulsion d’Internet est TCP/IP 7
  • 8. Le Web En anglais : WroldWide Web la « toile (d’araignée) mondiale » communément appelé le Web, parfois la Toile ou le WWW (3W). Le Web n’est qu’une des applications d’Internet 8
  • 9. Le Web Origine: 1989 Tim Berners Lee propose de créer su le site internet du CERN ( Centre européen pour la recherche nucléaire) un ensemble de documents reliés les uns aux autres par des liens hypertextes. 9 Tim Berners Lee
  • 10. Le Web Le WWW: Utilise le protocole HTTP pour transférer les documents. Les documents ( pages) sont écrits dans un langage HTML(HypertextMarkupLanguage) 10 Hypertexte: un lien qui consiste à lier ou pointer un document vers un autre
  • 11. Le Web Document HTML Page Web Extension : .html Ensemble de pages Web == un site Web. 11
  • 12. Le Web Un site Web doit être hébergé par un serveur. Un certain nombre d’outils sont à installer: Un Serveur Web (Ex: Apache) Un langage de script (Ex: PHP) Un serveur de base de données (Ex: MySQL) … 12
  • 13. Le Web Pour consulter une page Web, il faut disposer d’un navigateur: MozillaFirefox Internet Explorer Google Chrome Apple Safari …… 13
  • 14. Le Web Visible Le web dit visible ou surfacique est en fait constitué de toutes les pages indexées par les moteurs de recherche Google, Yahoo, Bing…). Indexation : 14 un moteur de recherche "aspire" les pages et les indexe dans des bases de données contenues sur des servers. Lorsqu'un quelconque utilisateur effectue une recherche, il lance dans le même temps une requête sur la base de donnée. Ex: Google indexe environ 9 à 10 % du web entier  ces 10% qui constituent le web visible
  • 15. Le Web invisible Dit aussi le web caché (en anglais Hidden web ) ou le web profond (deep web). C’est la partie du web accessible en ligne, mais non indexée par les moteurs de recherche classiques généralistes.  inaccessible aux moteur de recherche. 15
  • 16. Le Web invisible Selon CompletePlanet*, le web profond serait 500 fois plus grand que le web de surface ( visible). 16 *:http://aip.completeplanet.com/
  • 17. Le Web invisible Typologie du contenu des sites: Les bases de données (BD) spécialisées par sujet: Ex: des BD médicales, de physique, de brevets; Les BD internes à des sites volumineux: Ces pages sont générées dynamiquement. Ex: la base de connaissance des sites Microsoft 17
  • 18. Le Web invisible Typologie du contenu des sites: Les publications: les BD interrogeables ( via un moteur interne) donnant accès à des articles, des extraits d’ouvrages, des thèses, des livres blancs… Ex: FindArticles et books.google; 18
  • 19. Le Web invisible Typologie du contenu des sites: Les bibliothèques en ligne. Ex: la bibliothèques du Congés des États-Unis; 19
  • 20. Le Web invisible Typologie du contenu des sites: Les pages jaunes et blanches: répertoires de personnes morales et physiques. Ex: www.pj.ma 20
  • 21. Le Web invisible Comment identifier les sites du web invisibles ? Quelques outils : Outils de recherche spécialisés: Yahoo! SearchSubscriptions ( recherche thématique) Incywincy ( moteur de recherche du web invisible) 21
  • 22. Le Web invisible FindArticles( moteur de recherche d’articles, de journaux, de magazines, etc…) Google Scholar(moteur de recherche des travaux universitaires) 22
  • 23. Le Web invisible High Beam( moteur de recherche, à usage académique et professionnel, de journaux, magazines, et d’autres publications) HighWirePress(spécialisé dans la numérisation des publications scientifiques : journaux, ouvrages et autres) 23
  • 24. Le Web invisible Les répertoires de moteurs: Allsearchengines( spécialisé dans la recherche sur le web britannique) Finderseeker(moteur de recherche des moteur de recherche) 24
  • 25. Le Web invisible Les bases de données interrogeables: The Internet Archive ( librairie numérique offrant l’accès universel aux ouvrages, vidéos, musiques…) 25
  • 26. Le Web invisible Les Bibliothèques en ligne: Libdex( annuaire des librairies) 26
  • 27. Les outils de recherche 27
  • 28. Les moteurs de recherche Indexent régulièrement des millions de pages web dans une base de données. La plupart des moteurs de recherche disposant de 3 composantes : Un logiciel de indexation: appelés aussi robots, spiders ou crawlers. Un logiciel de recherche Un index Ex: 28
  • 29. Les moteurs de recherche chaque moteur de recherche propose une formulaire simple de recherche. La recherche s’effectue dans la base de données du moteur et nonsur la totalité d’Internet. 29
  • 30. Les moteurs de recherche Classement des résultats: on peut distinguer deux grandes classes de méthodes de tri: Le tri par pertinence: les résultats d’une requête sont affichés selon un ordre déterminé par le calcul d’un score pour chaque réponse. Le tri par popularité: deux méthodes principales: La méthode basée sur la co-citation: utilise le nombre de liens pointant sur les pages. La méthode basée sur la mesure d’audience: tri les pages en fonction du nombre de visites qu’elles reçoivent 30
  • 31. Les annuaires Annuaires ou répertoires ≠ moteurs de recherche. Recensent des sites web classés par catégories et sous catégorises. 2 types : généralistes et spécialisé. Ex: annuaire généraliste Résultats: Par mots-clés Par forme de catégories 31
  • 32. Les métamoteurs est un logiciel qui puise ses informations à travers plusieurs moteurs de recherche. le métamoteur envoie ses Requêtes à plusieurs moteurs de recherche, et retourne les résultats de chacun d'eux. Ex: 32
  • 33. D’autres outils Les encyclopédies: elles présentent des informations validées, sûres et de qualité. Site fédérateurs et guides: ils indexent des sites validés pour leur qualité dans des domaines précis appartenant au web visible et invisible. Les webrings: est une collection de sites web et sont souvent composés de sites aux thèmes similaires. 33
  • 34. Les techniques de recherche 34
  • 35. Méthodologies de recherche Définition du besoin d’information: L’identification des composantes. La priorisation des composantes. La formulation des composantes : ex: les synonymes. Limitations: Linguistique : plus de 85% du web sont en anglais. Chronologique: date de publication et période couverte. Géographique : origine des pages web. 35
  • 36. Opérateurs de recherche Opérateurs logiques (booléens): OR (ou), AND(et),NOT(sauf). Recherche d’expressions: l’utilisations des guillemets(« … »). Les parenthèses: sont utilisées pour forcer l’ordre d’exécution des opérateurs. Ex: (cours OR TD )ET (physique ET quantique) 36
  • 37. Opérateurs de recherche Opérateurs avancés: Title, intitle ou allintitle: rehcercher les mots-clés uniquement dans le titre des pages web Ex: intitle:licence professionnelle Filetype: lancer des rehcercher selon le type et e format de fichier. Ex: cours algèbre filetype:pdf Site: réaliser des recherches au niveau d’un site dont le contenu et très volumineux. Ex: cours réseaux site:www.siteduzero.net D’autres opérateurs, visiter : www.searchengineshowdown.com 37