SlideShare una empresa de Scribd logo
1 de 23
Descargar para leer sin conexión
Sistemi Di Elaborazione
       Dell’informazione
           Dott. Antonio Calanducci

        Lezione V: Google Web Search
Corso di Laurea in Scienze della Comunicazione
          Anno accademico 2009/2010
wdwdwdwdwdw
                  Storia di Google
• 1995:incontro di Larry Page con Sergey Brin alla
 Stanford University (CA)
• 1996:   i due iniziano a lavorare su BackRub
 -   motore di ricerca basato sull’analisi dei link
• 1998:   comprano una serie di hard disk d’occasione
 -   primo server di Google (Lego case)
 -   Andy Bechtolsheim (Sun co-founder) stacca un
     assegno di $100,000 => nasce Google, Inc.

          A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   2
wdwdwdwdwdw
                       Storia di Google
•   Primo sede: garage di un amico a Menlo Park (CA) - 1 impiegato
•   Passaparola su Internet
    -   interfaccia minimalista
    -   ricerche pertinenti
    -   “Mi sento fortunato”
•   Feb 1999: nuova sede a Palo Alto (8 impiegati)
    -   $25,000,000 di finanziamento
•   Set 1999: nuova sede a Mountain View (40 impiegati)
•   Dic 2007: circa 20000 dipendenti
•   http://www.google.com/corporate/history.html
                A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   3
wdwdwdwdwdw
                   Google laboratory
• Continuo      miglioramento dei servizi esistenti e aggiunta
 di nuovi
• Oltre    ai servizi Web:
 -   nuovo browser: Google Chrome
 -   Google Earth, Sketch Up, Android OS
 -   Android e Google Phone (Nexus One)
 -   http://www.project10tothe100.com/intl/IT/index.html
     -   10 milioni di dollari per idee originali
 -   piani per installare i propri server in mezzo al mare!!!
              A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   4
wdwdwdwdwdw
        Origine del termine Google
• to   google = “fare una ricerca sul web”
• etimologia:

  -   googol (un 1 seguito da 100 zeri)
  -   goggles: “binocolo” --> guardare la rete da vicino
  -   formula magica africana, buon auspicio per la caccia




            A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   5
wdwdwdwdwdw
                         Ricerca Web
• Il   più popolare “motore di ricerca” (search engine)
• disponibile     in 118 lingue su 162 domini nazionali
• Interfaccia    sobria ed essenziale
  -    la versione statunitense (www.google.com) è la più
       aggiornata
  -    versione italiana (www.google.it) attiva dal 15
       settembre 2002


• Demo:     Analisi interfaccia principale di www.google.it

             A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   6
wdwdwdwdwdw
                   Loghi celebrativi
• In   occasioni di eventi speciali ed eventi storici:
  -   Natale, 1 aprile, Thanksgiving, 1st of the year, etc..
  -   olimpiadi, festa nazionale della bastiglia, etc..
• disegnati   da Dennis Hwang
• primodoodle (=disegnino, ghirigoro): agosto 1998, in
 occasione del Burning Man Festival (Nevada)
• http://www.google.com/logos/

• http://www.doodlesource.com/



            A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   7
wdwdwdwdwdw
                        Ricerca di base
• chiavi   di ricerca (keywords) nel campo ricerca
• “Mi    sento fortunato” => reindirizzamento al primo risultato
• Risultati:

  -    riepilogo (numero, tempo di esecuzione)
  -    Titolo
  -    Breve testo con keywords in grassetto
  -    URL, data e dimensione
  -    links a “Copia cache” e “Pagini Simili”
• Il   “suggeritore”: correttore lessicale
                A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   8
wdwdwdwdwdw
                            Il PageRank
•   Successo di Google: pertinenza dei risultati
•   Algoritmo di classificazione delle pagine in base all’importanza
    (indice di popolarità, rango)
    -   classifiche di rilevanza -> determina la posizione nei risultati di
        una ricerca
•   Tecnologia brevettata da Google Inc
•   PageRank definito per singola pagina
•   “Democrazia” nel web: ogni link verso una pagina è come un
    “voto” in una elezione
    -   numero di link (di “voti”)
    -   “importanza” della pagina web che ha assegnato il voto
                A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010     9
wdwdwdwdwdw
                 PageRank e risultati
•   Più link verso una determinata pagina, più alto è il PageRank
•   simile al meccanismo citazioni articoli scientifici
•   PageRank espresso in decimi
•   conoscere il valore di PageRank di una pag:
    -   Google Toolbar o www.prchecker.info
•   Rilevanza nei risultati:
    -   integrazione di PageRank con numero di occorrenze delle
        chiavi di ricerca nella pagina (e in quelle collegate ad essa)
•   Sistema difficile da “hackerare” dai webmasters
•   I clienti di Google non possono salire di posizione
               A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   10
wdwdwdwdwdw
            Indicizzazione e cache
• Google archivia le pagine analizzate sui propri server
 giornalmente (cache)
• Ricerca   nella cache:
 -   utile nel caso in cui il server che ospita una data
     pagina non risulta più accessibile
 -   cons: non è aggiornata il real time


• Demo



            A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   11
wdwdwdwdwdw
                     Operatori ricerca
•   Case insensitive: non c’è distinzione tra lettere minuscole e
    maiuscole
•   Operatore AND (automatico)
    -   cerca pagine che contengono TUTTI i termini, tenendo conto
        dell’ordine
•   Operatore OR
    -   cerca pagina che contengono ALMENO uno dei termini
•   Operatore +
    -   esclusione automatica di parole e carattere d’uso comune
        (singole cifre e lettere, preposizioni, “dove”/”quando”)
    -   usare “+” per una ricerca esplicita
               A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   12
wdwdwdwdwdw
                     Operatori ricerca
•   Operatore “-”
    -   esclude uno o più termini dai risultati
    -   es: televisione -satellitare
•   Operatore virgolette (“”)
    -   ricerca esatta della frase tra virgolette
    -   es: “Mario Rossi”
•   Operatore asterisco (*)
    -   termine jolly, in sostituzione di qualsiasi termine all’interno di
        una frase
    -   es: mi * di immenso
               A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   13
wdwdwdwdwdw
      Composizione degli operatori
• Gli
   operatori possono concatenati per la creazione di
 complesse interrogazioni:
  -   es: televisione “domenica sportiva” -calcio




            A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   14
wdwdwdwdwdw
            Domini delle ricerche
• Opzione   “pagine in Italiano”
 -   solo pagine il cui contenuto è scritto nella ns lingua
• Opzione   “pagine provenienti da: Italia”
 -   pagine redatte in Italiano su server con dominio .it


• Opzione   “Cerca tra i risultati”
 -   affina ulteriormente la ricerca, filtrando i risultati
     correnti
 -   applicazione di un AND
           A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   15
wdwdwdwdwdw
                 Ricerca avanzata
• http://www.google.it/advanced_search?hl=it

• Campi “Trova risultati”: semplificano l’uso degli
 operatori AND, “”, OR, -
• Pagine   redatte in una data lingua e situate in un dato
 paese
• Formato  file: permette di includere/escludere alcuni
 formati di files dai risultati della ricerca (DOC, PDF, PPT,
 XLS, RTF, ...)
• Data:pagine aggiornate nelle ultime 24 ore, ultima
 settimana, ultimo mese, ultimo anno

           A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   16
wdwdwdwdwdw
                  Ricerca avanzata
• Cerca in: consente di specificare se cercare le chiavi di
 ricerca nel titolo, nel corpo, nell’indirizzo, nei
 collegamenti, ovunque nella pagina
• Dominio:     ricerca all’interno di un dato sito o dominio
• Diritti
     di utilizzo: in base alla licenza (Creative
 Commons) di utilizzo:
  -   utilizzati e condivisi/modificati gratuitamente (e anche
      a scopo commerciale)
• SafeSearch:       filtro per contenuti espliciti


            A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   17
wdwdwdwdwdw
                  Ricerca avanzata
• Terza   sezione della ricerca avanzata:
 -   possibilità di fornire una URL
• Pagine    simili: pagine apparteneti allo stesso argomento


• Collegamenti:  pagine che contengono collegamenti alla
 pagina di cui viene fornito la URL
 -   verificare chi mi sta “linkando”




            A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   18
wdwdwdwdwdw
                      Funzioni speciali
•   Calcolatrice:
    -   5+2*2
    -   quanto è 1 km in miglia?
    -   converti 2 metri in piedi
    -   3 minuti in secondi
    -   quanti mesi ci sono in 4 anni?
•   Conversione di unità
    -   3 piedi in metri
    -   16 gradi celsius in fareneith

                A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   19
wdwdwdwdwdw
                     Funzioni speciali
•   Conversione di valute
    -   10 USD in euro
    -   converti 5 euro in pesos messicani
•   Meteo
    -   meteo catania
•   Quotazioni di borsa
    -   AAPL, CSCO
•   Risultati sportivi, programmazione film locali, ricerca locale
    -   AC Milan, film Catania, pizzerie a Catani

               A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   20
wdwdwdwdwdw
               Operatori avanzati
• operatore   site:
 -   limita la ricerca ad un dominio o sito specifico
• operatore   link:
 -   tutte le pagine che dispongono di un collegamento al
     sito stesso
• operatore   related:
 -   un elenco di pagine considerate “simili”
• operatore   filetype:
 -   restringe la ricerca ad un solo tipo di file
           A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   21
wdwdwdwdwdw
                      Operatori avanzati
•   operatore inurl, allinurl:

    -   una (inurl) chiave di ricerca contenuta nella URL o tutte le chiavi (allinurl)

•   operatore intitle, allintitle:

    -   come sopra ma riferito al title di una pagina

•   operatore cache:

    -   ottiene la copia cache di una pagina

•   operatore info:

    -   restituisce tutte le informazione che google conosce sulla pagina indicata
        dopo l’operatore

•   Per approfondimenti sugli operatori:

    -   http://www.googleguide.com/advanced_operators.html
                A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010                 22
wdwdwdwdwdw
                 Preferenze di Google
•   Accessibili da “Impostazioni di ricerca”
•   Lingua dell’interfaccia
•   Lingua della ricerca
•   Filtro SafeSearch
    -   restrizioni contenuti espliciti sessuali
•   Numero di risultati
    -   risultati per pagina (10/20/30/50/100)
•   Finestra dei risultati
•   Proposta suggerimenti
               A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010   23

Más contenido relacionado

Similar a Sistemi lezione-v-google-web-search

Sistemi di elaborazione dell'informazione - Google Docs basics
Sistemi di elaborazione dell'informazione - Google Docs basicsSistemi di elaborazione dell'informazione - Google Docs basics
Sistemi di elaborazione dell'informazione - Google Docs basicsUniversity of Catania
 
7 - Ricercare nel web - 17/18
7 - Ricercare nel web - 17/187 - Ricercare nel web - 17/18
7 - Ricercare nel web - 17/18Giuseppe Vizzari
 
7 - Ricercare nel web - 16/17
7 - Ricercare nel web - 16/177 - Ricercare nel web - 16/17
7 - Ricercare nel web - 16/17Giuseppe Vizzari
 
Job opportunities in_google_emea
Job opportunities in_google_emeaJob opportunities in_google_emea
Job opportunities in_google_emeafirenze-gtug
 
ONLINE - 2 Seconda lezione
ONLINE - 2 Seconda lezioneONLINE - 2 Seconda lezione
ONLINE - 2 Seconda lezionetapisge
 
1 - Introduzione al corso 19/20
1 - Introduzione al corso 19/201 - Introduzione al corso 19/20
1 - Introduzione al corso 19/20Giuseppe Vizzari
 
Laboratorio Internet: 1. Introduzione
Laboratorio Internet: 1. IntroduzioneLaboratorio Internet: 1. Introduzione
Laboratorio Internet: 1. IntroduzioneRoberto Polillo
 
18 - Content sharing sites
18 - Content sharing sites18 - Content sharing sites
18 - Content sharing sitesGiuseppe Vizzari
 
Open Source for Quality
Open Source for QualityOpen Source for Quality
Open Source for QualitySpagoWorld
 
9 - Wordpress e il vostro blog
9 - Wordpress e il vostro blog9 - Wordpress e il vostro blog
9 - Wordpress e il vostro blogGiuseppe Vizzari
 
1 - Introduzione al corso 18/19
1 - Introduzione al corso 18/191 - Introduzione al corso 18/19
1 - Introduzione al corso 18/19Giuseppe Vizzari
 

Similar a Sistemi lezione-v-google-web-search (20)

Sistemi di elaborazione dell'informazione - Google Docs basics
Sistemi di elaborazione dell'informazione - Google Docs basicsSistemi di elaborazione dell'informazione - Google Docs basics
Sistemi di elaborazione dell'informazione - Google Docs basics
 
9 - Ricercare nel Web
9 - Ricercare nel Web9 - Ricercare nel Web
9 - Ricercare nel Web
 
Ricercare nel web
Ricercare nel webRicercare nel web
Ricercare nel web
 
7 - Ricercare nel web - 17/18
7 - Ricercare nel web - 17/187 - Ricercare nel web - 17/18
7 - Ricercare nel web - 17/18
 
7 - Ricercare nel web - 16/17
7 - Ricercare nel web - 16/177 - Ricercare nel web - 16/17
7 - Ricercare nel web - 16/17
 
Corso manzoni lezione 1-2-3
Corso manzoni   lezione 1-2-3Corso manzoni   lezione 1-2-3
Corso manzoni lezione 1-2-3
 
Job opportunities in_google_emea
Job opportunities in_google_emeaJob opportunities in_google_emea
Job opportunities in_google_emea
 
Il browser
Il browserIl browser
Il browser
 
6 - Il browser - 16/17
6 - Il browser - 16/176 - Il browser - 16/17
6 - Il browser - 16/17
 
06 - Il browser
06 - Il browser06 - Il browser
06 - Il browser
 
8 - Il browser
8 - Il browser8 - Il browser
8 - Il browser
 
ONLINE - 2 Seconda lezione
ONLINE - 2 Seconda lezioneONLINE - 2 Seconda lezione
ONLINE - 2 Seconda lezione
 
1 - Introduzione al corso 19/20
1 - Introduzione al corso 19/201 - Introduzione al corso 19/20
1 - Introduzione al corso 19/20
 
Laboratorio Internet: 1. Introduzione
Laboratorio Internet: 1. IntroduzioneLaboratorio Internet: 1. Introduzione
Laboratorio Internet: 1. Introduzione
 
18 - Content sharing sites
18 - Content sharing sites18 - Content sharing sites
18 - Content sharing sites
 
Open Source for Quality
Open Source for QualityOpen Source for Quality
Open Source for Quality
 
Open Source for Quality
Open Source for QualityOpen Source for Quality
Open Source for Quality
 
9 - Wordpress e il vostro blog
9 - Wordpress e il vostro blog9 - Wordpress e il vostro blog
9 - Wordpress e il vostro blog
 
1 - Introduzione al corso 18/19
1 - Introduzione al corso 18/191 - Introduzione al corso 18/19
1 - Introduzione al corso 18/19
 
6 - Il browser - 17/18
6 - Il browser - 17/186 - Il browser - 17/18
6 - Il browser - 17/18
 

Más de University of Catania

Lesson 02 - React Native Development Environment Setup
Lesson 02 - React Native Development Environment SetupLesson 02 - React Native Development Environment Setup
Lesson 02 - React Native Development Environment SetupUniversity of Catania
 
Abilità Informatiche - Lezione 01 introduzione al corso
Abilità Informatiche - Lezione 01   introduzione al corsoAbilità Informatiche - Lezione 01   introduzione al corso
Abilità Informatiche - Lezione 01 introduzione al corsoUniversity of Catania
 
LAP II - Lezione 01 Introduzione al corso
LAP II - Lezione 01   Introduzione al corsoLAP II - Lezione 01   Introduzione al corso
LAP II - Lezione 01 Introduzione al corsoUniversity of Catania
 
Lezione 02 React and React Native installation and Configuration
Lezione 02   React and  React Native installation and ConfigurationLezione 02   React and  React Native installation and Configuration
Lezione 02 React and React Native installation and ConfigurationUniversity of Catania
 
Presentazione Corso LAP 2 A.A. 2016/2017
Presentazione Corso LAP 2 A.A. 2016/2017Presentazione Corso LAP 2 A.A. 2016/2017
Presentazione Corso LAP 2 A.A. 2016/2017University of Catania
 
Sistemi lezione-iv-internet-e-posta-elettronica
Sistemi lezione-iv-internet-e-posta-elettronicaSistemi lezione-iv-internet-e-posta-elettronica
Sistemi lezione-iv-internet-e-posta-elettronicaUniversity of Catania
 
Sistemi lezione-iii-reti-di-calcolatori
Sistemi lezione-iii-reti-di-calcolatoriSistemi lezione-iii-reti-di-calcolatori
Sistemi lezione-iii-reti-di-calcolatoriUniversity of Catania
 
Sistemi - Lezione XIV - Introduzione a HTML
Sistemi - Lezione XIV - Introduzione a HTMLSistemi - Lezione XIV - Introduzione a HTML
Sistemi - Lezione XIV - Introduzione a HTMLUniversity of Catania
 
Sistemi - Lezione XIII - Blogs e Blogger
Sistemi - Lezione XIII - Blogs e BloggerSistemi - Lezione XIII - Blogs e Blogger
Sistemi - Lezione XIII - Blogs e BloggerUniversity of Catania
 
Sistemi lezione i - Presentazione - hardware
Sistemi   lezione i - Presentazione - hardwareSistemi   lezione i - Presentazione - hardware
Sistemi lezione i - Presentazione - hardwareUniversity of Catania
 

Más de University of Catania (13)

Lezione 03 Introduzione a react
Lezione 03   Introduzione a reactLezione 03   Introduzione a react
Lezione 03 Introduzione a react
 
Lesson 02 - React Native Development Environment Setup
Lesson 02 - React Native Development Environment SetupLesson 02 - React Native Development Environment Setup
Lesson 02 - React Native Development Environment Setup
 
Abilità Informatiche - Lezione 01 introduzione al corso
Abilità Informatiche - Lezione 01   introduzione al corsoAbilità Informatiche - Lezione 01   introduzione al corso
Abilità Informatiche - Lezione 01 introduzione al corso
 
LAP II - Lezione 01 Introduzione al corso
LAP II - Lezione 01   Introduzione al corsoLAP II - Lezione 01   Introduzione al corso
LAP II - Lezione 01 Introduzione al corso
 
Lezione 02 React and React Native installation and Configuration
Lezione 02   React and  React Native installation and ConfigurationLezione 02   React and  React Native installation and Configuration
Lezione 02 React and React Native installation and Configuration
 
Presentazione Corso LAP 2 A.A. 2016/2017
Presentazione Corso LAP 2 A.A. 2016/2017Presentazione Corso LAP 2 A.A. 2016/2017
Presentazione Corso LAP 2 A.A. 2016/2017
 
Sistemi lezione-iv-internet-e-posta-elettronica
Sistemi lezione-iv-internet-e-posta-elettronicaSistemi lezione-iv-internet-e-posta-elettronica
Sistemi lezione-iv-internet-e-posta-elettronica
 
Sistemi lezione-iii-reti-di-calcolatori
Sistemi lezione-iii-reti-di-calcolatoriSistemi lezione-iii-reti-di-calcolatori
Sistemi lezione-iii-reti-di-calcolatori
 
Sistemi lezione-ii
Sistemi lezione-iiSistemi lezione-ii
Sistemi lezione-ii
 
Sistemi lezione xv - cenni su css
Sistemi   lezione xv - cenni su cssSistemi   lezione xv - cenni su css
Sistemi lezione xv - cenni su css
 
Sistemi - Lezione XIV - Introduzione a HTML
Sistemi - Lezione XIV - Introduzione a HTMLSistemi - Lezione XIV - Introduzione a HTML
Sistemi - Lezione XIV - Introduzione a HTML
 
Sistemi - Lezione XIII - Blogs e Blogger
Sistemi - Lezione XIII - Blogs e BloggerSistemi - Lezione XIII - Blogs e Blogger
Sistemi - Lezione XIII - Blogs e Blogger
 
Sistemi lezione i - Presentazione - hardware
Sistemi   lezione i - Presentazione - hardwareSistemi   lezione i - Presentazione - hardware
Sistemi lezione i - Presentazione - hardware
 

Sistemi lezione-v-google-web-search

  • 1. Sistemi Di Elaborazione Dell’informazione Dott. Antonio Calanducci Lezione V: Google Web Search Corso di Laurea in Scienze della Comunicazione Anno accademico 2009/2010
  • 2. wdwdwdwdwdw Storia di Google • 1995:incontro di Larry Page con Sergey Brin alla Stanford University (CA) • 1996: i due iniziano a lavorare su BackRub - motore di ricerca basato sull’analisi dei link • 1998: comprano una serie di hard disk d’occasione - primo server di Google (Lego case) - Andy Bechtolsheim (Sun co-founder) stacca un assegno di $100,000 => nasce Google, Inc. A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 2
  • 3. wdwdwdwdwdw Storia di Google • Primo sede: garage di un amico a Menlo Park (CA) - 1 impiegato • Passaparola su Internet - interfaccia minimalista - ricerche pertinenti - “Mi sento fortunato” • Feb 1999: nuova sede a Palo Alto (8 impiegati) - $25,000,000 di finanziamento • Set 1999: nuova sede a Mountain View (40 impiegati) • Dic 2007: circa 20000 dipendenti • http://www.google.com/corporate/history.html A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 3
  • 4. wdwdwdwdwdw Google laboratory • Continuo miglioramento dei servizi esistenti e aggiunta di nuovi • Oltre ai servizi Web: - nuovo browser: Google Chrome - Google Earth, Sketch Up, Android OS - Android e Google Phone (Nexus One) - http://www.project10tothe100.com/intl/IT/index.html - 10 milioni di dollari per idee originali - piani per installare i propri server in mezzo al mare!!! A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 4
  • 5. wdwdwdwdwdw Origine del termine Google • to google = “fare una ricerca sul web” • etimologia: - googol (un 1 seguito da 100 zeri) - goggles: “binocolo” --> guardare la rete da vicino - formula magica africana, buon auspicio per la caccia A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 5
  • 6. wdwdwdwdwdw Ricerca Web • Il più popolare “motore di ricerca” (search engine) • disponibile in 118 lingue su 162 domini nazionali • Interfaccia sobria ed essenziale - la versione statunitense (www.google.com) è la più aggiornata - versione italiana (www.google.it) attiva dal 15 settembre 2002 • Demo: Analisi interfaccia principale di www.google.it A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 6
  • 7. wdwdwdwdwdw Loghi celebrativi • In occasioni di eventi speciali ed eventi storici: - Natale, 1 aprile, Thanksgiving, 1st of the year, etc.. - olimpiadi, festa nazionale della bastiglia, etc.. • disegnati da Dennis Hwang • primodoodle (=disegnino, ghirigoro): agosto 1998, in occasione del Burning Man Festival (Nevada) • http://www.google.com/logos/ • http://www.doodlesource.com/ A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 7
  • 8. wdwdwdwdwdw Ricerca di base • chiavi di ricerca (keywords) nel campo ricerca • “Mi sento fortunato” => reindirizzamento al primo risultato • Risultati: - riepilogo (numero, tempo di esecuzione) - Titolo - Breve testo con keywords in grassetto - URL, data e dimensione - links a “Copia cache” e “Pagini Simili” • Il “suggeritore”: correttore lessicale A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 8
  • 9. wdwdwdwdwdw Il PageRank • Successo di Google: pertinenza dei risultati • Algoritmo di classificazione delle pagine in base all’importanza (indice di popolarità, rango) - classifiche di rilevanza -> determina la posizione nei risultati di una ricerca • Tecnologia brevettata da Google Inc • PageRank definito per singola pagina • “Democrazia” nel web: ogni link verso una pagina è come un “voto” in una elezione - numero di link (di “voti”) - “importanza” della pagina web che ha assegnato il voto A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 9
  • 10. wdwdwdwdwdw PageRank e risultati • Più link verso una determinata pagina, più alto è il PageRank • simile al meccanismo citazioni articoli scientifici • PageRank espresso in decimi • conoscere il valore di PageRank di una pag: - Google Toolbar o www.prchecker.info • Rilevanza nei risultati: - integrazione di PageRank con numero di occorrenze delle chiavi di ricerca nella pagina (e in quelle collegate ad essa) • Sistema difficile da “hackerare” dai webmasters • I clienti di Google non possono salire di posizione A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 10
  • 11. wdwdwdwdwdw Indicizzazione e cache • Google archivia le pagine analizzate sui propri server giornalmente (cache) • Ricerca nella cache: - utile nel caso in cui il server che ospita una data pagina non risulta più accessibile - cons: non è aggiornata il real time • Demo A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 11
  • 12. wdwdwdwdwdw Operatori ricerca • Case insensitive: non c’è distinzione tra lettere minuscole e maiuscole • Operatore AND (automatico) - cerca pagine che contengono TUTTI i termini, tenendo conto dell’ordine • Operatore OR - cerca pagina che contengono ALMENO uno dei termini • Operatore + - esclusione automatica di parole e carattere d’uso comune (singole cifre e lettere, preposizioni, “dove”/”quando”) - usare “+” per una ricerca esplicita A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 12
  • 13. wdwdwdwdwdw Operatori ricerca • Operatore “-” - esclude uno o più termini dai risultati - es: televisione -satellitare • Operatore virgolette (“”) - ricerca esatta della frase tra virgolette - es: “Mario Rossi” • Operatore asterisco (*) - termine jolly, in sostituzione di qualsiasi termine all’interno di una frase - es: mi * di immenso A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 13
  • 14. wdwdwdwdwdw Composizione degli operatori • Gli operatori possono concatenati per la creazione di complesse interrogazioni: - es: televisione “domenica sportiva” -calcio A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 14
  • 15. wdwdwdwdwdw Domini delle ricerche • Opzione “pagine in Italiano” - solo pagine il cui contenuto è scritto nella ns lingua • Opzione “pagine provenienti da: Italia” - pagine redatte in Italiano su server con dominio .it • Opzione “Cerca tra i risultati” - affina ulteriormente la ricerca, filtrando i risultati correnti - applicazione di un AND A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 15
  • 16. wdwdwdwdwdw Ricerca avanzata • http://www.google.it/advanced_search?hl=it • Campi “Trova risultati”: semplificano l’uso degli operatori AND, “”, OR, - • Pagine redatte in una data lingua e situate in un dato paese • Formato file: permette di includere/escludere alcuni formati di files dai risultati della ricerca (DOC, PDF, PPT, XLS, RTF, ...) • Data:pagine aggiornate nelle ultime 24 ore, ultima settimana, ultimo mese, ultimo anno A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 16
  • 17. wdwdwdwdwdw Ricerca avanzata • Cerca in: consente di specificare se cercare le chiavi di ricerca nel titolo, nel corpo, nell’indirizzo, nei collegamenti, ovunque nella pagina • Dominio: ricerca all’interno di un dato sito o dominio • Diritti di utilizzo: in base alla licenza (Creative Commons) di utilizzo: - utilizzati e condivisi/modificati gratuitamente (e anche a scopo commerciale) • SafeSearch: filtro per contenuti espliciti A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 17
  • 18. wdwdwdwdwdw Ricerca avanzata • Terza sezione della ricerca avanzata: - possibilità di fornire una URL • Pagine simili: pagine apparteneti allo stesso argomento • Collegamenti: pagine che contengono collegamenti alla pagina di cui viene fornito la URL - verificare chi mi sta “linkando” A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 18
  • 19. wdwdwdwdwdw Funzioni speciali • Calcolatrice: - 5+2*2 - quanto è 1 km in miglia? - converti 2 metri in piedi - 3 minuti in secondi - quanti mesi ci sono in 4 anni? • Conversione di unità - 3 piedi in metri - 16 gradi celsius in fareneith A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 19
  • 20. wdwdwdwdwdw Funzioni speciali • Conversione di valute - 10 USD in euro - converti 5 euro in pesos messicani • Meteo - meteo catania • Quotazioni di borsa - AAPL, CSCO • Risultati sportivi, programmazione film locali, ricerca locale - AC Milan, film Catania, pizzerie a Catani A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 20
  • 21. wdwdwdwdwdw Operatori avanzati • operatore site: - limita la ricerca ad un dominio o sito specifico • operatore link: - tutte le pagine che dispongono di un collegamento al sito stesso • operatore related: - un elenco di pagine considerate “simili” • operatore filetype: - restringe la ricerca ad un solo tipo di file A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 21
  • 22. wdwdwdwdwdw Operatori avanzati • operatore inurl, allinurl: - una (inurl) chiave di ricerca contenuta nella URL o tutte le chiavi (allinurl) • operatore intitle, allintitle: - come sopra ma riferito al title di una pagina • operatore cache: - ottiene la copia cache di una pagina • operatore info: - restituisce tutte le informazione che google conosce sulla pagina indicata dopo l’operatore • Per approfondimenti sugli operatori: - http://www.googleguide.com/advanced_operators.html A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 22
  • 23. wdwdwdwdwdw Preferenze di Google • Accessibili da “Impostazioni di ricerca” • Lingua dell’interfaccia • Lingua della ricerca • Filtro SafeSearch - restrizioni contenuti espliciti sessuali • Numero di risultati - risultati per pagina (10/20/30/50/100) • Finestra dei risultati • Proposta suggerimenti A. Calanducci - Sistemi: Lezione V - Catania, 07/04/2010 23