discorso generale sulla fisica e le discipline.pptx
I motori di_ricerca_1
1. Internet
I motori di ricerca
Panoramica su internet, dati, metadati,
strumenti di ricerca ed altro.
2. Sommario
● Dati, metadati, indici, versioni del web, il
web semantico
● I motori di ricerca, i motori di ricerca
semantici, i meta-motori di ricerca
● Interventi SEO
● Dettagli: influenzare i bot, ottimizzazione
dei tag e metatag
● Attendibilità dei risultati
5. Le "versioni" del web
Nella sua prima "versione" il web era stato
concepito come una vetrina in cui contenuti,
prodotti da specialisti, potessero essere pubblicati
per essere fruiti dalle masse...
10. La collezione dei dati
I motori di ricerca
costituiscono le proprie Gli spiders detti anche bot o robot passano di
link in link catturando le pagine.
banche di meta-dati
utilizzando speciali
"agenti" chiamati
anche "spiders", "bots" Gli "snapshot" delle pagine (Circa 100
o "webcrawlers". kb testuali), vengono aggiunte
all'archivio di metadati del motore di
ricerca.
Questi programmi
specializzati leggono le
pagine web dei siti
seguendo i links che le
collegano. Ai metadati viene applicato un
algoritmo che ne calcola il peso di
pertinenza e la posizione nell'indice:
i risultati di una ricerca vengono
poi restituiti in ordine di rilevanza.
12. Il flusso dei meta-motori
dalla documentazione di metasearch.com
13. Influenzare il posizionamento
La SEO è quell'attività di
ottimizzazione che i
webmaster compiono per
rendere i siti più "digeribili"
per i motori di ricerca.
15. Dettaglio: Influenzare i bot
Gli "spiders" scansiscono le Esempio di sitemap.xml
pagine a partire da un link o
<?xml version="1.0" encoding="UTF-8"?>
dall'url ricevuto come indicazione <urlset mlns="http://example.com/sitemap/0.
dal webmaster. 9">
<url>
<loc>http://example.com/</loc>
<lastmod>2005-01-01</lastmod>
Il webmaster può "dialogare" con <changefreq>monthly</changefreq>
i robots mediante appositi <priority>0.8</priority>
</url>
strumenti: </urlset>
● Il form di richiesta di
indicizzazione del motore di Esempio di robots.txt
ricerca.
● Il file sitemap.xml # robots.txt per http://example.com/ diniego per tutti
User-agent: * Disallow: /cyberworld/map/ # Spazio da non
● Il file robots.txt indicizzare
# Solo al bot cybermapper è permesso indicizzare.
User-agent: cybermapper Disallow:
16. Dettaglio: Ottimizzare tag e meta-tag
Il seguente è un esempio di intestazione di una pagina web
contenente i "meta-tag" ed i "tag" più indicativi per i motori:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//IT" "http://www.
w3.org/TR/html4/loose.dtd">
<html>
<head>
<META NAME="Description" CONTENT="Autore: A.N. Autore, Illustratore: P.
Picture, Categoria: Libri, Prezzo: £9.24, Lunghezza: 784 pagine">
<META http-equiv="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="google-site-verification" CONTENT="
+nxGUDJ4QpAZ5l9Bsjdi102tLVC21AIh5d1Nl23908vVuFHs34="/>
<title>Esempi di libri: libri usati di alta qualità per bambini</title>
<META NAME="robots" CONTENT="noindex,nofollow">
Riferimenti:
sample header: cortesia di "Google Webmaster Documentation".
17. Attendibilità dei risultati
I motori di ricerca, forniscono come risultato delle nostre richieste dei
collegamenti a delle pagine web; ma quanto sono attendibili le pagine
risultanti?
E' possibile influenzare in modo
"malevolo" le determinazioni dei motori
di ricerca?