|
web agency
Realizzazione siti Web
Posizionamento nei motori di ricerca
web marketing
Guida al Web Marketing
Articoli sul Web Marketing
FAQ sul Web Marketing
Libri sul Web Marketing
directory
Come funziona
Iscrizione gratuita
Login
download
SEO Script
SEO Software
seo tools
Alexa Site Info
Meta Tag Generator
PageRank Calculator
Status 301 Generator
Link Popularity
Pagine Indicizzate su Google
risorse seo
Directory Italiane
Motori di Ricerca Italiani
siti utili
Corso Web Marketing
Registrazione domini
Area Aziende
|
Il file robots.txt
Corso professionale Web Marketing
Iscriviti a MRW Corsi ed acquista il corso online professionale sul Web Marketing ed i Motori di Ricerca. Lezioni consultabili online, forum di assistenza, quiz, area download ed attestato di partecipazione! Il file robots.txt è un semplicissimo file di testo che va inserito (non necessariamente, ma si consiglia di usarlo) nella root del server di un sito Web (la cartella principale del sito) e serve ad indicare agli spider dei motori di ricerca se indicizzare o meno determinati file o intere cartelle. Immaginiamo che nel nostro sito ci siano file e cartelle che non ci interessano vengano indicizzate, come la cartella delle immagini (qualora il nostro sito non sia dedicato l'esposizione di foto) oppure la cartella del pannello di controllo per gli aggiornamenti automatici, oppure il foglio di stile CSS o il file Javascript esterno. Se lo spider trova materiale a cui non dedicare del tempo in fase di indicizzazione, sarà più concentrato a lavorare sul materiale (alludo ovviamente a file e cartelle) che ci interessa sia indicizzato, offrendoci comunque un vantaggio in questa direzione. Il vantaggio è oggettivo, ma non si pensi che questo sistema possa "cambiare la vita" in meglio fino a che punto. Vediamo un banale, quanto verosimile, esempio di codice da utilizzare all'interno del nostro file robots.txt: User-agent: * Disallow: /cartella_da_non_indicizzare/ Disallow: /cartella_da_indicizzare/file_da_non_indicizzare.html Disallow: /file_da_non_indicizzare.html La direttiva User-agent accetta come valore il nome dello spider a cui comunicare di non indicizzare determinati file e cartelle, oppure il carattere asterisco (*) che indica tutti gli spider, ed è la soluzione che consiglio sempre. La direttiva Disallow, invece (alla lettera "non consentire"), può essere ripetuta tante volte quanti sono i file e le cartelle da non far indicizzare allo spider. Come è possibile vedere nell'esempio, si può indicare un'intera cartella, un singolo file presente in una cartella (dove la cartella va indicizzata, ma quel singolo file no) o semplicemente un file. Libri sul Web Marketing
Le altre lezioni della guida[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] | ||
| © 2008 SEO Tag di Luca Ruggiero - Partita IVA 05564851219 - Privacy | Contatti | |||
|
Partners: Appunti PHP | Xdownload.it
| |||