Seo Web Tool
Google Sitemaps Generator

Google Sitemaps

Probabilmente tutti voi avrete sentito parlare di Google SiteMap, ma per chi ancora sta muovendo i primi passi nella creazione di siti internet avrà bisogno di sapere cosa fare affinché Google indicizzi il vostro sito web. Il vostro sito è ormai pronto, avete aggiunto il vostro url a Google, ma non ancora siete presenti nell’indice. E’ qui che Google SiteMap viene in vostro aiuto. Beh, iniziamo con spiegare in modo semplice cos’è una Google Sitemap e perché è utile. Google SiteMap permette di informare Google su tutte le pagine che compongono il vostro sito, e in particolare quali pagine per voi hanno maggiore importanza, quali sono oggetto di frequenti modifiche e atri dettagli. Queste informazioni permettono una scansione intelligente e rapida da parte dei crawler dei motori di ricerca.

Perché creare una SiteMap?

Quando lo spider del motore di ricerca si accorge del vostro sito o ci arriva tramite un link esterno, inizierà a navigare tutte le vostre pagine in qualsiasi ordine. Avere una mappa del sito che gli segnali quali pagine visitare per prime, quali siano le più importanti gli agevola il lavoro a tutto nostro vantaggio. Sitemap è uno strumento introdotto da Google per agevolare quindi l’attività del crawler: il webmaster tramite la sua SiteMap indica la lista delle URL che compongono il proprio sito. Ovviamente una SiteMap non è indispensabile, il crawler indicizzerà lo stesso il nostro sito ma non otterremmo gli stessi risultati se avesse a disposizione la nostra SiteMap: pensiamo a collegamenti in javascript a pagine del nostro sito, come sappiamo Javascript è ignorato dal crawler, il quale non si accorgerà di tale pagina e di tutte le pagine a partire da questa, perciò non le visiterà. Allo stesso modo, anche una navigazione con filmati Macromedia Flash isolerebbe le nostre pagine. Ma la sitemap ci aiuta anche in altri casi: consideriamo un sito che abbia un’iterfaccia non molto navigabile, oppure pagine alle quali si possa accedere solo tramite moduli di ricerca, così alcune aree del sito sarebbero ignorate dagli utenti e solo l’invio della sitemap ai motori di ricerca segnalerebbe la loro presenza a Google, il quale potrebbe inidicare agli utenti tali pagine come risultato di una ricerca.

Il Protocollo SiteMap

Una SiteMap utilizza il Protocollo SiteMap per indicare ai motori di ricerca gli Url dei siti Web da scansionare. Si tratta di un protocollo in grado di gestire siti di qualsiasi dimensione. Nel file XML possono essere inclusi anche informazioni relative ad ogni Url(data dell’utlima modifica/aggiornamento, frequenza delle modifiche e anche l’importanza da attribuire ad ogni URL), tutto ciò permette al crawler di effettuare una scansione intelligente del nostro sito. Vogliamo precisare che l’utilizzo di questo protocollo non garantisce l’inserimento delle nostre pagine negli indici di ricerca, né influenzail modo in cui le pagine si classificheranno nei risultati di ricerca. Vediamo in particolare com’è formato il file Xml. La stringa iniziale dichiara che si tratta di un documento XML con codifica dei caratteri UTF-8. Il tag <urlset> è il nodo root del documento e rappresenta un tag obbligatorio. Al suo interno è incluso l'intero contenuto della sitemap.

L’<url>  contiene informazioni riguardanti una singola URL del sito, esso può essere l’indirizzo di una pagina web, di un video, di una risorsa multimediale. Ogni tag <url>  contiene un tag <loc> .  E’ un tag obbligatorio e indica l’inidrizzo completo della risorsa. Include il protocollo e non può superare i 2048 caratteri. Vi sono altri tag opzionali figli del nodo <url>:

<lastmode>, nel formato YYYY-MM-DD viene indicarta la data dell’ultima modifica.
<changefreq>, indica la frequenza delle modifiche della pagina espresse tramite i valori always, hourly, daily, weekly, monthly, yearly, never.
<priority>, qui viene segnalata l’importanza della pagina rispetto alla altre che compongono il sito. L’intervallo dei valori è compreso tra 0.0 e 1.0. Se non indicato, il valore assegnato di default è 0.5.

Eccovi una SiteMap di esempio:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.com/schemas/sitemap/0.9">
<url>
<loc>http://www.myexample.com/</loc>
<lastmod>2008-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
</urlset>

Naturalmente essendo un semplice file XML, lo si può scrivere con qualsiasi editor di testo, tuttavia è altamente consigliabile utilizzare i generatori di SiteMap, poiché un errore di sintassi renderebbe il nostro file non valido. Inoltre i generatori di solito eseguono anche controlli sui link inseriti, ad esempi se esistono url duplicati.

Limiti di una SiteMap

E’importante sapere che una sitemap non può contenere più di 50.000 URL e che la sua dimensione non può superare i 10Mb (10,485,760 bytes). Allora viene spontaneo chiedersi cosa succede se un sito ha più 50.000 URL. La soluzione è usare una mappa per ogni sezione: la SiteMap Index ha il compito di contenere tutte le URL delle vostre SiteMap. Al momento della segnalazione sarà sufficiente inviare l’URL della SiteMap Index al posto di ogni singola SiteMap. Una SiteMap index deve iniziare con il tag di apertura <sitemapindex> , includere il tag <sitemap> per ogni sitemap che a sua volta contiene il tag <loc> . E’ possibile utilizzare anche il tag opzionale <lastmod> che indica la data di modifica del file Sitemap corrispondente . Come la SiteMap, anche la SiteMap index deve utilizzare l’encoding UTF-8.

Ubicazione dei file Sitemap

La locazione di una SiteMap determina l’insieme di URL che possono essere incluse nella SiteMap.

Il file SiteMap localizzato in http://example.com/catalog/sitemap.xml può includere qualsiasi URL che inizia solo con http://example.com/catalog/.

Se si ha l’autorizzazione a modificare http://example.org/path/sitemap.gz, si possono anche fornire informazioni relative agli URL che iniziano con http://example.org/path/.

Tutti gli URLs elencati in una SiteMap devono usare lo stesso protocollo (http per esempio) e risiedere sullo host della SiteMap. Gli URL non validi non saranno considerati. E’ altamente raccomandato che la tua SiteMap si trovi nella directory principale del server Web.

Convalida della Sitemap

Per definire gli elementi e gli attibuti che possono apparire nel tuo SiteMap file si utilizza uno schema XML . E’ possibile scaricarlo dai seguenti link:

Per i Sitemap:
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd

Per i file Indice Sitemap:
http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd

Per convalidare la struttura della SiteMap in base a questo schema, puoi utilizzare un elenco di tool relativi a XML nei seguenti percorsi:

http://www.w3.org/XML/Schema#Tools http://www.xml.com/pub/a/2000/12/13/schematools.html

Il file XML deve includere ulteriori intestazioni come mostrato nell’esempio.

Sitemap:

<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9"
url="http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">    
<url>...</url>
</urlset>

Sitemap index file:

<?xml version='1.0' encoding='UTF-8'?>
<sitemapindex xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
          xsi:schemaLocation= "http://www.sitemaps.org/schemas/sitemap/0.9"
          url= "http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd"
          xmlns= "http://www.sitemaps.org/schemas/sitemap/0.9">
    <sitemap>
       ...
    </sitemap>
</sitemapindex>