Domande frequenti sul protocollo Sitemaps e specifiche del formato.
Note di traduzione
Visualizza maggiori informazioni sulle note di traduzione di questo documento.
Così come per tutti i file XML, ogni valore dei dati (URL inclusi) deve utilizzare una codifica in entità per i seguenti caratteri: e commerciale (&), apostrofo ('), doppie virgolette ("), maggiore di (<) e minore di (>).
Accertati inoltre che tutti gli URL siano conformi allo standard URI RFC-3986, allo standard IRI RFC-3987 e allo standard XML.
Se utilizzi uno script per generare gli URL, normalmente è possibile eseguire l'escape (NdT. conversione in entità, in questo caso) direttamente a partire dallo script.
Per esempio, il seguente script python codifica in entità http://www.example.com/view?widget=3&count>2
$ python
Python 2.2.2 (#1, Feb 24 2003, 19:13:11)
>>> import xml.sax.saxutils
>>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")
L'URL risultante dall'esempio precedente è:
http://www.example.com/view?widget=3&count>2
Sì. I file Sitemap devono utilizzare la codifica UTF-8.
Usa la codifica W3C Datetime per specificare la data di ultima modifica (NdT, tag lastmod) e tutte le altre date ed orari di questo protocollo. Per esempio, 2004-09-22T14:12:14+00:00.
Questa codifica ti consente di omettere la porzione di orario del formato ISO8601; per esempio, 2004-09-22 è valido. Tuttavia, se il tuo sito cambia frequentemente, è consigliabile includere l'ora affinché i crawler abbiano informazioni più complete sul tuo sito.
Per file statici, consiste nell'attuale data di aggiornamento del file. Puoi usare il comando UNIX date per ottenere questo valore:
$ date --iso-8601=seconds -u -r /home/foo/www/bar.html >> 2004-10-26T08:56:39+00:00
Per molte URL dinamiche, potresti essere in grado di calcolare la data di ultima modifica in base a quando le informazioni contenute sono state cambiate o utilizzando un valore approssimativo basato su aggiornamenti periodici (quando applicabile). L'utilizzo di una data approssimativa o di un orario aiuta i crawler a non analizzare URL che non sono cambiati. Questo consente di ridurre il consumo di banda e CPU del web server.
E' fortemente consigliato salvare la Sitemap nella directory principale (NdT. anche conosciuta come root) del server HTML; ovvero, inserisci il file all'indirizzo http://example.com/sitemap.xml (NdT. dove example.com indica l'URL del vostro sito).
Il alcuni casi, è necessario creare differenti Sitemap per vari percorsi del sito, ad esempio se per ragioni di sicurezza i permessi di scrittura sono suddivisi in differenti directory.
Si presume che se hai permesso di caricare il file http://example.com/path/sitemap.xml hai anche le autorizzazioni per indicare i metadati per http://example.com/path/.
Tutti gli URL elencati nella Sitemap devono risiedere nello stesso host della Sitemap. Per esempio, se la Sitemap si trova in http://www.example.com/sitemap.xml non può includere URL da http://subdomain.example.com. Se la Sitemap si trova in http://www.example.com/myfolder/sitemap.xml non può includere URL da http://www.example.com.
Le Sitemaps non devono superare i 10MB (10,485,760 byte) e possono contenere fino ad un massimo di 50.000 URL. Questi limiti garantisono che il server non si blocchi nel tentativo di restituire file di grandi dimensioni. Questo significa che, se il tuo sito contiene più di 50.000 URL o la tua Sitemap supera i 10MB, dovrai creare più file Sitemap ed utilizzare un file Sitemap index. Dovrai usare un file Sitemap index anche nel caso in cui il sito è di dimensioni ridotte ma la prospettiva di crescita supera 50.000 URL o la dimensione di 10MB. Una file Sitemap index può contenere fino a 1.000 Sitemaps e non deve superare i 10MB (10,485,760 bytes). Puoi anche usare gzip per comprimere le Sitemap.
Puoi elencare le URL che cambiano con maggiore frequenza in un numero ristretto di Sitemap ed utilizzare il tag lastmod nel file Sitemap index per identificare questi file Sitemap. I motori di ricerca potranno così analizzare in modo incrementale solo le Sitemap modificate.
Una volta creata la Sitemap, informa i motori di ricerca inviandola direttamente, eseguendo un ping o aggiungendo l'indirizzo della sitemap nel file robots.txt.
Sì. Va incluso il protocollo (per esempio http) nell'URL. Se il web server lo richiede è inoltre necessario includere la barra finale (/) nell'URL. Per esempio, http://www.example.com/ è un URL valido per una Sitemap mentre www.example.com non lo è.
No. Indica solo una versione di un URL nelle Sitemap. L'includere di più versioni di un URL può causare una scansione incompleta del sito.
Sì. L'inclusione dell'ID di sessione negli URL può causare una scansione incompleta o rindondante del sito.
No. La posizione di un URL nella Sitemap non influisce sul modo in cui l'indirizzo viene usato o considerato dai motori di ricerca.
Includi entrambi gli URL.
Usa la compressione GZIP per comprimere le Sitemap. Ricorda, la Sitemap non deve superare i 10MB (10,485,760 bytes), indipendentemente se compressa o meno.
Il valore di priorità (NdT. campo "priority") nella Sitemap indica esclusivamente l'importanza che un particolare URL assume rispetto alle altre URL dello stesso sito e non implica alcun effetto sul posizionamento delle pagine nei risultati delle ricerche.
Sì. E' disponibile uno schema XML per file Sitemap all'indirizzo http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd ed uno schema per file Sitemap index è disponibile all'indirizzo http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. Sono inoltre disponibili maggiori informazioni sulla validazione di una Sitemap.
Consulta la documentazione messa a disposizione da ciascun motore di ricerca per maggiore dettagli sulla segnalazione e l'utilizzo delle Sitemap.