Domande Frequenti

Domande frequenti sul protocollo Sitemaps e specifiche del formato.

Note di traduzione

Visualizza maggiori informazioni sulle note di traduzione di questo documento.

Come indico le URL nella Sitemap?

Così come per tutti i file XML, ogni valore dei dati (URL inclusi) deve utilizzare una codifica in entità per i seguenti caratteri: e commerciale (&), apostrofo ('), doppie virgolette ("), maggiore di (<) e minore di (>). Accertati inoltre che tutti gli URL siano conformi allo standard URI RFC-3986, allo standard IRI RFC-3987 e allo standard XML. Se utilizzi uno script per generare gli URL, normalmente è possibile eseguire l'escape (NdT. conversione in entità, in questo caso) direttamente a partire dallo script. Per esempio, il seguente script python codifica in entità http://www.example.com/view?widget=3&count>2

$ python
Python 2.2.2 (#1, Feb 24 2003, 19:13:11)
>>> import xml.sax.saxutils
>>> xml.sax.saxutils.escape("http://www.example.com/view?widget=3&count>2")

L'URL risultante dall'esempio precedente è:

http://www.example.com/view?widget=3&amp;count&gt;2
E' influente il metodo di codifica dei caratteri che uso per generare i file Sitemap?

Sì. I file Sitemap devono utilizzare la codifica UTF-8.

Come specifico una data?

Usa la codifica W3C Datetime per specificare la data di ultima modifica (NdT, tag lastmod) e tutte le altre date ed orari di questo protocollo. Per esempio, 2004-09-22T14:12:14+00:00.

Questa codifica ti consente di omettere la porzione di orario del formato ISO8601; per esempio, 2004-09-22 è valido. Tuttavia, se il tuo sito cambia frequentemente, è consigliabile includere l'ora affinché i crawler abbiano informazioni più complete sul tuo sito.

Come calcolo la data di ultima modifica?

Per file statici, consiste nell'attuale data di aggiornamento del file. Puoi usare il comando UNIX date per ottenere questo valore:

$ date --iso-8601=seconds -u -r /home/foo/www/bar.html
>> 2004-10-26T08:56:39+00:00

Per molte URL dinamiche, potresti essere in grado di calcolare la data di ultima modifica in base a quando le informazioni contenute sono state cambiate o utilizzando un valore approssimativo basato su aggiornamenti periodici (quando applicabile). L'utilizzo di una data approssimativa o di un orario aiuta i crawler a non analizzare URL che non sono cambiati. Questo consente di ridurre il consumo di banda e CPU del web server.

Dove devo inserire la Sitemap?

E' fortemente consigliato salvare la Sitemap nella directory principale (NdT. anche conosciuta come root) del server HTML; ovvero, inserisci il file all'indirizzo http://example.com/sitemap.xml (NdT. dove example.com indica l'URL del vostro sito).

Il alcuni casi, è necessario creare differenti Sitemap per vari percorsi del sito, ad esempio se per ragioni di sicurezza i permessi di scrittura sono suddivisi in differenti directory.

Si presume che se hai permesso di caricare il file http://example.com/path/sitemap.xml hai anche le autorizzazioni per indicare i metadati per http://example.com/path/.

Tutti gli URL elencati nella Sitemap devono risiedere nello stesso host della Sitemap. Per esempio, se la Sitemap si trova in http://www.example.com/sitemap.xml non può includere URL da http://subdomain.example.com. Se la Sitemap si trova in http://www.example.com/myfolder/sitemap.xml non può includere URL da http://www.example.com.

Qual è la dimensione massima per una Sitemap?

Le Sitemaps non devono superare i 10MB (10,485,760 byte) e possono contenere fino ad un massimo di 50.000 URL. Questi limiti garantisono che il server non si blocchi nel tentativo di restituire file di grandi dimensioni. Questo significa che, se il tuo sito contiene più di 50.000 URL o la tua Sitemap supera i 10MB, dovrai creare più file Sitemap ed utilizzare un file Sitemap index. Dovrai usare un file Sitemap index anche nel caso in cui il sito è di dimensioni ridotte ma la prospettiva di crescita supera 50.000 URL o la dimensione di 10MB. Una file Sitemap index può contenere fino a 1.000 Sitemaps e non deve superare i 10MB (10,485,760 bytes). Puoi anche usare gzip per comprimere le Sitemap.

Il mio sito contiene decine di milioni di URL; posso in qualche modo inviare solo quelle che sono state modificate di recente?

Puoi elencare le URL che cambiano con maggiore frequenza in un numero ristretto di Sitemap ed utilizzare il tag lastmod nel file Sitemap index per identificare questi file Sitemap. I motori di ricerca potranno così analizzare in modo incrementale solo le Sitemap modificate.

Cosa devo fare dopo la creazione della Sitemap?

Una volta creata la Sitemap, informa i motori di ricerca inviandola direttamente, eseguendo un ping o aggiungendo l'indirizzo della sitemap nel file robots.txt.

Gli URL nella Sitemap vanno specificati per esteso?

Sì. Va incluso il protocollo (per esempio http) nell'URL. Se il web server lo richiede è inoltre necessario includere la barra finale (/) nell'URL. Per esempio, http://www.example.com/ è un URL valido per una Sitemap mentre www.example.com non lo è.

Il mio sito contiene sia la versione "http" sia "https" degli URL. Devo elencarle entrambe?

No. Indica solo una versione di un URL nelle Sitemap. L'includere di più versioni di un URL può causare una scansione incompleta del sito.

Gli URL del sito contengono l'ID di sessione all'interno. Devo rimuoverla?

Sì. L'inclusione dell'ID di sessione negli URL può causare una scansione incompleta o rindondante del sito.

La posizione di un URL in una Sitemap influisce sul suo utilizzo?

No. La posizione di un URL nella Sitemap non influisce sul modo in cui l'indirizzo viene usato o considerato dai motori di ricerca.

Alcune pagine del sito utilizzano i frame. Devo includere gli URL del frameset o gli URL dei contenuti del frame?

Includi entrambi gli URL.

Posso comprimere le Sitemap nel formato ZIP o devono essere per forza nel formato GZIP?

Usa la compressione GZIP per comprimere le Sitemap. Ricorda, la Sitemap non deve superare i 10MB (10,485,760 bytes), indipendentemente se compressa o meno.

Il valore di priorità inserito nel campo "priority" nella Sitemap XML influenza il posizionamento delle pagine nei risultati delle ricerche?

Il valore di priorità (NdT. campo "priority") nella Sitemap indica esclusivamente l'importanza che un particolare URL assume rispetto alle altre URL dello stesso sito e non implica alcun effetto sul posizionamento delle pagine nei risultati delle ricerche.

Esiste uno schema XML per validare un file Sitemap XML?

Sì. E' disponibile uno schema XML per file Sitemap all'indirizzo http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd ed uno schema per file Sitemap index è disponibile all'indirizzo http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd. Sono inoltre disponibili maggiori informazioni sulla validazione di una Sitemap.

Cosa devo fare se ho un'altra domanda sull'uso del protocollo o sull'invio di una Sitemap?

Consulta la documentazione messa a disposizione da ciascun motore di ricerca per maggiore dettagli sulla segnalazione e l'utilizzo delle Sitemap.