Drag

Chiama adesso!
800 93 1196

16 dicembre 2019

Sitemap Xml : cos’è, a cosa serve e come crearne una efficace

Desirée Pucci

Scritto daDesirée Pucci

Tempo stimato per la lettura5 minuti

La documentazione di Google afferma che le sitemap XML sono utili per "siti Web di grandi dimensioni", per "siti Web con archivi di grandi dimensioni", per "nuovi siti Web con pochi collegamenti esterni" e per "siti Web che utilizzano contenuti multimediali".

Sebbene sia facile concordare sul fatto che questo tipo di siti Web trarrà sicuramente il massimo beneficio dall'avere una Sitemap, è altrettanto utile sapere che le sitemap XML sono egualmente vantaggiose per ogni sito, che sia un e-commerce o un sito tradizionale, indipendentemente dalla dimensione e dalla tipologia. Ogni singolo sito web, infatti, ha bisogno che Google sia in grado di trovare facilmente le pagine più importanti e di sapere quando sono state aggiornate l'ultima volta.


Che aspetto ha una Sitemap XML?

Quando si parla di sitemap, è bene ricordare che tali strumenti sono create esclusivamente per i motori di ricerca e non per gli esseri umani; per questo motivo, il linguaggio utilizzato è particolarmente strutturato e prevede delle imposizioni particolari che consentono al motore di ricerca di indicizzare al meglio i contenuti di un sito web.

Ecco un esempio classico di file sitemap.xml :

<? xml version = "1.0" encoding = "UTF-8"?>
<urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9">
<URL>
<Loc> https://nomesito.com/ </ loc>
<Lastmod> 2019-11-22T16: 14: 20 + 05: 00 </ lastmod>
</ Url>
<URL>
<Loc> https://nomesito.com.com/blog/ </ loc>
<Lastmod> 2019-07-31T07: 56: 12 + 03: 00 </ lastmod>
</ Url>
</ Urlset>

Per comprendere bene il significato, è opportuno analizzare le varie parti che compongono il file xml partendo da quella che viene definita la “Dichiarazione XML” (<? xml version = "1.0" encoding = "UTF-8"?>); questa particolare stringa di codice indica ai motori di ricerca che stanno leggendo un file di tipo XML. Inoltre, tale sezione indica la versione di XML e la codifica dei caratteri utilizzata. Per le Sitemap, la versione dovrebbe essere 1.0 e la codifica UTF - 8.

La stringa <urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9"> rappresenta quello che viene definito una URL SET, ovvero un contenitore per tutti gli URL nella Sitemap; esso indica ai crawler quale protocollo viene utilizzato. La maggior parte delle sitemap specifica lo standard Sitemap 0.90, che è supportato da Google e da altri motori di ricerca.

Una volta specificati i parametri che riguardano la codifica di caratteri e il tipo di protocollo utilizzato, è possibile iniziare con l’elenco delle URL da indicizzare; la stringa seguente :

<URL>
<Loc> https://ahrefs.com/ </ loc>
<Lastmod> 2019-08-21T16: 12: 20 + 03: 00 </ lastmod>
</ Url>

rappresenta perfettamente la tipologia di struttura da adottare all’interno di una sitemap per consentire l’indicizzazione di determinate pagine web. E’ necessario utilizzare il tag di apertura (<URL>) per ogni indirizzo che si desidera includere nella ricerca di Google. E’ altrettanto necessario specificare la posizione dell'URL utilizzando un tag <loc>.

Come si può vedere nell’esempio appena riportato, è presente anche un altro tag denominato “lastmod”; quest’ultimo specifica la data dell'ultima modifica del file è deve essere nel formato W3C Datetime. Si tratta di un tag non necessario ma che è preferibile includere per facilitare ulteriormente il lavoro di indicizzazione ai motori di ricerca.

Tra gli altri tag facoltativi che è possibile utilizzare nella sitemap per favorire l’indicizzazione di determinate URL, troviamo :

Tag <priority>: specifica la priorità dell'URL rispetto a tutti gli altri URL sul sito. I valori sono compresi tra 0,0 e 1,0. Più alto è il valore, più la URL è considerata importante.

Tag <changefreq>: specifica la frequenza con cui è probabile che la pagina venga modificata. Il compito di questo tag è quello di dare ai motori di ricerca un'idea della frequenza con cui potrebbero voler riprogrammare l'URL.


Sitemap XML : quali pagine includere

Quando si decide di creare una sitemap per il proprio sito web, è importante capire quali pagine includere e quali escludere.

Il miglior consiglio in questi casi è quello di iniziare sempre pensando alla pertinenza di una URL e al fatto se si desidera o meno che tale indirizzo possa rappresentare un link di entrata per il proprio sito.

Nel caso in cui una URL possa risultare una buona pagina di atterraggio, è opportuno includerla nella sitemap, in quanto potrebbe favorire la permanenza del visitatore e creare un maggiore engagement.

Nel caso esattamente contrario, è opportuno escludere la suddetta pagina dalla sitemap da inviare a Google; tuttavia, se davvero si desidera che l'URL non venga visualizzata nei risultati di ricerca, sarà necessario aggiungere un tag "noindex, follow" che specifichi la richiesta di non indicizzazione della pagina. Infatti, non è sufficiente non inserire una URL all’interno della sitemap per far sì che Google non la indicizzi.

Supponiamo, ad esempio, di aver appena ultimato la realizzazione del nostro blog personale: l’obiettivo è quello che Google trovi rapidamente i nuovi post per essere sicuro che il pubblico di destinazione possa trovare il nostro sito all’interno dei risultati di ricerca. Ecco che diventa importante concentrarsi su quelle che possono essere le “categorie” di articoli presenti sul blog; indicizzando in maniera corretta (grazie anche all’utilizzo dei tag priority e lastmod) le varie sezioni del blog, sarà più facile per Google capire quali sono i contenuti più interessanti e procedere con la loro indicizzazione.


Limitazioni della Sitemap

Come ogni file che concorra a struttura in maniera ottimale un sito web, anche la sitemap, per essere efficace, deve necessariamente attenersi ad alcune restrizioni; la stemap XML generalmente presenta due limiti principali :

Numero di URL che è possibile includere in ciascuna Sitemap
La dimensione del file della Sitemap XML
Una singola Sitemap XML non deve contenere più di 50.000 URL e la dimensione del file di una singola sitemap non deve superare i 50 MB quando non è compressa e i 10 MB quando è compressa.

Per quanto riguarda i siti di piccole e medie dimensioni, quest’ultimo “paletto” non rappresenta un grosso problema dato che il numero totale delle URL da indicizzare è solitamente molto più esiguo; la questione riguarda soprattutto i siti web di grandi dimensioni dove il numero delle URL può essere molto consistente e superare abbondantemente le 50000 pagine.

In quest’ultimo caso, è necessario suddividere la sitemap in sotto-sitemaps che saranno poi raggruppate in una Sitemap index; prima di iniziare questo procedimento, è importante conoscere alcune linee guida, ovvero :

La Sitemap index deve essere denominata "www.nomesito.com/it/sitemap-index.xml"
La sitemap index non deve contenere altre sitemap index al suo interno. Questo per evitare il problema denominato "Indicizzazione sitemap nidificata".


Come inviare una Sitemap a Google

Esistono diversi modi per inviare la Sitemap a Google:

Il metodo ping manuale
Il metodo robots.txt
Il metodo della console di ricerca di Google
Per chi sceglie di affidarsi al metodo del ping manuale è necessario utilizzare il semplice comando ping nella barra degli indirizzi del browser per inviare una Sitemap a Google (ad esempio : https://www.google.com/webmasters/tools/ping?sitemap=https://nomesito.com/sitemap.xml)

Per utilizzare invece il metodo robots.txt, è necessario aggiungere l'URL della Sitemap nella prima o nell'ultima riga del file robots.txt (ad esempio: https://nomesito.com/sitemap.xml)

Il metodo più semplice per chi non ha molta dimestichezza con questo tipo di pratiche, è senza dubbio quello che prevede l’utilizzo della console di ricerca di Google. In questo caso, infatti, è sufficiente recarsi all’interno della dashboard dello strumento di Google, cliccare sulla voce “Sitemap” e inserire la URL corrispondente al file xml presente sul nostro sito (ad esempio : https://nomesito.com/sitemap.xml) e cliccare su invia.


Importanza della Sitemap a livello SEO

Per coloro che si occupano a livello professionale di posizionamento siti web (Search Engine Optimization) la Sitemap è un file estremamente importante da monitorare prima di iniziare qualsiasi tipo di attività di ottimizzazione SEO.

Una Sitemap è un file speciale che consiste in un elenco di tutte le pagine che un determinato sito Web contiene, vale a dire tutte le pagine valide e disponibili che sono utili agli utenti. L'obiettivo principale dell'utilizzo della Sitemap è assicurarsi che Google comprenda ogni pagina del sito perché migliore è la comprensione di quest’ultimo da parte del motore di ricerca, migliore sarà la capacità di collegare le pagine a persone che cercano servizi, prodotti e altre informazioni.

Le pagine di un sito Web dovrebbero essere visibili a Google prima che esse possano raggiungere gli utenti. Maggiore è il numero di pagine che Google indicizza relativamente ad un sito web, maggiore è la fiducia che esso guadagna.

Google legge le pagine utilizzando i crawler (chiamati anche spider) che eseguono la scansione dei collegamenti alle pagine presenti nella Sitemap.

Se sussiste una significativa differenza tra il numero di URL "inviate" e quello di URL effettivamente "indicizzate" in relazione ad una determinata Sitemap, è consigliabile procedere con una attenta analisi del file in quanto potrebbero essere presenti errori che impediscono l'indicizzazione di alcune pagine.


Come generare una sitemap

Quando si tratta di creare una sitemap del proprio sito web, è sempre importante capire qual è il metodo migliore per procedere per non incappare in errori tanto comuni quanto nocivi per la corretta indicizzazione delle URL.

Sebbene sia possibile (e in alcuni casi consigliabile) procedere con la creazione manuale della sitemap, è altrettanto vero che esistono molti tools che sono in grado di creare in maniera efficace delle sitemap.xml altamente strutturate e funzionali.

Come generare una sitemap in Wordpress
Wordpress è uno dei CMS (Content Management System) più utilizzati al mondo per la creazione di siti web di varia natura; nonostante questo dato, è importante sapere che Wordpress non genera in automatico alcun tipo di sitemap.

Per crearne una, quindi, è necessario affidarsi ai numerosi plugin messi a disposizione dell’utente, come il celeberrimo Yoast SEO. Innanzitutto, è necessario accedere alla dashboard di WordPress e, cliccando sulla voce “Aggiungi nuovo” presente nella sezione “Plugin”, cercare il plugin “Yoast SEO". Dopo aver proceduto con l’installazione e la successiva attivazione, è necessario recarsi su SEO> Generale> Funzionalità e assicurarsi che la voce "Sitemap XML" sia attiva.

Se tutti i passaggi appena elencati sono stati completati nella maniera giusta, sarà possibile vedere la sitemap nel percorso nomesito.com/sitemap.xml.


Come generare una sitemap con un tool online

Nel caso di un sito web realizzato con CMS diversi o sfruttando le potenzialità dei tanti frameworks disponibili, è possibile affidarsi ad uno dei numerosi tool (meglio conosciuti come “sitemap generators”) che consentono la creazione di una sitemap.xml in maniera rapida ed efficiente.

Uno tra i generatori di sitemap più interessanti presenti sul web è senza dubbio Screaming Frog XML Sitemap Generator; questo tool, particolarmente amato dai professionisti del posizionamento siti web, può facilmente produrre una o più sitemap XML senza bisogno di operazioni complesse e particolarmente laboriose.

E’ sufficiente infatti recarsi sul sito web ufficiale di Screaming Frog XML Sitemap generator e scaricare il SEO spider Lite version gratuito per un massimo di 500 URL (nel caso fosse necessario eseguire una scansione di oltre 500 URL, è possibile acquistare una licenza annuale che rimuove il limite di scansione e mette a disposizione varie opzioni di configurazione).

Grazie a questo tool è possibile generare delle sitemap molto efficienti e strutturate, senza correre il rischio di perdere URL importanti per strada.


Sitemap XML : i principali vantaggi

A questo punto, credo sia abbastanza chiara l’utilità di una sitemap.xml per l’indicizzazione di un sito web da parte dei motori di ricerca come Google. Per coloro che
avessero ancora dei dubbi, ricordiamo di seguito i principali vantaggi di questo validissimo strumento :

La Sitemap XML fornisce a Google indicazioni valide su come eseguire l’indicizzazione del proprio sito web
La Sitemap XML indica a Google cosa sottoporre a scansione sul proprio sito Web
La Sitemap XML indica a Google che tipo di informazioni sono presenti sul proprio sito web
La Sitemap XML indica a Google quando i tuoi contenuti sono stati aggiornati
La Sitemap XML indica a Google quanto spesso i contenuti di un sito vengono aggiornati.
La Sitemap XML indica a Google quanto siano rilevanti i contenuti di un sito
La Sitemap XML consente di ottenere immediatamente l'indicizzazione per le pagine generate dinamicamente
La Sitemap XML aiuta i siti di grandi dimensioni ad ottenere una indicizzazione migliore e più organizzata