Web Agency DOWEB
DOWEB Numero Verde

Ufficio

Piazza Buccari 30/a, 37141 Verona

Scritto in data
martedì 04 febbraio 2020
Tempo per la lettura
4 minuti
Condividi

I contenuti duplicati rappresentano uno dei problemi più comuni per chi decide di aprire un sito web, soprattutto perché essi non risultano sempre facilmente "rintracciabili".

Quando si parla di contenuti duplicati, innanzitutto è importante capire bene a cosa ci si riferisce prima di procedere con le eventuali soluzioni.

Il contenuto duplicato è, appunto, un contenuto che appare su Internet in più di un luogo. La localizzazione unica si riferisce ad un singolo sito web (URL) all’interno del quale compare uno specifico contenuto che, se ripetuto su un altro indirizzo web, si guadagna l’attributo di “duplicato”.

Sebbene non sia previsto alcun provvedimento di tipo tecnico per i contenuti duplicati, è innegabile che l’utilizzo di tale tecnica (più o meno consapevole) sia da evitare per non incorrere in penalizzazioni a livello di posizionamento.

Quando, infatti, vengono rilevati dei “contenuti apprezzabilmente simili” (questa è l’espressione usata da Google per definire i contenuti duplicati”), può essere difficile per i motori di ricerca decidere quale versione sia di fatto la più pertinente per una determinata query di ricerca.


Perché è importante prestare attenzione ai contenuti duplicati?

Come accennato poco fa, la pratica dei contenuti duplicati è caldamente sconsigliata dagli esperti di posizionamento siti web soprattutto per via dei problemi che possono presentarsi a livello di posizionamento all’interno dei motori di ricerca; questi ultimi, infatti, si trovano a dover affrontare 3 diverse tipologie di problemi in caso di contenuti duplicati, ovvero :

• Capire quale “versione” del contenuto includere o escludere dagli indici
• Capire se è necessario indirizzare le metriche del collegamento su una pagina o tenerle separate tra più versioni
• Capire quale versione classificare per i risultati della query


Quando sono presenti contenuti duplicati, i proprietari dei siti web possono subire ingenti perdite di traffico organico e un conseguente declassamento nella ricerca; tali “declassamenti” in termini di visite e posizionamento, derivano spesso da due problemi principali:

• Per fornire la migliore esperienza possibile all’utente, i motori di ricerca raramente mostrano più versioni dello stesso contenuto e quindi sono costretti a scegliere quale versione è probabilmente quella da preferire. Ciò diluisce la visibilità di ciascuno dei duplicati.
• Il link equity può essere ulteriormente diluito perché anche altri siti devono scegliere tra i duplicati. Poiché i collegamenti in entrata sono un fattore di classificazione, ciò può quindi influire sulla visibilità della ricerca di un contenuto.


Come si verificano problemi di contenuto duplicato?

Nella stragrande maggioranza dei casi, i proprietari di siti web non creano intenzionalmente contenuti duplicati. Ma ciò non significa che questo problema non abbia una rilevanza notevole. Secondo alcune stime, infatti, quasi il 29% dei siti web rappresenta un contenuto duplicato!

Sebbene possa sembrare strano, dunque, è possibile creare involontariamente dei contenuti duplicati; questo può avvenire in seguito a :

1. Variazioni di URL

I parametri URL, come il tracciamento dei clic e alcuni codici analitici, possono causare problemi di contenuti duplicati. Questo può essere un problema causato non solo dai parametri stessi, ma anche dall'ordine in cui tali parametri compaiono nell'URL.

Prendiamo ad esempio il seguente caso : www.colori.com/blu-camicia è un duplicato di www.colori .com/blu-camicia?cat=3&colore=blu .

Allo stesso modo, gli ID di sessione sono degli involontari generatori di contenuti duplicati. Ciò si verifica quando a ciascun utente che visita un sito web viene assegnato un ID sessione diverso memorizzato nell'URL.

Il consiglio, in questo caso, è quello di evitare di aggiungere parametri URL o versioni alternative di URL quando possibile.


2. Pagine HTTP vs. HTTPS o WWW vs. non WWW

Se un sito web ha versioni separate su "www.miosito.com" e "miosito.com" (ovvero con o senza il prefisso "www") ma ciascuna versione presenta lo stesso contenuto, ci troviamo davanti ad uno dei casi più comuni di contenuti duplicati.

Lo stesso vale per i siti che mantengono le versioni sui diversi protocolli http: // e https: //. Se entrambe le versioni di una pagina sono attive e visibili ai motori di ricerca, è possibile riscontrare un problema di contenuto duplicato.


3. Contenuto eliminato o copiato

Quando si parla di contenuti non ci si riferisce necessariamente a post di blog o contenuti editoriali, ma anche pagine di informazioni su determinati prodotti.

Coloro che ripubblicano i contenuti di un blog sui propri siti rappresentano senza dubbio la fonte più usuale di contenuti duplicati, ma un problema simile è presente anche nell’ambito delle piattaforme di e-commerce per quanto riguarda le schede prodotto.

Se molti e-commerce diversi vendono gli stessi articoli e, per evitare di perdere tempo, decidono di sfruttare le descrizioni dei prodotti così come vengono fornite dal produttore ufficiale, il risultato finale è quello di una marea di contenuti duplicati.


Come risolvere il problema dei contenuti duplicati

Risolvere i problemi relativi ai contenuti duplicati dipende tutto da un’unica idea di base : scremare i contenuti corretti da quelli ripetuti.

Ogni volta che il contenuto di un sito può essere rintracciato su più URL, si dovrebbe procedere con la “canonicalizzazione” per i motori di ricerca.

Esistono sostanzialmente 3 modi diversi di procedere, ovvero :

• Approntare un redirect 301 verso l’URL corretto
• Utilizzare l'attributo rel = canonical
• Utilizzo di meta tag noindex
• Utilizzare lo strumento di gestione dei parametri in Google Search Console


Attuare l’attuazione di reindirizzamenti 301 è forse il modo più efficace per combattere il fenomeno dei contenuti duplicati; per operare in tal senso, è necessario impostare un redirect dalla pagina "duplicata" alla pagina del contenuto originale.

Quando più pagine con il potenziale per classificarsi all’interno della ricerca di Google vengono combinate in un'unica pagina, non solo smettono di competere tra loro ma creano anche un segnale di maggiore rilevanza e popolarità.

Un'altra opzione per gestire i contenuti duplicati è quella che prevede l’utilizzo dell'attributo rel = canonical. Tale attributo segnale ai motori di ricerca che una determinata pagina dovrebbe essere trattata come se fosse una copia di un URL specifico e che tutti i collegamenti, le metriche del contenuto e il "potere di classificazione" che i motori di ricerca applicano a questa pagina dovrebbero effettivamente essere accreditati sulla specifica URL.

L'attributo rel = "canonical" fa parte dell'intestazione HTML di una pagina Web e si presenta nel seguente modo :

<head><link href = "URL DELLA PAGINA ORIGINALE" rel = "canonical" /></head>

L'attributo rel = canonical deve essere aggiunto all'intestazione HTML di ogni versione duplicata di una pagina, sostituendo la stringa "URL DELLA PAGINA ORIGINALE" riportata nell’esempio appena citato con un collegamento alla pagina originale o canonica.

L'attributo ottiene all'incirca lo stesso valore di link equity di un redirect 301 e, poiché è implementato a livello di pagina (anziché di server), spesso comporta tempi più brevi.

Tra i meta tags che possono rivelarsi particolarmente utili nella gestione dei contenuti duplicati troviamo i meta robot usati con i valori "noindex, follow". Questo meta tag può essere aggiunto all'intestazione HTML di ogni singola pagina che dovrebbe essere esclusa dall'indice di un motore di ricerca nel seguente modo :

<head> <meta name = "robots" content = "noindex, follow"></ head>

Questo meta tag consente ai motori di ricerca di eseguire la scansione dei collegamenti in una pagina ma impedisce loro di includere tali collegamenti nei loro indici.

È importante che la pagina duplicata possa ancora essere sottoposta a scansione, anche se si sta dicendo a Google di non indicizzarla, poiché il motore di ricerca mette esplicitamente in guardia contro la limitazione dell’accesso alla scansione di contenuti duplicati. Ai motori di ricerca piace, infatti, essere in grado di verificare la presenza di eventuali errori nel codice di una determinata pagina.

L'uso di meta robot è una soluzione particolarmente valida per problemi di contenuti duplicati relativi all'impaginazione.

Infine, Google Search Console consente di impostare il dominio preferito del proprio sito (ad esempio http://miosito.com anziché http://www.miosito.com) e di specificare se Googlebot deve eseguire la scansione di vari parametri URL in modo diverso.

A seconda della struttura dell'URL e della causa dei problemi relativi ai contenuti duplicati, sia l'impostazione del dominio preferito che la gestione dei parametri possono rappresentare una valide risoluzione.

Lo svantaggio principale dell'uso della gestione dei parametri come metodo principale per gestire i contenuti duplicati è che le modifiche apportate funzionano solo per Google. Eventuali regole stabilite utilizzando Google Search Console non influenzeranno il modo in cui Bing o altri motori di ricerca interpretano un determinato sito web; nel caso in cui si ritenga fondamentale il posizionamento all’interno di questi motori di ricerca, sarà opportuno utilizzare i relativi strumenti per webmaster per modificare le impostazioni dei parametri.


Suggerimenti utili per la gestione di contenuti duplicati

Per evitare il problema dei contenuti duplicati, una delle operazioni più importanti da mettere in atto è quella relativa alla verifica della coerenza tra i vari internal links di un sito web.

Nel caso in cui si determini che la versione canonica di un dominio è www.miosito.com/, tutti i collegamenti interni dovrebbero linkare a http: //www.miosito.com anziché a http://miositio.com .


Contenuti duplicati e penalizzazioni

Avere contenuti duplicati sul proprio sito può danneggiare le prestazioni a livello di SEO, ma non comporterà alcun tipo di penalizzazione ulteriore da parte di Google nel caso in cui tali contenuti non siano stati “rubati” intenzionalmente da altri siti web.

Nel caso in cui, invece, si siano copiate deliberatamente grandi quantità di contenuti presenti su altri siti, Google si dimostra decisamente meno accondiscendente; secondo quanto dichiarato dal Colosso della ricerca web, infatti, sebbene il contenuto duplicato su un sito non dia di per sé motivo di avviare una procedura di penalizzazione, la presenza di grossi quantitativi di contenuti copiati da uno o più portali porta ad una inevitabile ed accurata selezione da parte di Google del contenuto da indicizzare.


Come scovare contenuti duplicati all’interno del proprio sito web

Tramite l’utilizzo di uno strumento come SiteLiner, diventa relativamente facile trovare contenuti duplicati sul proprio sito web; la scansione in questione verifica la presenza di titoli di pagina, meta descriptions e H1 unici. Per eseguire l’analisi approfondita, è sufficiente recarsi sul sito ufficiale all’indirizzo siteliner.com e inserire la URL principale del sito web che si desidera analizzare.

Nel report conclusivo, saranno riportati dati e percentuali relativi ai contenuti duplicati e a quelli unici.

In alternativa, per un sito web più esteso è possibile utilizzare un servizio come Copyscape che “scansiona” i vari contenuti presenti sul web alla ricerca di più occorrenze dello stesso contenuto.


Contenuti duplicati e contenuti tradotti : ci sono dei rischi?

La grande domanda è : Google tratta i testi tradotti come contenuti duplicati?

Sebbene Google affermi che la presenza di contenuti tradotti in un’altra lingua non rappresenti in alcun modo un contenuto duplicato, è sempre consigliabile specificare le varie alternative linguistiche di un sito web utilizzando l'attributo hreflang.

Contatti


Piazza Buccari 30/a, 37141 Verona info@doweb.srl

DOWEB Numero Verde

La nostra web agency crea siti internet nelle province di Verona, Vicenza, Mantova, Brescia, Trento e province limitrofi.

Per visualizzare la mappa attiva i cookie di terze parti (clicca su cookie in basso a sinistra).

Richiedi informazioni

Inviaci un messaggio con la tua richiesta, rispondiamo entro un giorno.

Cookie