08 febbraio 2020
Errore 404, cos'è, come risolverlo e cosa comporta
Quante volte ci capita di digitare l'url di un sito internet e di vedere comparire sul nostro display un errore con cui veniamo avvisati che il contenuto ricercato non è al momento disponibile? Sicuramente molto spesso. Quello in cui incappiamo in questi casi è il cosiddetto errore 404. Possiamo trovarlo scritto in diverse maniere: errore 404, 404 not found, 404 pagina non trovata, HTTP 404 ma il concetto non cambia. Ma di cosa si tratta esattamente? Si tratta di un codice HTTP che i server web inviano al browser nel caso una pagina che si stia ricercando in rete non sia più disponibile e non produca, dunque, alcun risultato.
Ma a cosa è dovuto, in particolare, questo errore? Esso si può generare per diverse cause. Andiamo ad elencare, in breve, quelle che sono le situazioni in cui si verifica con maggiore frequenza:
L'errore 404 è riferito a contenuti che, come abbiamo detto, non sono disponibili in quel momento ma che, per definizione, potrebbero tornare ad esserlo prossimamente. Vale comunque la pena ricordare come esista un altro codice d'errore HTTP che ha il compito di indicare una pagina non trovata. Ci riferiamo all'errore 410 (o 410 Gone) che, però, ha una valenza ancor più marcata rispetto al 404. Se, infatti, quest'ultimo indica una pagina non disponibile che potrebbe tornare presto ad esserlo, il 410 caratterizza contenuti che non lo saranno mai più. Inutile dire, comunque, che si tratta pur sempre di un errore che si verifica davvero molto raramente.
In definitiva, perché compare l'errore 404 su un sito internet?
Come abbiamo visto, sono diverse le motivazioni che possono portare alla comparsa dell'errore 404 su una o più pagine del nostro sito web. Possiamo riassumerle in 4 casi:
Detto ciò, è lecito chiederci se l'errore 404 possa influire sul posizionamento SEO del nostro sito internet. La risposta è arrivata direttamente da Google nell'ormai lontano 2011. Big G chiarì, una volta per tutte, che gli errori 404 non influenzano il ranking delle pagine con status code 200 che ci indica che tutto è ok e sta funzionando correttamente (nonostante l'errore). Nonostante questa precisazione di Google, comunque, è meglio procedere alla correzione di questi errori utilizzando una redirezione. Ciò vale soprattutto in alcuni casi specie quando i contenuti ricercati non sono stati eliminati ma semplicemente spostati. Anche se troviamo un backlink con un HTTP 404 legato ad un errore di digitazione nell'URL da parte del webmaster è bene sostituirlo con un errore 301 in modo da non andare incontro a perdite di traffico, economicamente deleterie, soprattutto se il nostro sito è un e-commerce.
Quali pericoli si nascondono dietro l'errore 404?
Nonostante, come abbiamo detto, in molti pensino che la presenza di pagine con errore 404 nel proprio sito possa andare ad influenzare negativamente il ranking, quest'affermazione non è sempre corretta. Nel momento in cui la pagina non viene trovata, viene semplicemente cancellata dagli indici dal momento che non ha più carattere di utilità per gli utenti né risulta essere utile.
Come trovare e correggere gli errori 404
Trovare gli errori 404 all'interno del nostro sito internet non è un'operazione complicata. Possiamo avvalerci, infatti, di alcuni strumenti SEO per farla. Tra i migliori, al momento, ve ne sono tre: Google Search Console e Xenu. Vediamo come procedere per la ricerca dell'errore 404 con ognuno di essi.
- A seconda di quanti errori sono stati trovati nella scansione del nostro sito, viene creata una lista che li contiene tutti e che possiamo tranquillamente scaricare mediante la voce Download. Per conoscere i dettagli di ogni singolo errore, comunque, ci sarà sufficiente cliccare su ogni singolo risultato.
E se non valesse la pena correggere l'errore 404?
È importante sapere che non sempre vale la pena correggere gli errori 404. Ci sono alcuni casi in cui è meglio lasciar perdere. Ne possiamo indicare, in particolare, tre:
Contattaci per maggiori informazioni sull'errore 404
Alcuni consigli per risolvere un errore 404 e bypassarlo
Una volta che abbiamo scovato l'errore è indispensabile provvedere a risolverlo. Prima di procedere ad una diagnosi avanzata è importante seguire alcuni passaggi che potrebbero, già di per sé, risolvere in maniera molto rapida la problematica.
- Per prima cosa, andiamo ad effettuare l'aggiornamento della pagina. Per farlo forzando l'URL possiamo premere il tasto F5 sulla nostra tastiera. Nel caso in cui la pagina che stiamo cercando non venisse visualizzata in maniera corretta potremmo trovarci difronte ad un errore.
- Cancelliamo la cache e i cookie. Se siamo in grado di connetterci al nostro portale utilizzando altri dispositivi, come ad esempio uno smartphone, svuotare la cache e cancellare i cookie potrebbe risolvere l'errore in maniera semplice.
- Può sembrare banale ma, quando compaiono queste problematiche, occorre sempre verificare di aver digitato correttamente l'URL. Basta un carattere fuori posto per andare incontro al problema.
- Utilizziamo il nostro antivirus e procediamo con la rimozione di eventuali malware presenti nel nostro sistema. La totale protezione del computer è indispensabile per evitare la comparsa del 404 Not Found.
- Se riscontriamo un errore in un sito possiamo contattare il proprietario per informarlo. Se, invece, il sito è nostro possiamo contattare il nostro web host andando a chiedere a lui informazioni in merito alla risoluzione del problema.
Una cosa deve essere sempre chiara. Una pagina che presenta questo errore non è persa per sempre. Dedicandoti qualche minuto potrai visualizzarla comunque e, dunque, bypassare l'errore 404. Ti basterà effettuare l'accesso ad una delle vecchie versioni della pagina in questione che, invece, allo stato attuale genera un errore. Dovrai accedere, dunque, alla cosiddetta copia cache, una vera e propria copia delle pagine web generate automaticamente e ad intervalli regolari. Sono due gli strumenti principali di cui puoi avvalerti per bypassare gli errori 404: la cache di Google e Wayback Machine. Andiamo con ordine.
Cache di Google
La cache di Google è la soluzione più rapida e sicura per ottenere una copia della pagina che ci interessa. Se, infatti, le risorse sono ancora indicizzate su Google, è quasi certo che sia disponibile una copia inn cache. Prima di continuare, però, è doveroso fare una precisazione. Le pagine ricavate attraverso questi metodi non sono mai aggiornate (per ovvio motivi, dato che risalgono a tempi precedenti). Non è utile, dunque, ricorrere al bypassaggio dell'errore 404 se siamo alla ricerca di una notizia attuale per la qual cosa, invece, è meglio contattare il proprietario del sito e comunicargli il problema.
Wayback Machine
Wayback Machine è un sito specializzato nel conservare le copie cache dei vari siti internet presenti sul web. Una vera e propria risorsa se stiamo cercando una pagina oggetto di errore che ci permette di visualizzarla facendo un salto indietro nel tempo.
Gli errori Soft 404
Insieme agli errori 404 possiamo trovarci dinnanzi anche ai cosiddetti errori soft 404.
Si tratta di errori che si verificano quando i web servers restituiscono codici di risposta diversi da 404 o 410 nonostante le pagine ricercate siano effettivamente inesistenti.
Questi, differentemente al classico 404, restituisce al browser un codice di risposta 200, ovvero OK. Questo succede quando i server gestiscono indirizzi internet che non funzionano in maniera corretta per cui l'utente che ne ha fatto richiesta viene reindirizzato ad una pagina che, invece, è valida come può essere, ad esempio, una Home Page o una pagina 404 personalizzata che è sempre consigliabile impostare. Differentemente da quanto accade per i 404, ogni pagina che risponde con un soft 404 rappresenta dei problemi per gli spider di Google che potrebbero richiedere parecchio tempo per scansionarli e che andrebbero ad indicizzarle benché si tratti di contenuti che non ha senso indicizzare. Potremmo trovarci difronte ad un tempo perso inutilmente e che potrebbe, invece, essere dedicato a pagine più importanti.
Come procedere alla gestione e all'ottimizzazione delle pagine con errore 404 soft? Occorre innanzitutto che verifichiamo la natura di ciascuna pagina. Se queste non sono disponibili e non siamo in possesso di una pagina che faccia da sostituzione è meglio procedere in modo che le pagine in questione restituiscano, invece di un errore soft, un 400 o un 410. Qualora, invece, si tratti di pagine che abbiamo semplicemente spostato è bene procedere ad un reindirizzamento 301 in modo che gli utenti atterrino nelle destinazioni pertinenti alla loro ricerca.
L'importanza della creazione di una pagina di errore 404
Attualmente sono diversi i CMS che permettono di generare, in maniera del tutto automatica, una pagina di errore 404 nel momento stesso in cui una pagina, all'interno del nostro sito internet, non venga trovata. Quelle previste, in questo caso, sono però pagine standardizzate che, però, è sempre consigliabile personalizzare utilizzando le estensioni previste dai vari CMS. Se questa possibilità non è contemplata occorre creare da zero la pagina di errore 404. Tranquilli! Non è complicato e basteranno pochi passaggi per ottenere un buon risultato.
Andiamo a creare la pagina di errore all'interno della root ed apriamo il file .htaccess nella root. Inseriamo al suo interno un collegamento a "ErrorDocument 404/404.html" e salviamo le modifiche. Utilizzando questo codice si otterrà la generazione della pagina di errore.
Possiamo, a questo punto, verificare di aver fatto correttamente il lavoro aprendo una pagina qualunque che siamo certi non esistere all'interno del nostro sito. Nel momento in cui comparirà la pagina di errore 404 appena creata saremo certi di averla correttamente impostata.
Contattaci per maggiori informazioni sulla gestione dell'errore 404
Ma a cosa è dovuto, in particolare, questo errore? Esso si può generare per diverse cause. Andiamo ad elencare, in breve, quelle che sono le situazioni in cui si verifica con maggiore frequenza:
- l'URL che stiamo ricercando (e qualunque contenuto che vi si trovava all'interno) è stato eliminato o spostato senza un aggiornamento ai link interni del sito in questione;
- ci siamo distratti e abbiamo sbagliato a scrivere l'URL del sito che stiamo ricercando;
- il server che si occupa di quel sito non sta funzionando in quel determinato momento;
- la connessione al server ha subìto un'interruzione;
- il nome di dominio oggetto della nostra ricerca non si può convertire in un IP all'interno del Domanin Name System;
- il nome del dominio che abbiamo cercato non esiste più.
L'errore 404 è riferito a contenuti che, come abbiamo detto, non sono disponibili in quel momento ma che, per definizione, potrebbero tornare ad esserlo prossimamente. Vale comunque la pena ricordare come esista un altro codice d'errore HTTP che ha il compito di indicare una pagina non trovata. Ci riferiamo all'errore 410 (o 410 Gone) che, però, ha una valenza ancor più marcata rispetto al 404. Se, infatti, quest'ultimo indica una pagina non disponibile che potrebbe tornare presto ad esserlo, il 410 caratterizza contenuti che non lo saranno mai più. Inutile dire, comunque, che si tratta pur sempre di un errore che si verifica davvero molto raramente.
In definitiva, perché compare l'errore 404 su un sito internet?
Come abbiamo visto, sono diverse le motivazioni che possono portare alla comparsa dell'errore 404 su una o più pagine del nostro sito web. Possiamo riassumerle in 4 casi:
- la pagina che si sta ricercando è stata eliminata dal sito;
- abbiamo digitato l'indirizzo in maniera sbagliata. Occorre, dunque, controllare l'esattezza dell'URL;
- la pagina ha subìto uno spostamento e non vi è stato alcun redirect;
- il server non funziona correttamente.
Detto ciò, è lecito chiederci se l'errore 404 possa influire sul posizionamento SEO del nostro sito internet. La risposta è arrivata direttamente da Google nell'ormai lontano 2011. Big G chiarì, una volta per tutte, che gli errori 404 non influenzano il ranking delle pagine con status code 200 che ci indica che tutto è ok e sta funzionando correttamente (nonostante l'errore). Nonostante questa precisazione di Google, comunque, è meglio procedere alla correzione di questi errori utilizzando una redirezione. Ciò vale soprattutto in alcuni casi specie quando i contenuti ricercati non sono stati eliminati ma semplicemente spostati. Anche se troviamo un backlink con un HTTP 404 legato ad un errore di digitazione nell'URL da parte del webmaster è bene sostituirlo con un errore 301 in modo da non andare incontro a perdite di traffico, economicamente deleterie, soprattutto se il nostro sito è un e-commerce.
Quali pericoli si nascondono dietro l'errore 404?
Nonostante, come abbiamo detto, in molti pensino che la presenza di pagine con errore 404 nel proprio sito possa andare ad influenzare negativamente il ranking, quest'affermazione non è sempre corretta. Nel momento in cui la pagina non viene trovata, viene semplicemente cancellata dagli indici dal momento che non ha più carattere di utilità per gli utenti né risulta essere utile.
Come trovare e correggere gli errori 404
Trovare gli errori 404 all'interno del nostro sito internet non è un'operazione complicata. Possiamo avvalerci, infatti, di alcuni strumenti SEO per farla. Tra i migliori, al momento, ve ne sono tre: Google Search Console e Xenu. Vediamo come procedere per la ricerca dell'errore 404 con ognuno di essi.
- Google Search Console, scovare gli errori 404
Se il nostro sito risulta verificato con Google Search Console possiamo utilizzare questo strumento per trovare qualunque errore 404 al suo interno. Per farlo
- accediamo al pannello di controllo e dalla voce "Salute" andiamo a selezionare "Errori di scansione". Verranno visualizzati gli errori presenti nel nostro sito. Ogni errore 404, in particolare, verrà mostrato in corrispondenza della voce "Non trovato".
- accediamo al pannello di controllo e dalla voce "Salute" andiamo a selezionare "Errori di scansione". Verranno visualizzati gli errori presenti nel nostro sito. Ogni errore 404, in particolare, verrà mostrato in corrispondenza della voce "Non trovato".
- A seconda di quanti errori sono stati trovati nella scansione del nostro sito, viene creata una lista che li contiene tutti e che possiamo tranquillamente scaricare mediante la voce Download. Per conoscere i dettagli di ogni singolo errore, comunque, ci sarà sufficiente cliccare su ogni singolo risultato.
- Una volta proceduto con le correzioni che è bene effettuare una di seguito all'altra (in modo che non ci sfugga proprio nulla) possiamo comunicare a Google Search Console che abbiamo effettuato la correzione mediante "Segna come corretto".
- Xenu, come scovare l'errore 404
Xenu è tra i software gratuiti migliori per scovare eventuali errori 404 nel nostro sito internet. L'utilizzo risulta, tra l'altro, molto semplice. Naturalmente prima di poterlo utilizzare, è necessario scaricarlo dal web ed installarlo sul nostro personal computer.
- Apriamo, quindi, il software e clicchiamo su "File". Da qui, poi, andremo a selezionare la voce "Check URL". A questo punto, inseriamo l'URL su cui intendiamo effettuare la scansione. Non dimentichiamoci di iniziare l'indirizzo con http:// e di chiuderlo con /. Qualora lo volessimo, possiamo anche scansionare i link esterni al sito internet selezionando semplicemente la voce "Check External Links".
- Apriamo, quindi, il software e clicchiamo su "File". Da qui, poi, andremo a selezionare la voce "Check URL". A questo punto, inseriamo l'URL su cui intendiamo effettuare la scansione. Non dimentichiamoci di iniziare l'indirizzo con http:// e di chiuderlo con /. Qualora lo volessimo, possiamo anche scansionare i link esterni al sito internet selezionando semplicemente la voce "Check External Links".
- All'interno della voce View potremo visualizzare l'elenco degli errori 404. Non ci rimane che individuare le pagine che li contengono. Per farlo, basta cliccare su un risultato rosso (appunto l'errore) con il tasto destro del mouse e scegliere "URL Properties". Nel riquadro più basso della finestra che si aprirà un elenco contenente tutte le pagine che restituiscono un errore 404.
E se non valesse la pena correggere l'errore 404?
È importante sapere che non sempre vale la pena correggere gli errori 404. Ci sono alcuni casi in cui è meglio lasciar perdere. Ne possiamo indicare, in particolare, tre:
- quando ci troviamo difronte a pagine eliminate per cui non sono disponibili pagine sostitutive o equivalenti. In questo caso conviene lasciare la pagina in errore ed eliminare gli eventuali link interni che puntano verso questa. In questo modo, con il passare del tempo, le pagine in questione verranno eliminate anche dai risultati di ricerca di Google e, in generale, dei motori di ricerca;
- quando ci troviamo difronte a pagine che non sono mai esistite;
- qualora non riconoscessimo un indirizzo sul nostro sito internet.
Contattaci per maggiori informazioni sull'errore 404
Alcuni consigli per risolvere un errore 404 e bypassarlo
Una volta che abbiamo scovato l'errore è indispensabile provvedere a risolverlo. Prima di procedere ad una diagnosi avanzata è importante seguire alcuni passaggi che potrebbero, già di per sé, risolvere in maniera molto rapida la problematica.
- Per prima cosa, andiamo ad effettuare l'aggiornamento della pagina. Per farlo forzando l'URL possiamo premere il tasto F5 sulla nostra tastiera. Nel caso in cui la pagina che stiamo cercando non venisse visualizzata in maniera corretta potremmo trovarci difronte ad un errore.
- Cancelliamo la cache e i cookie. Se siamo in grado di connetterci al nostro portale utilizzando altri dispositivi, come ad esempio uno smartphone, svuotare la cache e cancellare i cookie potrebbe risolvere l'errore in maniera semplice.
- Può sembrare banale ma, quando compaiono queste problematiche, occorre sempre verificare di aver digitato correttamente l'URL. Basta un carattere fuori posto per andare incontro al problema.
- Utilizziamo il nostro antivirus e procediamo con la rimozione di eventuali malware presenti nel nostro sistema. La totale protezione del computer è indispensabile per evitare la comparsa del 404 Not Found.
- Se riscontriamo un errore in un sito possiamo contattare il proprietario per informarlo. Se, invece, il sito è nostro possiamo contattare il nostro web host andando a chiedere a lui informazioni in merito alla risoluzione del problema.
Una cosa deve essere sempre chiara. Una pagina che presenta questo errore non è persa per sempre. Dedicandoti qualche minuto potrai visualizzarla comunque e, dunque, bypassare l'errore 404. Ti basterà effettuare l'accesso ad una delle vecchie versioni della pagina in questione che, invece, allo stato attuale genera un errore. Dovrai accedere, dunque, alla cosiddetta copia cache, una vera e propria copia delle pagine web generate automaticamente e ad intervalli regolari. Sono due gli strumenti principali di cui puoi avvalerti per bypassare gli errori 404: la cache di Google e Wayback Machine. Andiamo con ordine.
Cache di Google
La cache di Google è la soluzione più rapida e sicura per ottenere una copia della pagina che ci interessa. Se, infatti, le risorse sono ancora indicizzate su Google, è quasi certo che sia disponibile una copia inn cache. Prima di continuare, però, è doveroso fare una precisazione. Le pagine ricavate attraverso questi metodi non sono mai aggiornate (per ovvio motivi, dato che risalgono a tempi precedenti). Non è utile, dunque, ricorrere al bypassaggio dell'errore 404 se siamo alla ricerca di una notizia attuale per la qual cosa, invece, è meglio contattare il proprietario del sito e comunicargli il problema.
- A questo punto, iniziamo ad accedere alla cache di Google.
- Digitiamo l'indirizzo internet della pagina che stiamo ricercando e clicchiamo su Invia per dare il via alla ricerca.
- Osserviamo la SERP e individuiamo il risultato che mostra maggiore pertinenza con quanto stiamo ricercando. Vicino all'URL dovremmo trovare una freccia che punta verso il basso. Attenzione perché non tutti i risultati saranno "accompagnati" da questa freccetta. Clicchiamo sulla freccia in questione e selezioniamo la voce Copia Cache. Se è stata salvata una copia ci verrà mostrata praticamente subito e ci troveremo, dunque, alla pagina che stavamo cercando.
Wayback Machine
Wayback Machine è un sito specializzato nel conservare le copie cache dei vari siti internet presenti sul web. Una vera e propria risorsa se stiamo cercando una pagina oggetto di errore che ci permette di visualizzarla facendo un salto indietro nel tempo.
- Accediamo alla pagina principale del sito Wayback Machine.
- Andiamo ad incollare nell'apposita sezione l'URL della pagina ricercata. Clicchiamo su Invio per dare il via all'operazione di recupero. Ci verrà mostrata una sorta di pagina temporale in cui potremo selezionare anche l'anno che più ci interessa visualizzare (sempre in merito a quella data pagina). Specificando, poi, mese e giorno potremmo trovarci dinnanzi alla soluzione.
Gli errori Soft 404
Insieme agli errori 404 possiamo trovarci dinnanzi anche ai cosiddetti errori soft 404.
Si tratta di errori che si verificano quando i web servers restituiscono codici di risposta diversi da 404 o 410 nonostante le pagine ricercate siano effettivamente inesistenti.
Questi, differentemente al classico 404, restituisce al browser un codice di risposta 200, ovvero OK. Questo succede quando i server gestiscono indirizzi internet che non funzionano in maniera corretta per cui l'utente che ne ha fatto richiesta viene reindirizzato ad una pagina che, invece, è valida come può essere, ad esempio, una Home Page o una pagina 404 personalizzata che è sempre consigliabile impostare. Differentemente da quanto accade per i 404, ogni pagina che risponde con un soft 404 rappresenta dei problemi per gli spider di Google che potrebbero richiedere parecchio tempo per scansionarli e che andrebbero ad indicizzarle benché si tratti di contenuti che non ha senso indicizzare. Potremmo trovarci difronte ad un tempo perso inutilmente e che potrebbe, invece, essere dedicato a pagine più importanti.
Come procedere alla gestione e all'ottimizzazione delle pagine con errore 404 soft? Occorre innanzitutto che verifichiamo la natura di ciascuna pagina. Se queste non sono disponibili e non siamo in possesso di una pagina che faccia da sostituzione è meglio procedere in modo che le pagine in questione restituiscano, invece di un errore soft, un 400 o un 410. Qualora, invece, si tratti di pagine che abbiamo semplicemente spostato è bene procedere ad un reindirizzamento 301 in modo che gli utenti atterrino nelle destinazioni pertinenti alla loro ricerca.
L'importanza della creazione di una pagina di errore 404
Attualmente sono diversi i CMS che permettono di generare, in maniera del tutto automatica, una pagina di errore 404 nel momento stesso in cui una pagina, all'interno del nostro sito internet, non venga trovata. Quelle previste, in questo caso, sono però pagine standardizzate che, però, è sempre consigliabile personalizzare utilizzando le estensioni previste dai vari CMS. Se questa possibilità non è contemplata occorre creare da zero la pagina di errore 404. Tranquilli! Non è complicato e basteranno pochi passaggi per ottenere un buon risultato.
Andiamo a creare la pagina di errore all'interno della root ed apriamo il file .htaccess nella root. Inseriamo al suo interno un collegamento a "ErrorDocument 404/404.html" e salviamo le modifiche. Utilizzando questo codice si otterrà la generazione della pagina di errore.
Possiamo, a questo punto, verificare di aver fatto correttamente il lavoro aprendo una pagina qualunque che siamo certi non esistere all'interno del nostro sito. Nel momento in cui comparirà la pagina di errore 404 appena creata saremo certi di averla correttamente impostata.
Contattaci per maggiori informazioni sulla gestione dell'errore 404