14 ottobre 2023
Log File: cosa sono e come usarli per migliorare il posizionamento SEO
Sapevi che qualsiasi attività svolgi avvalendoti di un sistema informatico viene registrata? Esatto, qualsiasi movimento che sia l’apertura di un file, l’esecuzione di un software, l’attivazione di un servizio, viene annotata e considerata come “evento”. Questo è vero per il mondo offline, ma soprattutto per l’online e quindi per i siti web: ogni operazione viene segnata dal web server in appositi file, chiamati “log file” o “file di log”. In questo articolo, approfondiremo tutte le caratteristiche di questi “registri digitali” per ciò che concerne l’attività web, come utilizzarli ed analizzarli e perché sono importanti in ottica posizionamento SEO.
File di Log: come funzionano e quali informazioni contengono
Ogni qualvolta utenti e bot inviano una richiesta al nostro sito, il server web la registra su appositi file, i file di log. Questi si caratterizzano per una struttura a righe, dove su ogni riga viene riportato un evento specifico che si è manifestato, come la richiesta di una risorsa sul sito. L’evento, a sua volta, viene scritto sotto forma di campi, che solitamente sono:
I log file sono conservati solo per un certo intervallo di tempo sul Server Web del sito. Dove si trovano? Come aprire questi file e leggerli?
Log files, dove si trovano e come leggerli
Ora che abbiamo visto quali informazioni contengono i log files, scopriamo dove sono salvati, come aprirli e leggerli. L’accesso a questi file dipende dalla soluzione di hosting adottata: ogni web server, infatti, prevede determinate opzioni per configurare i file di log. In alcuni casi se non hai i diritti di amministratore del server potrebbero non essere immediatamente visibili oppure mostrarsi incompleti.
In linea di default, i file di log dovrebbero trovarsi in queste cartelle:
In primis devi connetterti al tuo spazio web sfruttando un programma FTP come FileZilla. Una volta che hai scaricato questi file, è il momento di aprirli e di leggerli. Esistono diversi software che ti consentono di aprire, leggere e analizzare i file log, ma puoi utilizzare anche il comunissimo Excel, per poi organizzare le informazioni secondo le specifiche esigenze. L’alternativa più professionale e completa per leggere e analizzare file Log è Screaming Frog, un tool fondamentale per ottimizzare il proprio sito web e migliorare il posizionamento SEO. Sapevi che i file log sono elementi utilissimi da cui prendere spunto per scalare posizioni su Google? Prosegui la lettura per scoprire come analizzare questi file e quali sono i dati importanti in ottica SEO.
Analisi file di log: perché è importante per la SEO
Come detto, i log files consentono al webmaster di individuare i “movimenti” di visitatori umani e bot sul proprio sito. L’analisi di questi file permette quindi di identificare l’origine dei problemi del sito web e di ottimizzare le prestazioni. Ad esempio, analizzando i file di log si può verificare se ci sono bug software, e si può notare se il sito è troppo lento, se le pagine sono troppo grandi ecc, migliorando la user experience.
Non solo, chi si occupa di posizionamento SEO, sa benissimo che l’analisi dei log files è un’attività indispensabile per ottenere risultati di alto livello. Lo studio di questi file, infatti, ti permette di avere una visione generale di tutti quegli aspetti SEO lato tecnico che Google considera fondamentali e che puoi (e devi) migliorare. Ma quali sono i dati più importanti che possiamo rilevare dall’analisi? Questi i principali, prova a individuarli nel tuo file di log!
File Log e sicurezza del sito: proteggi i tuoi dati!
I file log sono elementi che trovano una funzione molto importante anche per la sicurezza e la protezione del sito contro gli attacchi hacker. L’analisi di questi file, infatti, ti permette di risalire alla vulnerabilità sfruttata (oppure il tentativo di sfruttarla) per violare il tuo sito web.
Sebbene nella maggior parte dei casi la lettura approfondita degli eventi presenti nel file non consenta di individuare l’aggressore, identificare il “punto esatto” in cui è avvenuto l’attacco e i movimenti che l’hacker ha realizzato e portato a termine, ci permette di correre ai ripari in maniera più mirata.
Ad esempio, puoi avere visibilità di eventuali cambi password d’accesso FTP e account utente dei CMS, ma anche indentificare se è stato cambiato parte del codice di sviluppo e se è stato inserito codice dannoso. Insomma, puoi monitorare tutte le attività svolte in un lasso temporale e scovare anomalie sospette ed eventuali minacce malware. Abbiamo detto che attraverso la lettura e l’analisi dei file log puoi individuare quali utenti e quali bot hanno visitato il tuo sito: ecco che se un bot malevolo dovesse attaccare il tuo sito puoi averne subito traccia.
Ad ogni modo, nel caso di un attacco, avere una copia di backup del sito potrebbe veramente salvarti, sia se decidi di verificare manualmente quale parte di codice è stata inserita a tua insaputa, confrontando stato attuale e copia di backup, sia se decidi di “ripartire” direttamente dalla tua copia, ripristinando completamente il sito dopo l’attacco.
In conclusione, sia che tu abbia il sospetto di una violazione, che tu abbia la certezza, i file di log possono darti una mano per capire cosa sia successo sul tuo server web e trovare quella vulnerabilità che sta mettendo tutto il tuo lavoro a repentaglio.
File Log e GPDR: il regolamento
Sapevi che i file di log sono elementi necessari anche in ottica privacy? Sì, perché per ottemperare alla normativa a tutela dei dati personali, il possesso di questi file consente di ricostruire l’attività di un sistema informatico, in questo caso il sito, e individuare eventuali responsabilità.
Secondo il principio di accountability, infatti, vige l’obbligo per il titolare del trattamento di dimostrare il rispetto della normativa, stabilendo in autonomia le modalità e gli strumenti. Ecco che i file di log, quindi, diventano indispensabili per tenere traccia delle operazioni svolte sui e attraverso i dati.
Il problema è che spesso le aziende trascurano i file di log sia per quanto riguarda la sicurezza informatica che per quanto riguarda la compliancy GDPR, agendo solo quando l’attacco hacker si è verificato e non conoscendo la possibilità di dimostrare con questi file la messa in pratica di tutte le azioni nel rispetto del GDPR.
Un’azienda, invece, dovrebbe registrare file di log e conservarli in totale sicurezza (avvalendosi anche di strumenti di backup) non solo perché può fare la differenza nell’essere a norma con il GDPR, ma anche per avere una panoramica completa, strutturata e puntuale di tutto ciò che accade sul proprio sito e non solo.
Miglioriamo il posizionamento del tuo sito: richiedi maggiori informazioni!
File di Log: come funzionano e quali informazioni contengono
Ogni qualvolta utenti e bot inviano una richiesta al nostro sito, il server web la registra su appositi file, i file di log. Questi si caratterizzano per una struttura a righe, dove su ogni riga viene riportato un evento specifico che si è manifestato, come la richiesta di una risorsa sul sito. L’evento, a sua volta, viene scritto sotto forma di campi, che solitamente sono:
- timestamp – la data e l’ora in cui è stato registrato l’evento;
- pagina Web a cui si accede, l’URL richiesto;
- IP del client (solo in alcuni casi l’IP del server);
- access request – fa riferimento alla risorsa richiesta al server;
- codice di stato HTTP – la risposta del server alla richiesta del browser (esito negativo o positivo);
- user agent, ossia informazioni supplementari relative al client che ha inviato la richiesta, come il browser e il dispositivo usato (desktop o mobile).
I log file sono conservati solo per un certo intervallo di tempo sul Server Web del sito. Dove si trovano? Come aprire questi file e leggerli?
Log files, dove si trovano e come leggerli
Ora che abbiamo visto quali informazioni contengono i log files, scopriamo dove sono salvati, come aprirli e leggerli. L’accesso a questi file dipende dalla soluzione di hosting adottata: ogni web server, infatti, prevede determinate opzioni per configurare i file di log. In alcuni casi se non hai i diritti di amministratore del server potrebbero non essere immediatamente visibili oppure mostrarsi incompleti.
In linea di default, i file di log dovrebbero trovarsi in queste cartelle:
- Apache: /var/log/apache2/access.log
- Nginx: /var/log/nginx/access.log.
- Microsoft IIS: C:\Windows\System32\LogFiles.
In primis devi connetterti al tuo spazio web sfruttando un programma FTP come FileZilla. Una volta che hai scaricato questi file, è il momento di aprirli e di leggerli. Esistono diversi software che ti consentono di aprire, leggere e analizzare i file log, ma puoi utilizzare anche il comunissimo Excel, per poi organizzare le informazioni secondo le specifiche esigenze. L’alternativa più professionale e completa per leggere e analizzare file Log è Screaming Frog, un tool fondamentale per ottimizzare il proprio sito web e migliorare il posizionamento SEO. Sapevi che i file log sono elementi utilissimi da cui prendere spunto per scalare posizioni su Google? Prosegui la lettura per scoprire come analizzare questi file e quali sono i dati importanti in ottica SEO.
Analisi file di log: perché è importante per la SEO
Come detto, i log files consentono al webmaster di individuare i “movimenti” di visitatori umani e bot sul proprio sito. L’analisi di questi file permette quindi di identificare l’origine dei problemi del sito web e di ottimizzare le prestazioni. Ad esempio, analizzando i file di log si può verificare se ci sono bug software, e si può notare se il sito è troppo lento, se le pagine sono troppo grandi ecc, migliorando la user experience.
Non solo, chi si occupa di posizionamento SEO, sa benissimo che l’analisi dei log files è un’attività indispensabile per ottenere risultati di alto livello. Lo studio di questi file, infatti, ti permette di avere una visione generale di tutti quegli aspetti SEO lato tecnico che Google considera fondamentali e che puoi (e devi) migliorare. Ma quali sono i dati più importanti che possiamo rilevare dall’analisi? Questi i principali, prova a individuarli nel tuo file di log!
- Frequenza di scan di Google Bot: ogni quanto tempo Google esegue la scansione del tuo sito?
- Pagine più scansionate: quali sono le pagine che Google ritiene di maggior importanza?
- Velocità di caricamento del tuo sito secondo Google: verifica quali pagine si caricano in un tempo eccessivamente lungo.
- Codici di stato per ogni pagina: controlla il codice di stato restituito, come gli errori 404.
- URL scansionati inutilmente: identifica quali URL dovresti mettere no-index.
- Catene di redirect: monitora i reindirizzamenti e scopri subito eventuali loop.
- Indicizzazione mobile-first: verifica il passaggio all’indicizzazione con priorità ai contenuti per dispositivi mobili;
- Errori nella gerarchia e struttura dei collegamenti interni: analizza l’architettura del sito e ricordati che i link interni facilitano la scansione e quindi l’indicizzazione di una pagina.
- Aumenti o cali improvvisi di scan: cerca di capire perché Google scansiona (improvvisamente) troppo spesso o poco spesso il tuo sito.
- Ultima indicizzazione: hai pubblicato qualcosa di interessante? Scopri se Big G l’ha già indicizzato.
File Log e sicurezza del sito: proteggi i tuoi dati!
I file log sono elementi che trovano una funzione molto importante anche per la sicurezza e la protezione del sito contro gli attacchi hacker. L’analisi di questi file, infatti, ti permette di risalire alla vulnerabilità sfruttata (oppure il tentativo di sfruttarla) per violare il tuo sito web.
Sebbene nella maggior parte dei casi la lettura approfondita degli eventi presenti nel file non consenta di individuare l’aggressore, identificare il “punto esatto” in cui è avvenuto l’attacco e i movimenti che l’hacker ha realizzato e portato a termine, ci permette di correre ai ripari in maniera più mirata.
Ad esempio, puoi avere visibilità di eventuali cambi password d’accesso FTP e account utente dei CMS, ma anche indentificare se è stato cambiato parte del codice di sviluppo e se è stato inserito codice dannoso. Insomma, puoi monitorare tutte le attività svolte in un lasso temporale e scovare anomalie sospette ed eventuali minacce malware. Abbiamo detto che attraverso la lettura e l’analisi dei file log puoi individuare quali utenti e quali bot hanno visitato il tuo sito: ecco che se un bot malevolo dovesse attaccare il tuo sito puoi averne subito traccia.
Ad ogni modo, nel caso di un attacco, avere una copia di backup del sito potrebbe veramente salvarti, sia se decidi di verificare manualmente quale parte di codice è stata inserita a tua insaputa, confrontando stato attuale e copia di backup, sia se decidi di “ripartire” direttamente dalla tua copia, ripristinando completamente il sito dopo l’attacco.
In conclusione, sia che tu abbia il sospetto di una violazione, che tu abbia la certezza, i file di log possono darti una mano per capire cosa sia successo sul tuo server web e trovare quella vulnerabilità che sta mettendo tutto il tuo lavoro a repentaglio.
File Log e GPDR: il regolamento
Sapevi che i file di log sono elementi necessari anche in ottica privacy? Sì, perché per ottemperare alla normativa a tutela dei dati personali, il possesso di questi file consente di ricostruire l’attività di un sistema informatico, in questo caso il sito, e individuare eventuali responsabilità.
Secondo il principio di accountability, infatti, vige l’obbligo per il titolare del trattamento di dimostrare il rispetto della normativa, stabilendo in autonomia le modalità e gli strumenti. Ecco che i file di log, quindi, diventano indispensabili per tenere traccia delle operazioni svolte sui e attraverso i dati.
Il problema è che spesso le aziende trascurano i file di log sia per quanto riguarda la sicurezza informatica che per quanto riguarda la compliancy GDPR, agendo solo quando l’attacco hacker si è verificato e non conoscendo la possibilità di dimostrare con questi file la messa in pratica di tutte le azioni nel rispetto del GDPR.
Un’azienda, invece, dovrebbe registrare file di log e conservarli in totale sicurezza (avvalendosi anche di strumenti di backup) non solo perché può fare la differenza nell’essere a norma con il GDPR, ma anche per avere una panoramica completa, strutturata e puntuale di tutto ciò che accade sul proprio sito e non solo.
Miglioriamo il posizionamento del tuo sito: richiedi maggiori informazioni!