Migliorie al report errori 404 di Screaming Frog

TL;DR

  • Implementare modifice SEO su grande scale è impegnativo
  • È importante dare una priorità anche per la correzione degli errori 404
  • SEO e Data Science sono una miscela efficace

Molti clienti comprendono che la SEO è una maratona, non una gara. Altri si aspettano risultati in modo più rapido.

Questo non cambia che la SEO rimane una disciplina a cui sovene vengono allocati meno budget e risorse, e i SEOer spesso fanno affidamento su piccoli team, spesso fatti da una sola persona che ha bisogno di dimostrare efficacia e dimostrare ROI.

Guidare i cambiamenti, tuttavia, può essere impegnativo soprattutto quando c’è il rischio di fare danni o quando ci sono priorità contrastanti. Il più delle volte, i SEOer devono fornire giustificativi enormi per sforzi minimali; e questo non riguarda solo quando ad essere chiamato in causa è l’aspetto economico, ma anche quando vi sono elementi trasversali.

Chiedersi se i motori di ricerca si preoccuperanno di un particolare cambiamento è corretto, ma non è la sola questione da porsi. Almeno un altro paio di domande dovrebbero sorgere spontanee:

  • Quanti altri progetti saranno influenzati positivamente dalla modifica proposta?
  • Quale sarà l’impatto di lasciare un problema non risolto?

La correzione degli errori 404 è una priorità?

I motori di ricerca come Google non ti penalizzeranno se alcune URL sul sito rispondono con un errore 404.

Tuttavia, risolvere questi errori può essere utile. Se i tuoi errori sono dovuti a una URL errata o a una pagina cancellata con intento, uno sguardo agli errori 404 potrebbe portare alla tua attenzione circostanze impreviste che potresti voler affrontare in modo diverso. Ad esempio, la sostituzione dell’errore con un reindirizzament, che al contrario dell’errore 404 non suggerirà al motore la rimozione della pagina. Questo senza dimenticare l’esperienza utente, che non sarebbe certo ottimale.

Come posso determinare la priorità per correggere gli errori 404?

Il tempo a nostra disposizione è limitato, il che significa che non tutto può essere fatto (specialmente con una squadra di sviluppatori con una capacità limitata). La cosa “buona” di questi errori è l’improbabilità che tu debba parlare con uno sviluppatore. Molto più facile un dialogo con il team dei contenuti o con chiunque sia responsabile della gestione del CMS, magari tu stesso.

Indipendentemente da chi farà le modifiche, prima di scartare questa correzione, potrebbe essere necessario comprendere la portata delle opportunità aggregando numeri. Questi possono essere raccolti con diversi strumenti, dalla semplice Google Search Console, a un crawler online fino alla tua app desktop preferita.

Nel mio caso, che ti piaccia o no, utilzzo Screaming Frog da un pò di tempo, che si presta ad essere un ottimo strumento anche per delle audit SEO di larga scala (con le debite precauzioni).

Dan e il suo team migliorato molto lo strumento nel corso del tempo e hanno parlato nel loro blog di come utilizzare Screaming Frog per l’identificazione degli errori 404, che possono anche essere usato come una opportunità per la costruzione di link. Hanno persino pubblicato un video a dicembre 2019 (in inglese).

Tuttavia, come qualsiasi altro software, anche Screaming Frog è soggetto ad una cosa di sviluppo dettata da delle prorità aziendali. Questo a volte (spesso ??) comporta alcuni limiti che devono essere affrontati in modo diverso.

Due di loro, a mio avviso, sono:

  1. l’utilità delle informazioni esportate, che mancano di un foglio di sintesi, e
  2. la possibilità di creare sottoinsiemi di dati

Uno script Python per completare il report di errori di Screaming From

Eccoci al noccilo di questo articolo, la mia soluzione per prioritarizzare la correzione degli errori 404.

Negli ultimi mesi mi sono trovato sempre più coinvolto nella produzione di contenuti e nel supporto dei team per risolvere il problema di diversi link rotti e/o reindirizzamenti. Prima di poter iniziare una conversazione con questi team, ho avuto la necessità di creare dei sommari per consentire ai team di stimare la mole di lavoro richiesta. In breve, mi sono ritrovato a ripetere più e più volte le stesse azioni: scansione, esportazione in Excel, apertura del file, intersezione dei dati e produzione di un piccolo report per ottenere informazioni pronte per essere incollate in un’e-mail e un report finale più fruibile.

Il tempo è prezioso, quindi, e dato che le azioni di cui sopra dovevano essere ripetute ciclicamente e per diversi mercati, dopo un paio di rapporti manuali, ho finito per automatizzare le cose.

La soluzione proposta è un inizio di conversazione, solo la prima parte di ciò che ho fatto; qualcosa che sono fiducioso troverà un consenso positivo tra alcuni dei miei colleghi.

Cosa fa lo script Python?

Il codice - condiviso in un Notebook Jupyter - non è affatto complicato. Eppure è stato un modo interessante per rispolverare le mie capacità di programmazione, scoprendo nuove funzionalità del linguaggio Python come gli Walrus operators; un bell’esempio di come SEO e Data Science ora si completino a vicenda.

Con l’uso di Pandas, un pacchetto di Data Science, dopo aver caricato un foglio di calcolo Excel, filtro il rapporto All Inlink per gli errori 404 e 410 ed eseguo alcune query per produrre un output in puro testo. Niente di più, niente di meno.

Il sommario dell'errore 404 che mi mancava

Una volta capito quale potesse essere l’approccio migliore per segmentare i dati (in relazione alle mie esigenze), sono diventato più produttivo nell’estrarre informazioni e indicare ai team dove trovare i collegamenti interrotti e discutere sulla possibilità di ignorare alcuni di essi. Determinare la dimensione dei collegamenti interrotti è diventato sostanzialmente più efficiente.

Come proseguire oltre

La mia soluzione non è una opera prima e sono sicuro che abbia molti margini di miglioramento. Ma mi sono sentito fiducioso nel condividere il codice così che lo stesso potesse essere preso come uno spunto per la SEO quotidiana.

Se il team di Screaming Frog considererà questo mio articolo come un suggerimento da implementare è difficile dirlo. Ma questo non è stato il motivo principale per l’articolo è stato scritto, anche se spesso dare il buon esempio si rivela il modo più efficace per raggiungere gli obiettivi.