Se lavori con i siti web a livello professionale forse avrai sentito parlare più di una volta del file Sitemap.xml e della loro importanza per poter fornire in un’unica comoda risorsa tutte (entro certi limiti) le pagine che un sito web dispone.
Se vuoi imparare come si scrive un file sitemap, puoi dare un occhio al sito ”ufficiale”, sebbene oggi quasi nessuno è così coriaceo da prendere tutte le pagine del sito e scriverle a mano una dopo l’altra; piuttosto si cercano le facili vie attraverso tools online e script appicciati dietro pluri-testati sistemi di blogging come WordPress e compagni.
Questo non significa tuttavia dover ignorare alcuni semplici regole sebbene queste vengano riportate come facoltative. In particolare mi sto riferendo agli attributi ChangeFreq e Priority.
Come lo stesso sito indica, i due parametri laddove inseriti, vengono presi come una indicazione piuttosto che come una direttiva. Esattamente quello che succede con il tag canonical. Tuttavia esperienza mi insegna che se qualcosa non è citato o detto ufficialmente, non vuol dire che non esista, e in soli 8 anni che mi occupo di questo settore qualche fenomeno strano e contro tendenda l’ho notato anceh io. Tra questi anche quello della sitemap e dei suoi parametri facoltativi.
L’attributo ChangeFreq
Questo parametro permette di indicare con che frequenza le pagine dovrebbero essere scansionate. I valori disponibili sono “never”, “yearly”, “monthly”, “weekly”, “daily”, “hourly”, or “always”, ma il sito non accenna certo ad un possibile utilizzo, cosa che voglio azzardare a fare io:
- always: come dice la parola stessa, sempre. Generalmente questo valore si sposa con la home page di un sito che è quella quasi sempre sotto costante aggiornamento, piuttosto che con tutte quelle pagine che contengono informazioni il cui cambiamento risulta essere repentino.
- hourly: una volta all’ora. Mi viene da pensare a delle informazioni di natura commerciale distribuite a carattere ridotto, come ad esempio siti come Yahoo! Finanza che aggiorna le quotazioni di cambio.
- daily: una volta al giorno. Questa ben si sposa con le pagine che contengono gli indici dei blog o con gli aggregatori (a seconda della frequenza di aggiornamento), o per esempio lo stato di avanzamento di una riparazione, nel caso di un customer service.
- weekly: aggiornamenti più latenti, utili ad esempio per le schede prodotto o per quelle pagine che parlano di eventi in cui gli utenti contribuiscono saltuariamente alla loro organizzazione.
- monthly: aggiornamenti occasionali. Le FAQ sono il classico esempio, piuttosto che manuali di istruzione in prima stesura
- yearly: quasi mai aggiornato, ovvero quelle pagine istituzionali come chi siamo e dove siamo. A meno che non cambiate sede una volta al giorno, questo è il caso tipico.
- never: aggiornamenti zero. Questo può essere l’ultimo stadio per contenuti vecchi, pubblicati ancora sul sito, quindi che hanno un valore in termini di visibilità e links, ma che non necessitano di essere ispezionati una volta al giorno.
Nella stragrande maggioranza dei casi, per un sito di piccole - medie dimensioni, i tag da utilizzare dovrebbero essere weekly, monthly, yearly e never, ma è palese che ognuno deve trovarsi il caso più adatto alle proprie esigenze.
L’attributo Priority
Anche questo parametro è facoltativo e permette di attribuire un peso alla pagina specificata con un valore che oscilla tra lo 0.0 e 1.0. Questo valore non influisce sul modo in cui le tue pagine vengono considerate dallo spider, ma ti consente di indicare ai motori di ricerca le pagine che reputi più importanti. Il suo valore predefinito è 0.5.
Nella mia modesta esperienza ho sempre utilizzato questo attributo con il seguente schema:
- 0.8-1.0: per la homepage o le pagine principali, come per esempio le pagine prodotto o quelle che descrivono i servizi principali di una azienda.
- 0.4-0.7: pagine secondarie, landig pages, articoli, FAQs.
- 0.0-0.3: pagine di scarso interesse per il visitatore con informazioni irrilevanti in storicamente parlando (pagine non più aggiornate)
Perchè mantenere aggiornata la sitemap conviene?
Come detto sopra impostare questi parametri può non avere alcuna efficacia, e anzi solitamente non ce l’ha; tuttavia va notato che quando lo spider passa per un sito, lo stesso registra tutte le informazioni possibili su una pagina, quindi non solo i cambiamenti a livello di fattori on-page, ma anche informazioni strettamente correlate come i server-header e le informazioni dentro la sitemap per esempio.
Un uso efficiente di questi due fattori non farà altro che comunicare ogni quanto vogliamo la nostra pagina scansionata e quanto per noi è importante.
Se solo per un attimo ipotizziamo che Google e gli altri motori aderenti allo standard seguano alla lettera quello che gli abbiamo detto, ben presto capirete come l’evitare anche solo un passaggio da parte del crawler per una pagina del sito che non merita attenzione, si trasforma in un risparmio di banda e in una maggiore efficenza dei tempi di risposta del server web sul quale il nostro sito è ospitato. Ovvero, in poche parole, contribuiremo a migliorare l’efficacia e la velocità globale del sito, fattore su cui Google ultimamente sta puntanto parecchio.