Uno dei principali problemi a cui spesso si assiste oggi quando si fa una ricerca tramite i motori di ricerca, è quello dei contenuti duplicati. Decine se non centinaia di pagine che offrono volgarmente lo stesso contenuto. Chi lo offre ribrandizzando il contenuto sotto diverso sito, chi carica il contenuto tramite web-service, chi usa frame nascosti … Insomma, sembra che la creatività sia morta.
In realtà una spiegazione logica è riconducibile al fatto che un buon contenuto attira visitatori, e da qua la logica conseguenza che più traffico significa più pagine viste e per quei siti dove si fa uso di campagne pubblicitarie a banner, più pagine significa più impressione e quindi più soldini.
Personalmente è una cosa che proprio non digerisco. Non sò quante volte alla ricerca di risposte, utilizzando Google mi sarò imbattuto in post pubblicati sul medesimo forum e risposti da n siti, oppure articoli di blog presi e copiati di sana pianta.
Purtroppo sembra un fenomeno al quale - almeno per il momento - non si possa dare una smussatina. Credo che il maggior compito in questo frangente venga dai motori di ricerca stessi, che dovrebbero - a mio avviso - implementare un algoritmo migliore di quello che un pò tutti oggi adottano e verificare la dupliclicità dei contenuti fra i vari siti, scaraventando quelle pagine doppione (dalla prima all’ultima) nei cosìdetti “risultati supplementari” che in prima battuta non vengono presi in considerazione (non da Google per lo meno).
Un pò quello che succede con questo particolare motore di ricerca chiamato CopyScape, che mostra quali pagine - a partire da un url - contengono del materiale duplicato.
Non ho bene idea su quale sia la percentuale di contenuto duplicato tenuta in considerazione dal motore, ma trovo l’idea estremamente utile, specie se poi si vogliono far valere i propri diritti. Comunque, per conoscere la percentuale di cui parlavo sopra, si può utilizzare quest’altro strumento, utile anche per confrontare le pagine del proprio sito. Eh, già perchè anche il proprio sito, nel bene o nel male, potrebbe cadere nella stessa trappola del contenuto duplicato.
A mio modesto parere, una pagina non dovrebbe mai superare il 32-35% di contenuto duplicato, altrimenti si inizia a parlare di vero e proprio SPAM. Questo valore, ovviamente, si riferisce alla sola parte del mero contenuto, escludendo quindi eventuale codice HTML o parti del template come il menù di navigazione o il footer.