Cos’è: rel canonical

Il tag rel=”canonical” è lo strumento attraverso il quale il gestore di un sito web può indicare a Google quale URL indicizzare, ignorando tutti gli altri.

Facciamo un po’ di chiarezza: per la maggior parte dei siti web presenti in rete, i seguenti indirizzi corrispondono alla stessa identica pagina (con identici contenuti) e sono raggiungibili digitando tutti i seguenti URL:

  • https://www.miosito.com
  • https://miosito.com/
  • https://www.miosito.com/index.html
  • https://www.miosito.com/index.php

Questo fa si che, nonostante rappresentino la stessa pagina, i suddetti indirizzi risultino differenti agli spider di Google.

Ma, per evitare di indicizzare contenuti duplicati, il motore di ricerca dovrà scegliere quale URL è il più adatto ad essere indicizzato.

Google, per scegliere quale è il migliore URL avendo a disposizione varie alternative, ha messo in atto il processo di canonizzazione degli URL.

Attraverso il processo di URL canonicalization (o canonizzazione degli URL) Google è in grado di scegliere ad esempio quale sia la home page di un sito web.

Un scorretta gestione della canonizzazione degli URL comporta un pessimo sfruttamento della link popularity di un sito ed un maggior numero di pagine da indicizzare da parte del motore di ricerca: tutto questo comporta una perdita di posizioni nelle SERP.

Per risolvere questo problema, bisogna porre attenzione ai seguenti pochi e semplici consigli per aiutare Google a capire quale URL si preferisce che venga indicizzato:

  • La prima cosa da fare è gestire correttamente i link (sia interni che esterni al sito web) in modo da farli puntare correttamente all’URL nella forma prescelta.
  • La soluzione migliore per gestire la canonizzazione degli URL, ovvero è quella di farlo attraverso dei redirect di tipo 301. Ad esempio se l’URL che si preferisce come home page è nella forma https://www.miosito.com allora bisogna fare in modo che, se un utente digita URL quali https://miosito.com , https://www.miosito.com/index.html o https://www.miosito.com/index.php attraverso un redirect 301, venga rediretto a https://www.miosito.com.
  • Specificare nella Google Search Console sotto la voce Impostazioni quale è il dominio preferito.

Utilizzo del rel canonical

Sfortunatamente, oltre alla home page, lo stesso problema riguarda anche le pagine interne del sito: infatti, capita molto spesso che un pagina con lo stesso contenuto sia raggiungibile da indirizzi diversi.

Ed è proprio qui che il tag rel=”canonical” ci da una mano: attraverso il suo utilizzo possiamo dichiarare a Google quale indirizzo indicizzare, ignorando tutti gli altri.

Nelle strutture di molti siti web esistono situazioni complesse, nelle quali si può verificare che la stessa pagina di un sito web è raggiungibile tramite URL differenti.

Agli occhi degli spider dei motori di ricerca, quindi, il sito web potrebbe avere pagine con contenuto identico ma raggiungibili da URL differenti.

Nel febbraio del 2009, proprio per ovviare a questo problema, Google ha annunciato l’introduzione di un nuovo tag che consente di specificare la versione preferita dell’URL che Google dovrebbe indicizzare e, di conseguenza, visualizzare nelle SERP: il tag rel=”canonical”.

Facciamo un esempio: abbiamo un sito di e-commerce nel quale è presente un prodotto che ha come codice “1234”. La pagina nella quale viene visualizzato il prodotto, ha un URL così strutturato:

  • https://www.mioecommerce.com/pagina.php?prodotto=1234

Il suddetto prodotto, però, appartiene ad una specifica categoria, e quindi può essere linkato anche con la categoria passata in query string:

  • https://www.mioecommerce.com/pagina.php?prodotto=1234&categoria=999

Inoltre il nostro sito di e-commerce ha anche più affiliati che pubblicizzano il prodotto direttamente sui loro siti web. Per poter gestire le vendite realizzate tramite affiliazione viene fornito agli utenti un ID Affiliato con cui collegare la pagina del prodotto. Avremo quindi che l’affiliato 111 collegherà la pagina di quel prodotto in questo modo:

  • https://www.mioecommerce.com/pagina.php?prodotto=1234&aid=111

In pratica, si avranno ben tre diversi URL che visualizzano la stessa pagina con lo stesso contenuto, tutte collegate da qualche altra pagina ed i link seguiti dagli spider.

A questo punto quale pagina verrà visualizzata da Google nella SERP?

Con il tag rel=”canonical” Google fornisce ai webmaster la soluzione a questo problema.

Prendiamo come esempio il caso che il nostro URL preferito per il nostro sito di e-commerce sia il seguente: https://www.mioecommerce.com/pagina.php?prodotto=1234.

Sarà sufficiente aggiungere il tag rel=”canonical per specificare la nostra versione di URL preferita:

Questo tag va aggiunto nella sezione <head> delle pagine che presentano eventuale contenuto duplicato e quindi, in questo caso:

  • https://www.mioecommerce.com/pagina.php?prodotto=1234&categoria=999
  • https://www.mioecommerce.com/pagina.php?prodotto=1234&aid=111

A questo punto, grazie al tag rel=”canonical”, Google capirà che tali pagine duplicate sono riferite all’URL canonico:

  • https://www.mioecommerce.com/pagina.php?prodotto=1234

Tutte le proprietà di queste pagine verranno trasferite dalle pagine duplicate all’URL originale che è stato specificato. In questo modo si riesce a sfruttare al meglio la link popularity del sito web.

Quindi, prima di affidare la realizzazione di un nuovo sito ad una web agency, assicurati che il CMS in uso supporti il tag rel=”canonical”.

Ulteriori specifiche riguardo il tag rel=”canonical”

  • Va utilizzata solamente per le pagine presenti su un unico dominio.
  • Non funziona solo con Google ma ha lo stesso effetto anche per Yahoo! e Bing.
  • Può essere utilizzato anche se le pagine non sono esattamente identiche ma hanno delle lievi differenze.
  • Questo tag viene trattato da tutti i motori di ricerca come un “suggerimento” che potrebbero non seguire in particolari situazione.

Per maggiori approfondimenti riguardo il rel canonical puoi consultare i seguenti articoli (in inglese): Google Webmaster Central Blog e Matt Cutts Blog.