Canonical URL e la sua gestione su Google

Pubblicato: Novembre 8, 2020
Autore: Francesco Giammanco
canonical url

Un rel canonical (<link rel="canonical" href="https://example.com/" />) è un'attributo HTML utilizzato per unificare diverse metriche relative ad un unico contenuto, anche nel caso fossero differenziati in base alla vista mobile o a pagine AMP.

Come indicato dal Centro Assistenza Google, è utile segnalare la versione canonical di un URL quando:

Metodi di supporto al canonical

Il rel canonical è solo un suggerimento offerto ai motori di ricerca, motivo per il quale spesso è necessario comprendere come ripulire il crawling e la conseguente indicizzazione del sito per aumentare le chance che la nostra indicazione sia presa come ottimale.

Per farlo ci sono da prendere in considerazione e valutare il setup di alcune delle seguenti opzioni:

  1. Controllo parametri URL: è possibile segnalare per farli ignorare dalla scansione dei parametri URL generati dal sito o dall'e-commerce, grazie al tool presente nel link precedente.
  2. Hash di posizione: si tratta delle indicazioni lasciate dagli ID CSS, volti ad essere utilizzati come ancora per raggiungere una sezione specifica della pagina. Non vengono indicizzati.
  3. URL dinamici: spesso la confusione sulla generazione e indicizzazione degli URL dinamici può essere mitigata dalla distinzione di questi ultimi dal controllo dei parametri URL.
  4. Articoli in più domini: è sicuramente sensato assegnare un canonical anche agli articoli simili o duplicati presenti in domini esterni al nostro sito web.

Come Google gestisce la versione canonica della pagina

All'interno di una puntata del podcast dedicato a Google Search, Gary Illyes ha spiegato come gli algoritmi scelgono la versione canonica della pagina e scopre i contenuti duplicati.

La spiegazione che viene fornita in seguito può essere un ottimo aiuto nella scelta dei canonical del sito e nella logica di selezione delle pagine.

L'assunto di base indicato da Gary Illyes  è che i segnali coinvolti nella scelta di una versione canonica sono più di venti.

Gli step di risoluzione della canonizzazione segue un iter specifico:

Nella fase di individuazione vengono raggruppati i contenuti ritenuti duplicati e viene generata una pagina "leader" a partire dalla risultante dei checksum e degli hash generati per semplificare il calcolo.

Checksum per canonical
Esempio di checksum

Cos'è un checksum?

L'utilizzo più comune dei checksum è quello di garantire la validità di un download. Le informazioni vengono ridotte utilizzando funzioni hash e verificate velocemente.

Google genera i checksum di tutte le pagine e individua i cluster duplicati.

Nel cado di Google e della pagina canonica, la logica della riduzione delle informazioni in checksum è di natura pratica, in quanto l'analisi di un contenuto ridotto ha un costo e un tempo di profilazione inferiore, e a detta degli stessi esperti il risultato è pressoché lo stesso.

A questo punto sembra che per quanto riguardi i fattori consideranti frutto di una duplicazione, la pratica di spostare il testo da una sezione all'altra avrebbe un'utilità minima (sebbene si supponga impatti sull'algoritmo Bert).

Duplicati esatti o vicini

Le operazione di pulizia dei dati inizia con l'esclusione dei dati presenti nella barra di navigazione e del footer, che verranno analizzati da altri strumenti.

Una volta identificato quello che viene nominato come "centerpiece", il contenuto centrale, è più facile generare un checksum confrontabile con altri.

A questo punto è necessario riconoscere i "dupe cluster", i settori di duplicazione o in ogni caso che verranno segnalati come contenuti non selezionati.

Ma nella scelta del contenuto canonico hanno peso anche il PageRank, la posizione in sitemap (rispetto ad una versione duplicata esclusa), e anche l'attributo rel="canonical".

Secondo le indicazioni di Gary il rel="canonical" ha un peso di nuovo molto importante, ma come appare chiaro non risolve da solo qualsiasi problema.

Questo aspetto da il via a speculazioni su contenuti duplicati "vicini" ma non esatti, in cui il canonical può avere un peso ma non da il via ad una risoluzione automatica.

Il canonical non influenza il posizionamento

Uno dei temi trattati, forse il più interessante riguarda la questione relativa al posizionamento dei contenuti canonici.

La canonizzazione e il canonical non influenzano l'autorità della pagina, ma impattano sulla scelta precedente relativa a quale versione della pagina riceverà una valutazione dagli algoritmi che si occupano del posizionamento.

I segnali di canonizzazione sono differenti da quelli relativi al posizionamento.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram