Escoger páginas canónicas sirve para evitar contenido duplicado. Si tienes 2 páginas iguales o casi iguales (por ejemplo en el caso de un comercio electrónico un producto en diferentes colores y para cada color una propia url) puedes indicar a Google cuál es la página principal.

Esta página principal se llama la versión canónica. La versión canónica es la que Google debería rastrear y indexar. Mientras el motor de búsqueda rastrear la versión canónica frecuentemente no rastrear las páginas duplicadas con la misma frecuencia.

Todas las señales de ranking – por ejemplo enlaces- que reciben las páginas duplicadas sirven para posicionar la versión canónica.

Hay diferentes formas de indicar al buscador cuál es la versión canónica de varias páginas duplicadas, por ejemplo:

  • A través de la etiqueta rel=canonical en el header del código.
  • A través de http header
  • A través del mapa de sitio (solo las versiones canónicas deben estar en el mapa de sitio).

Para todas tus urls deberías escoger la versión canónica, también cuando no existen páginas duplicadas. Esto es por seguridad. Muchos sistemas producen automáticamente páginas duplicadas.

Google puede escoger una url como versión canónica diferente a la que escogí yo

Tú puedes escoger como versión canónica la página que quieres. Pero Google no necesariamente va a seguir tu elección. A veces el motor de búsqueda escoge otra página. John Mueller de Google explicó en un hangout para webmaster los factores que pueden influir en la elección del motor de búsqueda:

  • Redirecciones de una página a otra.
  • Enlaces internos.
  • Enlaces externos.
  • Mapa del sitio.
  • Hreflang, geotargeting.
  • Uso de https.
  • Urls “limpias”, cortas.

La url canónica no debería redireccionar a otra url.  Enlaces internos y externos son factores de ranking. Una página que recibe más enlaces puede ser más importante para Google que una que recibe menos enlaces.

La url canónica debe estar en el mapa de sitio. HTTPS es un factor de ranking y Google prefiere mostrar una url que utiliza https como url canónica. Además, Google prefiere urls cortas y limpias (amigables).

El uso de hreflang también puede decidir sobre cuál url el buscador escoge como canónica. Google muchas veces prefiere mostrar páginas localizadas al usuario. Si existe una página para Colombia y una página parecida para Ecuador y la de Colombia es la versión canónica el buscador generalmente va a mostrar la página de Colombia. Pero a los usuarios de Ecuador va a parecer la página para Ecuador en los resultados de búsqueda.

Para escoger la versión canónica Google primero revisa cuáles páginas tienen una relación entre ellas y cuáles son iguales o casi iguales. Luego da a cada una de las páginas un puntaje a base de los factores mencionados. El buscador escoge la página con el puntaje más alto como versión canónica.

Problemas con urls canónicas se puede ver por ejemplo en el sitio de De Prati, donde las urls existen en dos versiones distintas.

En Search Console puedes ver la versión canónica que Google escoge para cada una de tus páginas web:

Google muestra la versión canónica en Search Console.

Resumen

Para que Google coja la ulr canónica correcta -la que tú quieres- tienes que revisar si está así en el mapa de sitio, si recibe más enlaces internos con los enlaces externos esto es más difícil) que las versiones duplicadas, que utiliza https y tiene una url amigable y corta.