¿Buscas aprender qué son las etiquetas canonical y cómo usarlas para evitar los temidos problemas de contenido duplicado?
Las etiquetas canonical no son nada nuevo. Han existido desde 2009, la mejor parte de una década.

Google, Microsoft y Yahoo se unieron para crearlos. ¿Su objetivo? Para proporcionar a los propietarios de sitios web una forma de resolver problemas de contenido duplicado de forma rápida y sencilla.

¿Funcionan? Sí, perfectamente … ¡pero solo si sabes cómo usarlos!

En esta guía, aprenderás:

  • Qué es una etiqueta canónica
  • Cómo se ve una etiqueta canónica
  • ¿Por qué las etiquetas canónicas son importantes para SEO?
  • Cómo implementar etiquetas canónicas.
  • Cómo evitar errores comunes de canonicalización.
  • Cómo encontrar y solucionar problemas de canonicalización.

¿Qué es una etiqueta Canonical?

Una etiqueta canónica es un fragmento de código HTML que define la versión principal para páginas duplicadas, casi duplicadas y similares. En otras palabras, si tiene el mismo contenido o contenido similar disponible bajo diferentes URL, puede usar etiquetas canónicas para especificar qué versión es la principal y, por lo tanto, debe estar indexada.

Url Canonica

Url Canonica

¿Cómo es una etiqueta Canonical?

Las etiquetas canónicas utilizan una sintaxis simple y consistente, y se ubican en la sección <head> de una página web:

<link rel = «canonical» href = «https://example.com/sample-page/» />

Esto es lo que significa cada parte de ese código en un lenguaje sencillo:

link rel = «canonical»: el enlace en esta etiqueta es la versión maestra (canónica) de esta página.
href = «https://example.com/sample-page/»: la versión canónica se puede encontrar en esta URL.

¿Por qué son importantes las etiquetas Canonical para SEO?

A Google no le gusta el contenido duplicado. Les hace más difícil elegir:

  • La versión de una página para indexar (¡sólo indexara una!)
  • La versión de una página para clasificar por consultas relevantes.
  • Ya sea que deban consolidar el “enlace de equidad” en una página o dividirlo entre varias versiones.
  • Demasiado contenido duplicado también puede afectar su «presupuesto de rastreo». Eso significa que Google puede terminar perdiendo el tiempo rastreando múltiples versiones de la misma página en lugar de descubrir otro contenido importante en su sitio web.

Las etiquetas canónicas resuelven todos estos problemas. Le permiten decirle a Google qué versión de una página deben indexar y clasificar, y dónde consolidar cualquier «enlace equitativo».

No puede especificar una URL canónica, y Google tomará los asuntos en sus propias manos.

Si no indica una URL canónica, identificamos lo que creemos que es la mejor versión o URL.
Confiar en Google de esta manera no es una gran idea. Pueden seleccionar una versión de tu página que realmente no quieras que sea canónica.

Pero no tengo contenido duplicado, ¿verdad?

Dado que probablemente no haya publicado las mismas publicaciones y páginas varias veces, es fácil suponer que su sitio web no tiene contenido duplicado.

Pero los motores de búsqueda rastrean las URL, no las páginas web.

Eso significa que ven example.com/product y example.com/product?color=red como páginas únicas, a pesar de que son la misma página web con contenido idéntico o similar.

Estas se denominan URL parametrizadas y son una causa común de contenido duplicado, especialmente en sitios de comercio electrónico con navegación facetada / filtrada.

Por ejemplo, Brown Bag Clothing vende camisetas. Esta es la URL de su página de categoría principal:

https://www.example.com/camisetas/camiseta.html

Si filtra solo las camisetas XL, se agrega un parámetro a la URL:

https://www.example.com/camisetas/camiseta.html?Size=XL

Si también filtra solo para camisas azules, se agrega otro parámetro:

https://www.example.com/camisetas/camiseta.html?Size=XL&color=Blue

Estas son todas las páginas separadas a los ojos de Google, aunque el contenido es solo ligeramente diferente.

Pero no solo los sitios de comercio electrónico son víctimas de contenido duplicado.

Aquí hay algunas otras causas comunes de contenido duplicado que se aplican a todos los tipos de sitios web:

  • Tener parámetros URL de parámetros de búsqueda (por ejemplo, example.com?q=search-term)
  • Tener URLs parametrizadas para ID de sesión (por ejemplo, https://example.com?sessionid=3)
  • Tener versiones de páginas de impresión separadas (por ejemplo, example.com/page y example.com/print/page)
  • Tener direcciones URL únicas para publicaciones en diferentes categorías (por ejemplo, example.com/services/SEO/ y example.com/specials/SEO/)
  • Tener páginas para diferentes tipos de dispositivos (por ejemplo, example.com y m.example.com)
  • Tener versiones AMP y no AMP de una página (por ejemplo, example.com/page y amp.example / page)
  • Sirviendo el mismo contenido en las variantes que no sean www / www y no https / https (por ejemplo, https://example.com y http://www.example.com)

En estas situaciones, el uso adecuado de las etiquetas canónicas es crucial.

Además, los problemas de contenido duplicado entre dominios también son una cosa. Si es contenido sindicalizado (por ejemplo, si un periódico quiere publicar su contenido en forma literal en su sitio), debe pedirles que coloquen un enlace canónico al original.

Al hacerlo, es posible obtener tráfico de referencia de esa publicación, al tiempo que se mitiga el riesgo de que Google clasifique la URL incorrecta.

Los fundamentos de la implementación de etiquetas canónicas.

Los canónicos son fáciles de implementar. Discutiremos cuatro formas diferentes de hacerlo en un momento. Pero independientemente del método que elija, hay cinco reglas de oro que debe recordar en todo momento.

Regla # 1: usar URLs absolutas

John Mueller de Google afirma que es una buena práctica no usar rutas relativas con el elemento de enlace rel = «canonical».

Puedes usar cualquiera de las dos, pero te recomendaría que utilices URL absolutas para que estés seguro de que se interpretan correctamente.

Entonces deberías usar la siguiente estructura:

<link rel = «canonical» href = «https://example.com/pagina-ejemplo/” />

A diferencia de éste:

<link rel = «canonical» href = ”/ pagina-ejemplo /” />

Regla # 2: usar URLs en minúsculas

Como Google puede tratar las URL en mayúsculas y minúsculas como dos URL diferentes, primero debe asegurarse de forzar las URL en minúsculas en su servidor y luego usar las URL en minúsculas para sus etiquetas canónicas.

Regla # 3: usar la versión de dominio correcta (HTTPS vs. HTTP)

Si cambió a SSL, asegúrese de no declarar ninguna URL no SSL (es decir, HTTP) en sus etiquetas canónicas. Hacerlo teóricamente puede generar confusión y resultados inesperados. Si estás en un dominio seguro, asegúrate de usar la siguiente versión de tu URL:

<link rel = «canonical» href = «https://example.com/sample-page/” />

Opuesto a:

<link rel = «canonical» href = «http://example.com/sample-page/» />

NOTA AL MARGEN. Si no estás usando HTTPS, lo contrario es cierto.

Regla # 4: Usar etiquetas canónicas autorreferenciales

John Mueller de Google dice que, aunque no es obligatorio, se recomienda etiquetas canónicas autorreferenciales.

Recomiendo [usar a] canónico autorreferencial porque realmente nos deja claro qué página desea indexar, o cuál debería ser la URL cuando esté indexada.

Incluso si tiene una página, a veces hay diferentes variaciones de la URL que pueden subir esa página. Por ejemplo, con los parámetros al final, tal vez con minúsculas o www y non-www. Todas estas cosas se pueden limpiar con una etiqueta canónica.

En caso de que no esté seguro de cómo funciona un canónico autorreferencial, es básicamente una etiqueta canónica en una página que apunta a sí misma. Por ejemplo, si la URL fuera https://example.com/sample-page, una referencia canónica en esa página sería:

<link rel = «canonical» href = «https://example.com/sample-page» />

La mayoría de los CMS populares más modernos agregan URL de autorreferencia de forma automática, pero deberá tener su código de desarrollador si utiliza un CMS personalizado.

Regla # 5: Use una etiqueta canónica por página

Si la página tiene varias etiquetas canónicas, Google ignorará ambas.

En casos de declaraciones múltiples de rel = canonical, Google probablemente ignorará todas las sugerencias de rel = canonical.

Cómo implementar canónicos.

Hay cuatro formas de especificar las URL canónicas:

1. Etiqueta HTML (rel = canonical)
2. encabezado HTTP
3. Sitemap
4. Redireccionamiento 301 *

1. Configuración de canónicos usando rel = «canonical» etiquetas HTML

Usar una etiqueta rel = canonical es la forma más simple y obvia de especificar una URL canónica.

Simplemente agregue el siguiente código a la sección <head> de cualquier página duplicada:

<link rel = «canonical» href = «https://example.com/canonical-page/” />

Ejemplo
Digamos que usted tiene un sitio web de comercio electrónico que vende camisetas. Quieres que https://yourstore.com/tshirts/black-tshirts/ sea la URL canónica, aunque el contenido de esa página sea accesible a través de otras URL (por ejemplo, https://yourstore.com/offers/black-tshirts/)

Simplemente agregue la siguiente etiqueta canónica a cualquier página duplicada:

<link rel = «canonical» href = «https://yourstore.com/tshirts/black-tshirts/» />

Ten en cuenta que si estás usando un CMS, no necesitas meterte con el código de tu página. Hay una manera más fácil.

Estableciendo etiquetas canónicas en WordPress:

Instalar Yoast SEO y las etiquetas canónicas de autorreferencia se agregarán automáticamente. Para configurar canónicos personalizados, use la sección «Avanzado» en cada publicación o página.

Estableciendo etiquetas canónicas en Shopify:

Shopify agrega las URL canónicas de referencia automática para productos y publicaciones de blog de forma predeterminada. Para establecer URL canónicas personalizadas, deberá editar los archivos de la plantilla (.liquid) directamente.

Este hilo tiene alguna información sobre cómo hacer eso.

Estableciendo etiquetas canónicas en Squarespace:

Squarespace agrega URLs de autorreferencia por defecto también. Pero, como es el caso con Shopify, debe editar el código directamente si desea agregar una URL canónica personalizada.

2. Configuración de canónicos en encabezados HTTP

Para documentos como archivos PDF, no hay forma de colocar etiquetas canónicas en el encabezado de la página porque no hay una sección <head> en la página. En tales casos, necesitarás usar encabezados HTTP para configurar los canónicos.

Esto es lo que podría parecer nuestro encabezado HTTP para ese archivo:

HTTP / 1.1 200 OK
Tipo de contenido: aplicación / pdf
Enlace: <http://example.com/blog/canonical-tags/>; rel = «canónico»
Lectura recomendada: Cómo agregar la etiqueta canónica a los encabezados HTTP

3. Configuración de canónicos en sitemaps.

Google afirma que las páginas no canónicas no deberían incluirse en los mapas de sitio. Solo las URL canónicas deben ser listadas. Eso es porque Google ve las páginas que figuran en un mapa del sitio como canónicos sugeridos.

Sin embargo, no siempre seleccionarán URL en sitemaps como canónicos.

No garantizamos que consideremos que las URL del mapa del sitio son canónicas, pero es una forma sencilla de definir los canónicos para un sitio grande, y los mapas del sitio son una forma útil de decirle a Google qué páginas considera más importantes en su sitio.

4. Configuración de canónicos con 301 redirecciones.

Utilice 301 redirecciones cuando desee desviar el tráfico de una URL duplicada a la versión canónica.

Ejemplo
Supongamos que su página es accesible en estas URL:

example.com
example.com/index.php
example.com/home/
Elija una URL como la canónica y redirija las otras URL allí.

Debe hacer lo mismo para las versiones seguras de HTTPS / HTTP y www / non-www de su sitio. Elija una versión canónica y redirija las otras a esa versión.

Por ejemplo, la versión canónica de example.com es la URL de HTTPS que no es de www (https://example.com). Todas las siguientes URLs redirigen allí:

http://example.com/
http://www.example.com/
https://www.example.com/

Errores comunes de Canonical a evitar.

La canonización es un tema algo complejo. Como tal, hay muchos malentendidos y conceptos erróneos acerca de cómo canonizar adecuadamente.

Aquí hay algunos errores comunes que las personas cuando intentan canonizar:

Error # 1: bloqueo de la URL canonica a través de robots.txt
El bloqueo de una URL en robots.txt impide que Google la rastree, lo que significa que no pueden ver ninguna etiqueta canónica en esa página. Eso, a su vez, evita que transfieran cualquier “enlace equitativo” de lo no canónico a lo canónico.

Error # 2: establecer la URL canonica en ‘noindex’
Nunca mezclar noindex y rel = canonical. Son instrucciones contradictorias.

Por lo general, Google priorizará la etiqueta canónica sobre la etiqueta «noindex», como indica John Mueller aquí. Pero sigue siendo una mala práctica. Si desea no indexar y canonizar una URL, use un redireccionamiento 301. De lo contrario, use rel = canonical.

Error # 3: establecer un código de estado HTTP 4XX para la URL canonicalizada
Establecer un código de estado HTTP 4XX para una URL canonicalizada tiene el mismo efecto que utilizar la etiqueta «noindex»: Google no podrá ver la etiqueta canónica y transferir «enlace equitativo» a la versión canónica.

Error # 4: Canonizar todas las páginas paginadas a la página raíz
Las páginas paginadas no deben canonizarse a la primera página paginada de la serie. En su lugar, las referencias canónicas deben usarse en todas las páginas paginadas.

¿Por qué? Como John Mueller de Google declaró en Reddit, esto es incorrecto usar rel = canonical.

Lo principal que se debe evitar, ya que esta publicación trata sobre la canonicalización, es usar rel = canonical en la página 2 que apunta a la página 1. Página 2 no es equivalente a la página 1, por lo que rel = canonical así sería incorrecto.

John Mueller, analista de tendencias webmaster John Mueller
También debe usar las etiquetas rel = prev / next para la paginación. Google ya no los usa, pero Bing todavía los usa.

Error # 5: No usar etiquetas canónicas con hreflang
Las etiquetas Hreflang se utilizan para especificar el idioma y la orientación geográfica de una página web.

Google afirma que al usar hreflang, debe «especificar una página canónica en el mismo idioma, o el mejor idioma sustituto posible si no existe un idioma canónico para el mismo idioma».

Cómo encontrar y solucionar problemas de Canonical en su sitio

Es fácil cometer errores con la canonicalización, por lo que vale la pena auditar regularmente su sitio web para detectar problemas relacionados con las etiquetas canónicas y corregirlas lo antes posible.

Contáctanos en Web Canarias tenemos la solución.