En un episodio reciente del podcast Search Off the Record de Google, Allan Scott del equipo “Dups” explicó cómo Google decide qué URL considerar como principal cuando hay páginas duplicadas.

Reveló que Google analiza alrededor de 40 señales diferentes para elegir la URL principal de un grupo de páginas similares.

Alrededor de 40 señales para la selección de URL canónicas

El contenido duplicado es un problema común para los motores de búsqueda porque muchos sitios web tienen varias páginas con contenido igual o similar.

Para solucionar esto, Google utiliza un proceso llamado canonicalización. Este proceso permite a Google elegir una URL como versión principal para indexar y mostrar en los resultados de búsqueda.

Google ha discutido la importancia de utilizar señales como etiquetas rel=”canonical”, mapas de sitio y redireccionamientos 301 para la canonicalización. Sin embargo, la cantidad de señales involucradas en este proceso es mayor de lo que cabría esperar.

Scott reveló durante el podcast:

“No estoy seguro de cuál es el número exacto en este momento porque sube y baja, pero sospecho que ronda los 40”.

Algunas de las señales conocidas mencionadas incluyen:

  1. etiquetas rel=”canónicas”
  2. redirecciones 301
  3. HTTPS frente a HTTP
  4. Mapas del sitio
  5. Enlace interno
  6. longitud de la URL

El peso y la importancia de cada señal pueden variar, y algunas señales, como las etiquetas rel=”canonical”, pueden influir tanto en el proceso de agrupación como de canonicalización.

Señales de equilibrio

Con tantas señales en juego, Allan reconoció los desafíos a la hora de determinar la URL canónica cuando las señales entran en conflicto.

Él afirmó:

“Si sus señales entran en conflicto entre sí, lo que sucederá es que el sistema comenzará a recurrir a señales menores”.

Esto significa que, si bien las señales potentes, como las etiquetas rel=”canonical” y los redireccionamientos 301, son cruciales, pueden entrar en juego otros factores cuando estas señales no son claras o contradictorias.

Como resultado, el proceso de canonicalización de Google implica un delicado acto de equilibrio para determinar la URL canónica más apropiada.

Mejores prácticas para la canonicalización

Las señales claras ayudan a Google a identificar la URL canónica preferida.

Las mejores prácticas incluyen:

  1. Utilice las etiquetas rel=”canonical” correctamente.
  2. Implemente redireccionamientos 301 para contenido movido permanentemente.
  3. Asegúrese de que las versiones HTTPS de las páginas sean accesibles y estén vinculadas.
  4. Envíe mapas de sitio con URL canónicas preferidas.
  5. Mantenga los enlaces internos consistentes.

Estas señales ayudan a Google a encontrar las URL canónicas correctas, lo que mejora el rastreo, la indexación y la visibilidad de búsqueda de su sitio.

Errores a evitar

Aquí hay algunos errores comunes a los que debe prestar atención.

1. Etiquetas canónicas incorrectas o conflictivas:

  • Apuntando a páginas inexistentes o 404
  • Múltiples etiquetas canónicas con diferentes URL en una página
  • Apuntando a un dominio completamente diferente

Arreglar: Vuelva a verificar las etiquetas canónicas, use solo una por página y use URL absolutas.

2. Cadenas o bucles canónicos

Cuando la página A apunta a la página B como canónica, pero la página B apunta hacia A u otra página, se crea un bucle.

Arreglar: Asegúrese de que las URL canónicas siempre apunten a la versión final preferida de la página.

3. Usar etiquetas noindex y canonical juntas

Envío de señales contradictorias a los motores de búsqueda. Noindex significa no indexar la página en absoluto, lo que hace que los canónicos sean irrelevantes.

Arreglar: Utilice etiquetas canónicas para consolidación y noindex para exclusión.

4. Canonicalizar para redirigir o no indexar páginas

Señalar canónicos a páginas redirigidas o sin índice confunde a los motores de búsqueda.

Arreglar: Las URL canónicas deben tener un estado de 200 y ser indexables.

5. Ignorar la distinción entre mayúsculas y minúsculas

Las mayúsculas y minúsculas de URL inconsistentes pueden causar problemas de contenido duplicado.

Arreglar: Mantenga la coherencia entre la URL y la etiqueta canónica.

6. Pasar por alto la paginación y los parámetros

El contenido paginado y las URL con muchos parámetros pueden provocar duplicaciones si se manejan mal.

Arreglar: utilice etiquetas canónicas que apunten a la primera página o “Ver todo” para la paginación y mantenga los parámetros coherentes.

Conclusiones clave

Es poco probable que la lista completa de más de 40 señales utilizadas para determinar las URL canónicas se haga pública.

Sin embargo, ésta fue todavía una discusión reveladora que vale la pena destacar.

Estas son las conclusiones clave:

  • Google utiliza aproximadamente 40 señales diferentes para determinar las URL canónicas, con etiquetas rel=”canonical” y redirecciones 301 entre los indicadores más sólidos.
  • Cuando las señales entran en conflicto, Google recurre a señales secundarias para tomar una decisión
  • La implementación clara y consistente de señales de canonicalización (etiquetas, redireccionamientos, mapas de sitio, enlaces internos) es crucial
  • Errores comunes como cadenas canónicas, señales mixtas o implementaciones incorrectas pueden confundir a los motores de búsqueda.

Escuche la discusión completa en el video a continuación:


Imagen de portada: chatiyanon/Shutterstock

Con información de Search Engine Journal.

Leer la nota Completa > Google utiliza alrededor de 40 señales para determinar URL canónicas

LEAVE A REPLY

Please enter your comment!
Please enter your name here