La consola de búsqueda de Google advierte a los editores sobre los errores 404: 404 y 404 suave.
Si bien ambos se llaman 404, son muy diferentes.
En consecuencia, es esencial comprender la diferencia entre los errores para corregirlos.
Códigos de estado HTTP
Una página web a la que accede un navegador responde con un código de estado que comunica si la solicitud fue exitosa y, de no ser así, por qué no lo fue.
Estas respuestas se comunican con lo que se conoce como códigos de respuesta HTTP, pero oficialmente se denominan códigos de estado HTTP.
Un servidor proporciona cinco categorías de códigos de respuesta; este artículo trata específicamente sobre una respuesta, el código de estado de página 404 no encontrada.
El significado de un código de respuesta 404
Todos los códigos dentro de la serie de respuestas 4xx significan que no se pudo cumplir con la solicitud porque no se encontró la página.
La definición oficial es:
4xx (Error del cliente): la solicitud contiene una sintaxis incorrecta o no se puede cumplir
La respuesta 404 es ambigua en cuanto a si la página web podría regresar.
Ejemplos de por qué sucede la página 404 no encontrada
- Si alguien elimina por error una página web, el servidor responde con la respuesta 404 página no encontrada.
- Si alguien enlaza a una página web inexistente, el servidor responde que no se encontró la página (404).
La documentación oficial es clara sobre la ambigüedad de si una página se ha ido de forma temporal o permanente:
“El código de estado 404 (No encontrado) indica que el servidor de origen no encontró una representación actual para el recurso de destino o no está dispuesto a revelar que existe.
Un código de estado 404 no indica si esta falta de representación es temporal o permanente…”
En resumen, el código 404 página no encontrada significa que hubo un error en la solicitud del navegador porque no se pudo encontrar la página solicitada.
¿Qué es un error suave 404?
Un error 404 suave no es un código de estado oficial. El servidor no envía una respuesta 404 suave a un navegador porque no existe un código de estado 404 suave.
suave 404 describe una situación en la que el servidor presenta una página web y responde con un código de estado 200 OK, lo que indica éxito cuando la página web o el contenido realmente faltan.
Cuatro razones comunes para un 404 blando
Falta una página web y un servidor envía el estado 200 OK.
Este tipo de 404 suave ocurre cuando falta una página, pero la configuración del servidor redirige la página faltante a la página de inicio o a una URL personalizada.
La página ya no está, pero el editor ha hecho algo para cumplir con la solicitud de la página que falta.
Falta contenido o es “escaso”.
Cuando el contenido falta por completo, o hay muy poco (también conocido como contenido delgado), el servidor responderá con un código de estado 200, lo que significa que la solicitud de la página fue exitosa.
Pero para indexar páginas web que no son solicitudes de páginas web exitosas, los motores de búsqueda llaman a esto 404 suaves.
La página que falta redirige a la página de inicio.
Algunos creen erróneamente que hay algo mal con una respuesta de error 404.
Por lo tanto, para detener las respuestas de error 404, un editor puede redirigir la página que falta a la página de inicio, aunque la página de inicio no sea la solicitada.
Google llama a estas solicitudes de página fallidas 404 blandos.
Falta la página redirigida a una página web personalizada.
A veces, las páginas que faltan redirigen a una página web personalizada que sirve un código de estado 200, lo que hace que Google etiquete estas páginas como 404 suaves.
¿Quién inventó la frase suave 404?
El concepto de un 404 suave puede haberse originado en un artículo de investigación de 2004 titulado Hacia una comprensión de la decadencia de la Web (PDF).
Las páginas faltantes que se sustituyen incorrectamente presentan un problema para los motores de búsqueda que intentan indexar páginas reales.
Así es como el documento de investigación enmarca los 404 blandos:
“Según el protocolo HTTP, cuando se realiza una solicitud a un servidor de una página que ya no está disponible, se supone que el servidor debe devolver un código de error…
…de hecho, muchos servidores, incluidos los de mayor reputación, no devuelven un código 404; en cambio, los servidores devuelven una página sustituta y un código OK (200).
…Nuestro estudio muestra que este tipo de sustituciones, llamadas “soft-404s”, representan más del 15 % de los enlaces muertos”.
Soft 404 debido a errores de codificación
Hay casos en los que no falta la página, pero problemas específicos (como errores de codificación) han llevado a Google a clasificarla como una página faltante.
Los Soft 404 son esenciales para investigar porque podrían indicar un código roto.
Problemas típicos de codificación:
- Falta un archivo o incluir que se supone que debe llenar una página web con contenido.
- Error de la base de datos.
- Falta JavaScript.
- Páginas de resultados de búsqueda vacías.
Los errores 404 tienen dos causas principales
- Un error en el enlace dirige a los usuarios a una página que no existe.
- Un enlace a una página que solía existir pero que de repente desapareció.
Error de vinculación
Si la causa del 404 es un error de enlace, tienes que arreglar los enlaces.
La parte complicada de esta tarea es encontrar todos los enlaces rotos en un sitio. Puede ser más difícil rastrear sitios grandes y complejos con miles o millones de páginas.
En casos como este, las herramientas de rastreo son útiles.
Tiene tantas opciones de software de rastreo de sitios para elegir: Xenu y Greenflare gratuitos; o software pago como Screaming Frog, DeepCrawl, Botify, Sitebulb y OnCrawl, donde varios de estos tienen versiones de prueba gratuitas o versiones gratuitas pero con funciones limitadas.
Una página que ya no existe
Cuando una página ya no existe, tienes dos opciones:
- Restaure la página si la eliminación fue accidental.
- 301 lo redirige a la página relacionada más cercana si la eliminación fue a propósito.
Primero, debe ubicar todos los errores de enlace en el sitio. De manera similar a encontrar todos los errores en los enlaces de un sitio web a gran escala, puede usar herramientas de rastreo.
Sin embargo, es posible que las herramientas de rastreo no encuentren páginas huérfanas: páginas no enlazadas desde ningún lugar dentro de los enlaces de navegación o desde ninguna de las páginas.
Pueden existir páginas huérfanas si solían ser parte del sitio web, luego, después de un rediseño del sitio web, el enlace que va a esta página anterior desaparece, pero es posible que los enlaces externos de otros sitios web sigan enlazando a ellos.
Para verificar dos veces si este tipo de páginas existen en su sitio, puede usar varias herramientas.
Cómo identificar las páginas de respuesta 404
Informes de la consola de búsqueda de Google
El informe de cobertura enumera las URL de error 404 en un sitio web.
Search Console informará 404 páginas mientras Google rastrea todas las páginas que puede encontrar. Esto puede incluir enlaces de otros sitios a una página que solía existir en su sitio web.
Google analitico
No encontrará un informe de página faltante en Google Analytics de forma predeterminada. Sin embargo, puede rastrearlos de diferentes maneras.
Por un lado, puede crear un informe personalizado y segmentar páginas con un título de página que mencione Error 404 – Página no encontrada.
Otra forma de encontrar páginas huérfanas dentro de Google Analytics es crear agrupaciones de contenido personalizadas y asignar las 404 páginas a un grupo de contenido.
Sitio: Comando de búsqueda de operadores
No se puede usar el sitio: comando de búsqueda para encontrar errores 404 porque Google no indexa páginas web 404 o páginas web 404 blandas.
Sitio de Google: el operador de búsqueda es útil para encontrar páginas web en un sitio que contiene una frase de palabra clave específica en el contenido de las páginas web.
La Consola de búsqueda de Google es la mejor fuente para identificar una lista de 404 blandos y 404 normales.
Los registros de errores de tráfico del sitio web son una fuente útil para identificar respuestas de error 404.
Otras herramientas de investigación de backlinks
Las herramientas de investigación de backlinks como Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools y CognitiveSEO también pueden ayudar.
La mayoría de estas herramientas exportarán una lista de vínculos de retroceso que se vinculan a su dominio. Desde allí, puede verificar todas las páginas vinculadas y buscar errores 404.
Cómo corregir errores suaves 404
Las herramientas de rastreo no detectarán un 404 suave porque no es un error 404. Pero puedes usar herramientas de rastreo para atrapar algo más.
Aquí hay algunas cosas para encontrar:
- Contenido delgado: Algunas herramientas de rastreo informan páginas que tienen poco contenido junto con un recuento de palabras clasificables. Comience con las páginas con la menor cantidad de palabras para evaluar si la página tiene poco contenido.
- Contenido duplicado: Algunas herramientas de rastreo son lo suficientemente sofisticadas como para discernir qué porcentaje de la página es contenido de plantilla. Y también hay herramientas hechas específicamente para encontrar contenido duplicado interno como SiteLiner. Si el contenido principal es casi el mismo que muchas otras páginas, debe buscar en estas páginas y determinar por qué existe contenido duplicado en su sitio.
Además de las herramientas de rastreo, también puede usar la Consola de búsqueda de Google y verificar los errores de rastreo para encontrar las páginas que figuran en los 404 suaves.
Rastrear un sitio completo para encontrar problemas que causen errores 404 le permite localizar y corregir problemas antes de que Google los detecte.
Después de detectar estos problemas 404 leves, deberá corregirlos.
La mayoría de las veces, las soluciones parecen ser de sentido común. Esto puede incluir cosas simples como expandir páginas con poco contenido o reemplazar contenido duplicado por uno nuevo y único.
A lo largo de este proceso, aquí hay algunas cosas a considerar:
Consolidar páginas
A veces, el contenido escaso se produce por ser demasiado específico con el tema de la página, lo que te deja poco que decir.
Combinar varias páginas delgadas en una sola página puede ser más apropiado si los temas están relacionados. Esto no solo resuelve problemas de contenido delgado, sino que también puede solucionar problemas de contenido duplicado.
Por ejemplo, un sitio de comercio electrónico que vende zapatos en diferentes colores y tallas puede tener una URL diferente para cada combinación de tallas y colores. Esto deja una gran cantidad de páginas con contenido escaso y relativamente idéntico.
El enfoque más efectivo es poner todo esto en una página y enumerar las opciones disponibles.
Encuentre problemas técnicos que causen contenido duplicado
Incluso con la herramienta de rastreo web más sencilla como Xenu (que no analiza el contenido, sino solo las URL, los códigos de respuesta y las etiquetas de título), aún puede encontrar problemas de contenido duplicado mirando las URL.
Esto incluye URL con www y sin www, HTTP y HTTPS, con index.html y sin, con parámetros de seguimiento y sin, etc.
Errores 404 y errores 404 leves
Lo más importante que debe recordar acerca de los errores 404 es que si realmente faltan las páginas, entonces no hay nada que arreglar. Está bien mostrar una respuesta 404 para solicitudes de páginas que no existen.
Pero si las páginas existen pero en una URL diferente, entonces eso es algo que se debe arreglar redirigiendo un enlace roto a la URL real, restaurando una página que falta o redirigiendo la URL anterior a una nueva página que la reemplazó.
Un 404 suave siempre es el resultado de un problema que debe diagnosticarse y solucionarse.
Comprender la diferencia entre los 404 es esencial para mantener un sitio web funcionando al máximo rendimiento.
Imagen destacada: Paulo Bobita/Search Engine Journal
Con información de Search Engine Journal.
Leer la nota Completa > ¿Cuál es la diferencia y cómo arreglar ambos?