Google

Errores 404 vs. Soft 404: Cuál es la diferencia y cómo arreglar ambos

Los errores 404 y soft 404 son diferentes tipos de problemas que requieren diferentes enfoques para diagnosticarlos y solucionarlos.

La consola de búsqueda de Google advierte a los editores sobre los errores 404: 404 y soft 404.

Aunque ambos se denominan 404, son muy diferentes.

Por lo tanto, es esencial entender la diferencia entre los errores para solucionarlos.

Códigos de estado HTTP

Una página web a la que se accede mediante un navegador responde con un código de estado que comunica si la solicitud ha tenido éxito y, si no, por qué no lo ha tenido.

Estas respuestas se comunican con lo que se conoce como códigos de respuesta HTTP, pero oficialmente se llaman códigos de estado HTTP.

Un servidor proporciona cinco categorías de códigos de respuesta; este artículo trata específicamente de una respuesta, el código de estado 404 página no encontrada.

El significado de un código de respuesta 404

Todos los códigos dentro de la serie de respuestas 4xx significan que la solicitud no pudo ser satisfecha porque la página no fue encontrada.

La definición oficial es:

4xx (Error del cliente): La solicitud contiene una sintaxis incorrecta o no puede cumplirse

La respuesta 404 es ambigua en cuanto a si la página web puede volver.

Ejemplos de por qué ocurre el 404 Página no encontrada

  • Si alguien borra por error una página web, el servidor responde con la respuesta 404 página no encontrada.
  • Si alguien enlaza a una página web inexistente, el servidor responde que la página no fue encontrada (404).

La documentación oficial es clara sobre la ambigüedad de si una página ha desaparecido temporal o permanentemente:

  • «El código de estado 404 (no encontrado) indica que el servidor de origen no encontró una representación actual para el recurso de destino o no está dispuesto a revelar que existe una.
  • Un código de estado 404 no indica si esta falta de representación es temporal o permanente…»

En resumen, el código 404 de página no encontrada significa que hubo un error en la solicitud del navegador porque no se pudo encontrar la página solicitada.

¿Qué es un error suave 404 o Soft 404?

Un error soft 404 no es un código de estado oficial. El servidor no envía una respuesta soft 404 a un navegador porque no existe un código de estado soft 404.

El soft 404 describe una situación en la que el servidor presenta una página web y responde con un código de estado 200 OK, indicando éxito cuando la página web o el contenido en realidad han desaparecido.

Cuatro razones comunes para un Soft 404

Falta una página web y el servidor envía el estado 200 OK.

Este tipo de soft 404 ocurre cuando falta una página, pero la configuración del servidor redirige la página que falta a la página principal o a una URL personalizada.

La página ha desaparecido, pero el editor ha hecho algo para cumplir con la solicitud de la página que falta.

El contenido falta o es «escaso».

Cuando el contenido falta por completo o es muy escaso (es decir, el contenido es escaso), el servidor responderá con un código de estado 200, lo que significa que la solicitud de la página se ha realizado correctamente.

Pero para indexar las páginas web que no son peticiones de páginas web exitosas, los motores de búsqueda llaman a esto soft 404s.

La página perdida se redirige a la página principal.

Algunos creen erróneamente que hay algo malo en una respuesta de error 404.

Por lo tanto, para detener las respuestas de error 404, un editor puede redirigir la página que falta a la página principal, aunque la página principal no sea lo que se solicitó.

Google denomina a estas solicitudes de páginas fallidas 404 suaves.

Página perdida redirigida a una página web personalizada.

A veces, las páginas que faltan se redirigen a una página web personalizada que sirve un código de estado 200, lo que hace que Google etiquete estas páginas como soft 404.

¿Quién inventó la frase Soft 404?

El concepto de un soft 404 puede tener su origen en un documento de investigación de 2004 titulado Towards an Understanding of the Web’s Decay (PDF).

Las páginas que faltan y que son sustituidas de forma incorrecta suponen un problema para los motores de búsqueda que intentan indexar páginas reales.

Así es como el documento de investigación enmarca los soft 404:

«Según el protocolo HTTP, cuando se solicita a un servidor una página que ya no está disponible, el servidor debe devolver un código de error…

…de hecho, muchos servidores, incluidos los más reputados, no devuelven un código 404; en su lugar, los servidores devuelven una página sustituta y un código OK (200).

…Nuestro estudio muestra que este tipo de sustituciones, denominadas «soft-404″, representan más del 15% de los enlaces muertos».

Soft 404 debido a errores de codificación

Hay casos en los que la página no ha desaparecido, sino que problemas específicos (como errores de codificación) han hecho que Google la categorice como página desaparecida.

Los 404 suaves son esenciales para investigar porque podrían indicar un código roto.

Problemas típicos de codificación:

  • Falta un archivo o un include que debe rellenar una página web con contenido.
  • Error de base de datos.
  • Falta de JavaScript.
  • Páginas de resultados de búsqueda vacías.
  • Los errores 404 tienen dos causas principales
  • Un error en el enlace que dirige a los usuarios a una página que no existe.
  • Un enlace a una página que solía existir pero que ha desaparecido de repente.
  • Error de enlace

Si la causa del 404 es un error de enlace, hay que arreglar los enlaces.

La parte complicada de esta tarea es encontrar todos los enlaces rotos de un sitio. Puede ser más difícil rastrear sitios grandes y complejos con miles o millones de páginas.

En casos como éste, las herramientas de rastreo son muy útiles.

Hay muchas opciones de software de rastreo de sitios para elegir: los gratuitos Xenu y Greenflare; o software de pago como Screaming Frog, DeepCrawl, Botify, Sitebulb y OnCrawl, donde varios de ellos tienen versiones de prueba gratuitas o versiones gratuitas pero con funciones limitadas.

Una página que ya no existe

Cuando una página ya no existe, tiene dos opciones:

Restaurar la página si la eliminación fue accidental.

Redirigirla a la página relacionada más cercana si la eliminación fue a propósito.

En primer lugar, hay que localizar todos los errores de vinculación del sitio. Al igual que para encontrar todos los errores de enlace de un sitio web a gran escala, puede utilizar herramientas de rastreo.

Sin embargo, es posible que las herramientas de rastreo no encuentren las páginas huérfanas: páginas que no están enlazadas desde ninguna parte de los enlaces de navegación ni desde ninguna de las páginas.

Las páginas huérfanas pueden existir si antes formaban parte del sitio web y, después de un rediseño del mismo, el enlace que iba a esta antigua página desaparece, pero los enlaces externos de otros sitios web podrían seguir enlazando con ellas.

Para comprobar si este tipo de páginas existen en su sitio, puede utilizar varias herramientas.

Cómo identificar las páginas de respuesta 404

Informes de Google Search Console

El informe Cobertura enumera las URL de error 404 de un sitio web.

Error 404 desde el Search Console de Google

Google Analytics

No encontrará un informe de páginas perdidas en Google Analytics por defecto. Sin embargo, puede realizar un seguimiento de diferentes maneras.

Por un lado, puede crear un informe personalizado y segmentar las páginas con un título de página que mencione Error 404 – Página no encontrada.

Otra forma de encontrar páginas huérfanas en Google Analytics es crear agrupaciones de contenido personalizadas y asignar todas las páginas 404 a un grupo de contenido.

Site: Comando de búsqueda del operador

No se puede utilizar el comando de búsqueda site: para encontrar errores 404 porque Google no indexa las páginas web 404 ni las páginas web soft 404.

El operador de búsqueda site: de Google es útil para encontrar páginas web en un sitio que contengan una frase de palabras clave específica en el contenido de las páginas web.

Search Console de Google es la mejor fuente para identificar una lista de 404 suaves y 404 regulares.

Los registros de errores de tráfico del sitio web son una fuente útil para identificar las respuestas de error 404.

Otras herramientas de investigación de backlinks

Las herramientas de investigación de backlinks como Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools y CognitiveSEO también pueden ayudar.

La mayoría de estas herramientas exportarán una lista de backlinks que enlazan con tu dominio. A partir de ahí, puedes comprobar todas las páginas enlazadas y buscar errores 404.

Cómo solucionar los errores 404 suaves

Las herramientas de rastreo no detectarán un soft 404 porque no es un error 404. Pero puede utilizar las herramientas de rastreo para detectar algo más.

Aquí hay algunas cosas que se pueden encontrar:

  • Contenido delgado: Algunas herramientas de rastreo informan de las páginas que tienen poco contenido junto con un recuento de palabras clasificable. Comience con las páginas con la menor cantidad de palabras para evaluar si la página tiene contenido delgado.
  • Contenido duplicado: Algunas herramientas de rastreo son lo suficientemente sofisticadas como para discernir qué porcentaje de la página es contenido de plantilla. Y también hay herramientas hechas específicamente para encontrar contenido duplicado interno como SiteLiner. Si el contenido principal es casi el mismo que el de muchas otras páginas, debería investigar estas páginas y determinar por qué existe contenido duplicado en su sitio.


Aparte de las herramientas de rastreo, también puede utilizar Google Search Console y comprobar los errores de rastreo para encontrar las páginas que aparecen en los 404 suaves.

El rastreo de un sitio completo para encontrar los problemas que causan los soft 404 le permite localizar y corregir los problemas antes de que Google los detecte.

Una vez detectados estos problemas de soft 404, deberá corregirlos.

La mayoría de las veces, las soluciones parecen ser de sentido común. Esto puede incluir cosas sencillas como ampliar las páginas con poco contenido o sustituir el contenido duplicado por otro nuevo y único.

A lo largo de este proceso, aquí hay algunas cosas a considerar:

Consolidar páginas

A veces, el contenido delgado es causado por ser demasiado específico con el tema de la página, dejándolo con poco que decir.

Fusionar varias páginas con poco contenido en una sola puede ser más apropiado si los temas están relacionados. Esto no sólo resuelve los problemas de contenido débil, sino que también puede solucionar los problemas de contenido duplicado.

Por ejemplo, un sitio de comercio electrónico que vende zapatos en diferentes colores y tamaños puede tener una URL diferente para cada combinación de tamaño y color. Esto deja un gran número de páginas con contenido escaso y relativamente idéntico.

El enfoque más eficaz es poner todo esto en una sola página y enumerar las opciones disponibles.

Encontrar los problemas técnicos que causan el contenido duplicado

Utilizando incluso la herramienta de rastreo web más sencilla, como Xenu (que no mira el contenido, sino sólo las URL, los códigos de respuesta y las etiquetas de título), puede encontrar problemas de contenido duplicado mirando las URL.

Esto incluye URLs www vs. no www, HTTP y HTTPS, con index.html y sin, con parámetros de seguimiento y sin, etc.

Errores 404 y errores soft 404

Lo más importante que hay que recordar sobre los errores 404 es que si las páginas están realmente perdidas, entonces no hay nada que arreglar. Está bien mostrar una respuesta 404 para solicitudes de páginas que no existen.

Pero si las páginas existen pero en una URL diferente, entonces es algo que hay que arreglar redirigiendo un enlace roto a la URL real, restaurando una página que falta, o redirigiendo la antigua URL a una nueva página que la sustituya.

Un soft 404 es siempre el resultado de un problema que debe ser diagnosticado y solucionado.

Entender la diferencia entre los 404 es esencial para mantener un sitio web funcionando al máximo rendimiento.
Una página web ha desaparecido y el servidor envía el estado 200 OK.

admin

Entradas recientes

Cómo Escoger la Mejor Empresa de Diseño Web en Venezuela

Si buscas una empresa de diseño web en Venezuela, hay varios factores que debes considerar…

2 años hace

Google revela las principales tendencias de búsqueda para Halloween 2022

Google actualiza su sitio web Halloween Frightgeist con los últimos datos de búsqueda sobre las…

2 años hace

Cómo indexar su sitio antes del lanzamiento y por qué es importante

Es importante indexar su sitio en los motores de búsqueda antes del lanzamiento oficial. He…

2 años hace

5 consejos para captar ventas de última hora en el comercio electrónico

Desde los temporizadores de cuenta atrás hasta las tácticas de gamificación, he aquí cómo crear…

3 años hace

SEO para FinTechs, ¿Qué es?

La expresión SEO para FinTechs actualmente es muy usada por las personas que se dedican…

3 años hace

Anuncios de Google, consejos para tu copy

Los Anuncios de Google han ido cambiando con el pasar del tiempo. Actualmente se cuenta…

3 años hace

Esta web usa cookies.