Los errores 404 y soft 404 son diferentes tipos de problemas que requieren diferentes enfoques para diagnosticarlos y solucionarlos.
Aunque ambos se denominan 404, son muy diferentes.
Por lo tanto, es esencial entender la diferencia entre los errores para solucionarlos.
Una página web a la que se accede mediante un navegador responde con un código de estado que comunica si la solicitud ha tenido éxito y, si no, por qué no lo ha tenido.
Estas respuestas se comunican con lo que se conoce como códigos de respuesta HTTP, pero oficialmente se llaman códigos de estado HTTP.
Un servidor proporciona cinco categorías de códigos de respuesta; este artículo trata específicamente de una respuesta, el código de estado 404 página no encontrada.
Todos los códigos dentro de la serie de respuestas 4xx significan que la solicitud no pudo ser satisfecha porque la página no fue encontrada.
4xx (Error del cliente): La solicitud contiene una sintaxis incorrecta o no puede cumplirse
La respuesta 404 es ambigua en cuanto a si la página web puede volver.
La documentación oficial es clara sobre la ambigüedad de si una página ha desaparecido temporal o permanentemente:
En resumen, el código 404 de página no encontrada significa que hubo un error en la solicitud del navegador porque no se pudo encontrar la página solicitada.
Un error soft 404 no es un código de estado oficial. El servidor no envía una respuesta soft 404 a un navegador porque no existe un código de estado soft 404.
El soft 404 describe una situación en la que el servidor presenta una página web y responde con un código de estado 200 OK, indicando éxito cuando la página web o el contenido en realidad han desaparecido.
Este tipo de soft 404 ocurre cuando falta una página, pero la configuración del servidor redirige la página que falta a la página principal o a una URL personalizada.
La página ha desaparecido, pero el editor ha hecho algo para cumplir con la solicitud de la página que falta.
Cuando el contenido falta por completo o es muy escaso (es decir, el contenido es escaso), el servidor responderá con un código de estado 200, lo que significa que la solicitud de la página se ha realizado correctamente.
Pero para indexar las páginas web que no son peticiones de páginas web exitosas, los motores de búsqueda llaman a esto soft 404s.
Algunos creen erróneamente que hay algo malo en una respuesta de error 404.
Por lo tanto, para detener las respuestas de error 404, un editor puede redirigir la página que falta a la página principal, aunque la página principal no sea lo que se solicitó.
Google denomina a estas solicitudes de páginas fallidas 404 suaves.
A veces, las páginas que faltan se redirigen a una página web personalizada que sirve un código de estado 200, lo que hace que Google etiquete estas páginas como soft 404.
El concepto de un soft 404 puede tener su origen en un documento de investigación de 2004 titulado Towards an Understanding of the Web’s Decay (PDF).
Las páginas que faltan y que son sustituidas de forma incorrecta suponen un problema para los motores de búsqueda que intentan indexar páginas reales.
«Según el protocolo HTTP, cuando se solicita a un servidor una página que ya no está disponible, el servidor debe devolver un código de error…
…de hecho, muchos servidores, incluidos los más reputados, no devuelven un código 404; en su lugar, los servidores devuelven una página sustituta y un código OK (200).
…Nuestro estudio muestra que este tipo de sustituciones, denominadas «soft-404″, representan más del 15% de los enlaces muertos».
Hay casos en los que la página no ha desaparecido, sino que problemas específicos (como errores de codificación) han hecho que Google la categorice como página desaparecida.
Los 404 suaves son esenciales para investigar porque podrían indicar un código roto.
Si la causa del 404 es un error de enlace, hay que arreglar los enlaces.
La parte complicada de esta tarea es encontrar todos los enlaces rotos de un sitio. Puede ser más difícil rastrear sitios grandes y complejos con miles o millones de páginas.
En casos como éste, las herramientas de rastreo son muy útiles.
Hay muchas opciones de software de rastreo de sitios para elegir: los gratuitos Xenu y Greenflare; o software de pago como Screaming Frog, DeepCrawl, Botify, Sitebulb y OnCrawl, donde varios de ellos tienen versiones de prueba gratuitas o versiones gratuitas pero con funciones limitadas.
Cuando una página ya no existe, tiene dos opciones:
Redirigirla a la página relacionada más cercana si la eliminación fue a propósito.
En primer lugar, hay que localizar todos los errores de vinculación del sitio. Al igual que para encontrar todos los errores de enlace de un sitio web a gran escala, puede utilizar herramientas de rastreo.
Sin embargo, es posible que las herramientas de rastreo no encuentren las páginas huérfanas: páginas que no están enlazadas desde ninguna parte de los enlaces de navegación ni desde ninguna de las páginas.
Las páginas huérfanas pueden existir si antes formaban parte del sitio web y, después de un rediseño del mismo, el enlace que iba a esta antigua página desaparece, pero los enlaces externos de otros sitios web podrían seguir enlazando con ellas.
Para comprobar si este tipo de páginas existen en su sitio, puede utilizar varias herramientas.
El informe Cobertura enumera las URL de error 404 de un sitio web.
No encontrará un informe de páginas perdidas en Google Analytics por defecto. Sin embargo, puede realizar un seguimiento de diferentes maneras.
Por un lado, puede crear un informe personalizado y segmentar las páginas con un título de página que mencione Error 404 – Página no encontrada.
Otra forma de encontrar páginas huérfanas en Google Analytics es crear agrupaciones de contenido personalizadas y asignar todas las páginas 404 a un grupo de contenido.
No se puede utilizar el comando de búsqueda site: para encontrar errores 404 porque Google no indexa las páginas web 404 ni las páginas web soft 404.
El operador de búsqueda site: de Google es útil para encontrar páginas web en un sitio que contengan una frase de palabras clave específica en el contenido de las páginas web.
Search Console de Google es la mejor fuente para identificar una lista de 404 suaves y 404 regulares.
Los registros de errores de tráfico del sitio web son una fuente útil para identificar las respuestas de error 404.
Las herramientas de investigación de backlinks como Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools y CognitiveSEO también pueden ayudar.
La mayoría de estas herramientas exportarán una lista de backlinks que enlazan con tu dominio. A partir de ahí, puedes comprobar todas las páginas enlazadas y buscar errores 404.
Las herramientas de rastreo no detectarán un soft 404 porque no es un error 404. Pero puede utilizar las herramientas de rastreo para detectar algo más.
Aquí hay algunas cosas que se pueden encontrar:
Aparte de las herramientas de rastreo, también puede utilizar Google Search Console y comprobar los errores de rastreo para encontrar las páginas que aparecen en los 404 suaves.
El rastreo de un sitio completo para encontrar los problemas que causan los soft 404 le permite localizar y corregir los problemas antes de que Google los detecte.
Una vez detectados estos problemas de soft 404, deberá corregirlos.
La mayoría de las veces, las soluciones parecen ser de sentido común. Esto puede incluir cosas sencillas como ampliar las páginas con poco contenido o sustituir el contenido duplicado por otro nuevo y único.
A lo largo de este proceso, aquí hay algunas cosas a considerar:
A veces, el contenido delgado es causado por ser demasiado específico con el tema de la página, dejándolo con poco que decir.
Fusionar varias páginas con poco contenido en una sola puede ser más apropiado si los temas están relacionados. Esto no sólo resuelve los problemas de contenido débil, sino que también puede solucionar los problemas de contenido duplicado.
Por ejemplo, un sitio de comercio electrónico que vende zapatos en diferentes colores y tamaños puede tener una URL diferente para cada combinación de tamaño y color. Esto deja un gran número de páginas con contenido escaso y relativamente idéntico.
El enfoque más eficaz es poner todo esto en una sola página y enumerar las opciones disponibles.
Utilizando incluso la herramienta de rastreo web más sencilla, como Xenu (que no mira el contenido, sino sólo las URL, los códigos de respuesta y las etiquetas de título), puede encontrar problemas de contenido duplicado mirando las URL.
Esto incluye URLs www vs. no www, HTTP y HTTPS, con index.html y sin, con parámetros de seguimiento y sin, etc.
Lo más importante que hay que recordar sobre los errores 404 es que si las páginas están realmente perdidas, entonces no hay nada que arreglar. Está bien mostrar una respuesta 404 para solicitudes de páginas que no existen.
Pero si las páginas existen pero en una URL diferente, entonces es algo que hay que arreglar redirigiendo un enlace roto a la URL real, restaurando una página que falta, o redirigiendo la antigua URL a una nueva página que la sustituya.
Un soft 404 es siempre el resultado de un problema que debe ser diagnosticado y solucionado.
Entender la diferencia entre los 404 es esencial para mantener un sitio web funcionando al máximo rendimiento.
Una página web ha desaparecido y el servidor envía el estado 200 OK.
Si buscas una empresa de diseño web en Venezuela, hay varios factores que debes considerar…
Google actualiza su sitio web Halloween Frightgeist con los últimos datos de búsqueda sobre las…
Es importante indexar su sitio en los motores de búsqueda antes del lanzamiento oficial. He…
Desde los temporizadores de cuenta atrás hasta las tácticas de gamificación, he aquí cómo crear…
La expresión SEO para FinTechs actualmente es muy usada por las personas que se dedican…
Los Anuncios de Google han ido cambiando con el pasar del tiempo. Actualmente se cuenta…
Esta web usa cookies.