Así que, ahí estás, preocupándote por tu negocio, usando las Herramientas para webmasters de Google para comprobar cuán fantástico es tu sitio web, pero... ¡espera! ¡La página
Errores de rastreo está llena de
errores 404 (no encontrado)!
¿¿Desastre inminente??
No temas, pequeño saltamontes. Vamos a echar un vistazo a los 404 y a ver cómo afectan (o no) a tu sitio:
P: ¿Afectan los errores 404 que aparecen en los informes de las Herramientas para webmasters de Google a la clasificación de mi sitio?
R: Los 404 son una parte totalmente normal de la web. Internet cambia continuamente, aparecen nuevos contenidos, otros quedan obsoletos, y cuando esto sucede (idealmente) se devuelve un código de respuesta HTTP 404. Los motores de búsqueda son conscientes de ello. Tenemos errores 404 en nuestros propios sitios, como puedes ver arriba, y los encontramos por todas partes en la web. De hecho, realmente
preferimos que, cuando te deshagas de una página de tu sitio, te asegures de devolver un código de respuesta correcto 404 o 410 (en lugar de un error 404 leve). Ten en cuenta que para que nuestro rastreador vea el código de respuesta HTTP de una URL, es necesario primero poder rastrearla. Si esa URL está bloqueada por un archivo robots.txt, no será posible rastrearla y ver el código de respuesta. El hecho de que algunas URL de un sitio dejen de existir/devuelvan la respuesta 404 no afecta a cómo se comportan las demás URL (las que devuelven el código
200 (Successful)) en los resultados de las búsquedas.
P: ¿Así que los 404 no perjudican a mi sitio en absoluto?
R: El hecho de que algunas URL de un sitio web devuelvan el código 404 no perjudica, por sí solo al sitio, ni se tiene en cuenta en los resultados de las búsquedas de Google. No obstante, existen otros motivos por los cuales quieras ocuparte de ciertos tipos de 404. Por ejemplo, si algunas de las páginas que son 404 son páginas importantes en el sitio, deberías analizar por qué encontramos un código 404 al rastrearlas. Si encuentras que una URL legítima está mal escrita, (
www.example.com/awsome en lugar de
www.example.com/awesome), es probable que alguien haya intentado enlazar con tu sitio y simplemente haya introducido una errata en la dirección. En lugar de devolver el código 404, podrías usar la redirección 301 para dirigir la URL mal escrita hacia la correcta y así capturar el tráfico procedente de ese enlace. También puedes asegurarte de que, cuando los usuarios realmente vayan a parar a una página 404 del sitio, se les
ayude a encontrar lo que buscan en lugar de decir sólo "404 Not found".
P: ¿Podríais contarme algo más acerca de los "404 leves" (soft 404s)?
R: Un
error 404 leve consiste en que un servidor web devuelve un código de respuesta distinto de 404 (o 410) a una petición de una URL que no existe. Un ejemplo frecuente es el del propietario del sitio que desea mostrar
una bonita página 404 con información útil para sus usuarios, y cree que para servir ese contenido a los usuarios debe devolver un código de respuesta 200. No es así. Es posible devolver un código de respuesta 404
mientras se sirve el contenido deseado. Otro ejemplo es el del sitio que redirige todas las URL desconocidas a su página principal en lugar de devolver códigos 404. Ambos casos pueden tener un efecto perjudicial a la hora de comprender e indexar el sitio, así que recomendamos devolver los códigos de respuesta correctos para el contenido que no existe. Ten en cuenta que por
el mero hecho de que una página diga "404 Not found" no significa que realmente devuelva el código de respuesta HTTP 404. Para comprobarlo, puedes usar la característica "
Explorar como Googlebot" de las Herramientas para webmasters de Google. Si no sabes cómo configurar tu servidor para que devuelva el código correcto, consulta la documentación de ayuda de tu alojamiento web.
P: ¿Cómo sé si una URL debería ser 404, 301 o 410?
R: Al eliminar una página de un sitio, piensa si el contenido se va a mover a otra parte, o si ese tipo de contenido ya no aparecerá más en el sitio. Si el contenido se va a mover a una URL nueva, deberías redirigir mediante 301 la URL antigua a la nueva. Así, cuando los usuarios que accedan a la URL antigua para ver ese contenido, irán a parar directamente a un contenido relacionado con lo que buscan. Si el contenido se va a eliminar por completo y no va a quedar nada en el sitio que pueda suplir la misma necesidad de los usuarios, entonces se debería devolver el código 404 o 410 al acceder a la URL antigua. Actualmente, Google trata los códigos 410 (Gone) igual que los 404 (Not found), así que no es muy importante que se devuelva uno u otro.
P: La mayoría de mis 404 tienen que ver con URL rarísimas que nunca han existido en mi sitio. ¿Qué pasa con ellas? ¿De dónde salen?
R: Si Google encuentra un enlace en alguna parte de la web que apunte a una URL de tu dominio, es posible que intente rastrear ese enlace, tanto si el contenido existe realmente como si no. En este caso, tu servidor debería devolver un código 404 si no hay nada que ver ahí. Estos enlaces se pueden deber a que alguien haya cometido un error al crear el enlace hacia tu sitio web, algún error de configuración (p. ej. si los enlaces se generan automáticamente desde un CMS), o debido a los crecientes esfuerzos de Google por reconocer y rastrear los enlaces incluidos en JavaScript y otros tipos de contenido incrustado. O bien puede deberse a una comprobación rápida por nuestra parte para ver cómo gestiona tu servidor las URL desconocidas, solo por nombrar unas cuantas posibilidades. Si ves códigos 404 en los informes de las Herramientas para webmasters de Google correspondientes a URL que no existen en tu sitio web, puedes ignorarlas sin ningún problema. No sabemos qué URL son importantes para ti y cuáles deben ser 404, así que te mostramos todos los 404 que encontramos en tu sitio y te dejamos a ti decidir cuáles requieren atención.
P: Alguien ha extraído contenido de mi sitio y ha provocado un montón de 404 en el proceso. Todas son URL "reales" metidas entre otro código, como http://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/></a... ¿Perjudicará esto a mi sitio?
R: Por lo general no debes preocuparte porque "enlaces rotos" como éste perjudiquen a tu sitio. Entendemos que los propietarios de los sitios tienen poco o ningún control sobre lo que la gente haya podido extraer de sus sitios, o sobre si enlazan hacia ellos de formas raras. Si eres un mago de
regex puedes intentar redireccionar estas URL
tal como se describe aquí [
inglés], pero normalmente no vale la pena preocuparse por ello. Recuerda que, si crees que alguien está robando contenido original de tu sitio web, también puedes realizar una
solicitud de eliminación.
P: La semana pasada resolví todos los 404 que aparecían en los informes de las Herramientas para webmasters de Google, pero siguen apareciendo en mi cuenta. ¿Significa esto que no los he corregido bien? ¿Cuánto tardan en desaparecer?
R: Mira la columna "Detectado" en la página "Errores de rastreo". En ella verás la fecha más reciente de detección de cada error. Si las fechas de la columna son anteriores al momento en que resolviste el error, significa que no han vuelto a detectarse desde esa fecha. Si las fechas son más recientes, significa que seguimos encontrando esos errores 404 durante el rastreo. Después de implementar una solución, puedes comprobar si nuestro rastreador ve el nuevo código de respuesta usando la opción "
Explorar como Googlebot". Prueba unas cuantas URL. Si tienen buen aspecto, los errores deberían comenzar a desaparecer pronto de la lista de errores de rastreo.
P: ¿Puedo usar la herramienta de eliminación de URL de Google para que los errores 404 desaparezcan más rápidamente de mi cuenta?
R: No. La herramienta de eliminación no suprime las URL de la cuenta de Herramientas para webmasters, sino de los resultados de búsqueda de Google. Está diseñada solo para atender solicitudes urgentes, y no es necesario usarla cuando una URL ya devuelve el código 404, ya que dicha URL dejará de aparecer en los resultados de búsqueda por si sola con el tiempo. Consulta la parte inferior de esta
entrada de blog para obtener más detalles sobre la herramienta de eliminación de URL y lo que puede y no puede hacer por ti.
¿Quieres aún más información sobre códigos 404? Consulta el contenido sobre
los 404 que hemos publicado en nuestro blog, o visita el
Foro de ayuda para webmasters.
Publicado por Susan Moskwa, analista de Webmaster Trends