El Blog para Webmasters
Noticias en castellano sobre el rastreo e indexación de sitios web en el buscador Google
Sugerencias para webmasters y proveedores de alojamiento
martes, 20 de marzo de 2012
Algunos webmasters de nuestros foros han publicado consultas sobre incidencias relacionadas con el alojamiento que afectan a sus sitios. Para ayudar a los proveedores de alojamiento y a los webmasters a reconocer, diagnosticar y solucionar tales incidencias, nos gustaría compartir con los usuarios algunas de las incidencias habituales que hemos encontrado y sugerencias para solucionarlas.
Bloqueo del rastreo de Googlebot
: esta es una incidencia muy habitual que normalmente suele deberse a la configuración incorrecta de un cortafuegos o del sistema de protección DoS y, en algunas ocasiones, al sistema de administración de contenido que utiliza el sitio. Los sistemas de protección juegan un papel importante en el alojamiento y se suelen configurar para bloquear (en algunos casos, automáticamente) niveles inusualmente elevados de solicitudes del servidor. No obstante, como Google a menudo lleva a cabo más solicitudes que un usuario humano, estos sistemas de protección pueden impedir que Googlebot rastree tu sitio web. Para comprobar si se produce este tipo de incidencia, utiliza la función
Explorar como Googlebot
de las Herramientas para webmasters de Google. Comprueba también si existen otros de los
errores de rastreo
que se incluyen en las Herramientas para webmasters de Google.
Ofrecemos diversas herramientas para los webmasters y los proveedores de alojamiento que quieran tener un mayor control sobre el rastreo de Googlebot y para mejorar la eficacia del rastreo:
Ofrecemos ayuda detallada sobre cómo controlar el rastreo de Googlebot a través del
protocolo de exclusión de robots
y la
configuración de parámetros de URL
;
Si te preocupan los robots malintencionados que utilizan el user-agent de Googlebot, te ofrecemos una forma de
comprobar si un rastreador es realmente Googlebot
.
Si quieres modificar la frecuencia con la que Googlebot rastrea tu sitio, puedes verificar tu sitio en las Herramientas para webmasters de Google y
modificar la frecuencia de rastreo de Googlebot
. Los proveedores de alojamiento también pueden verificar en las Herramientas para webmasters la propiedad de sus direcciones IP.
Problemas de disponibilidad
: un tipo de incidencia que se produce en sitios web que no están disponibles cuando Googlebot (y los usuarios) intentan acceder a los mismos. Esto incluye incidencias de DNS; sobrecarga de los servidores, que provocan errores de tiempo de espera y la denegación de conexiones; y la configuración incorrecta de redes de distribución de contenido, entre otros tipos de errores. Cuando Googlebot detecta este tipo de incidencias, informamos de las mismas en las Herramientas para webmasters de Google como
errores de URL inaccesible
o
errores de rastreo
.
Certificados SSL no válidos
: para que los certificados SSL de tu sitio web se consideren válidos, deben coincidir con el nombre del sitio. Entre las incidencias habituales se incluyen certificados SSL caducados y servidores configurados incorrectamente de forma que todos los sitios web del servidor utilizan el mismo certificado. La mayoría de navegadores web intentará advertir a los usuarios en estas situaciones, mientras que Google intenta avisar a los webmasters de la incidencia mediante el envío de un mensaje a través de las Herramientas para webmasters de Google. La solución para estas incidencias consiste en comprobar que se utilizan certificados SSL válidos para todos los dominios y los subdominios del sitio web con los que los usuarios interactuarán.
DNS comodín
: los sitios web se pueden configurar para responder a todas las solicitudes de subdominio. Por ejemplo, el sitio web de la URL example.com se puede configurar para responder a las solicitudes de tal.example.com, talcual.example.com y otros subdominios.
Existen ciertos casos en los que se recomienda esta configuración. Por ejemplo, un sitio web de contenido generado por usuarios puede optar por proporcionar a cada cuenta su propio subdominio. Sin embargo, en algunos casos el webmaster puede que no quiera utilizar esta configuración, ya que puede provocar que el contenido se duplique innecesariamente en todos los nombres de host y también puede afectar al rastreo de Googlebot.
Para reducir el número de incidencias relacionadas con la configuración de un DNS comodín, configura tu sitio web para que no lo utilice o configura el servidor para que no responda exitosamente a nombres de host no existentes denegando la conexión o devolviendo un encabezado HTTP 404.
Configuración incorrecta del alojamiento virtual
: esta incidencia consiste en que muchos hosts o nombres de dominio alojados en el mismo servidor devuelven siempre el contenido de un único sitio, es decir, a pesar de que el servidor aloja varios sitios, solo devuelve uno independientemente del contenido que se solicite. Para detectar esta incidencia, debes comprobar que el servidor responde correctamente al encabezado HTTP del host.
Contenido duplicado en todas las URL específicas de alojamiento
: muchos hosts ofrecen URL para tu sitio web para realizar pruebas o actividades de desarrollo. Por ejemplo, si alojas el sitio web http://a.com/ en el proveedor de alojamiento example.com, el host puede ofrecerte acceso a tu sitio a través de una URL como las siguientes: http://a.example.com/ o http://example.com/~a/. Te recomendamos que configures las URL específicas de alojamiento para que no se pueda acceder a ellas públicamente (protección mediante contraseña). En caso de que estas URL sean accesibles, nuestros algoritmos elegirán normalmente la URL que los webmasters quieran. Si nuestros algoritmos
seleccionan en vez las URL específicas de alojamiento
, puedes hacer que estos elijan tus URL preferidas implementando correctamente
técnicas de canonicalización
.
Páginas de error leve
: algunos proveedores de alojamiento muestran páginas de error que utilizan un código de estado HTTP 200 (que significa "correcto") en lugar de un código de estado de error HTTP. Por ejemplo, un mensaje de error de página no encontrada podría devolver un código HTTP 200 en lugar de un código HTTP 404, convirtiéndola en una página de
error 404 leve
, o un mensaje de sitio web temporalmente no disponible podría devolver un código de error 200 en lugar del código de estado HTTP 503 adecuado. Aunque intentamos detectar las páginas de error leve, si nuestros algoritmos no detectasen las páginas de error leve de un host web, estas podrían indexarse con el contenido de error. Esto puede provocar incidencias relacionadas con la clasificación o con la
selección de URL entre dominios
.
Puedes comprobar el código de estado que se devuelve de forma sencilla: comprueba los encabezados HTTP que devuelve el servidor utilizando una de las herramientas disponibles como, por ejemplo, la función
Explorar como Googlebot
. Si una página de error devuelve un código HTTP 200, cambia la configuración para devolver el código de estado de error HTTP correcto. Asimismo, permanece atento a los informes de errores 404 leves de las Herramientas para webmasters de Google que se incluyen en la página de errores de rastreo de la sección de diagnósticos.
Marcos y modificación de contenido
: los proveedores de alojamiento pueden modificar inesperadamente el contenido de la página de los webmasters normalmente mediante la inclusión de secuencias de comando o de imágenes en la página. Los hosts web también pueden ofrecer tu contenido en otras páginas a través de marcos o iframes. Para comprobar si un host web está modificando tu contenido de forma inesperada, consulta el código fuente de la página que ofrece el host y compáralo con el código que subiste.
Ten en cuenta que ciertas modificaciones del código del servidor pueden ser de gran utilidad. Por ejemplo, un servidor que utilice el
módulo para Apache mod_pagespeed
u otras herramientas puede reducir tu código para optimizar la velocidad de las páginas.
Spam y software malintencionado
: hemos comprobado que algunos hosts web y servicios de subdominios masivos son importantes fuentes de spam y software malintencionado. En Google, intentamos ser precisos al proteger a nuestros usuarios y la calidad de búsqueda. Sin embargo, si comprobamos que un importante grupo de sitios de un host web específico incluye spam o distribuye software malintencionado, nos veremos obligados a tomar medidas sobre el host web en su totalidad. Consulta los siguientes artículos para obtener más información sobre el control del software malintencionado:
La entrada de blog sobre
alertas de navegación segura para administradores de red
(Inglés), útil para los proveedores de alojamiento.
El artículo sobre
notificaciones de software malintencionado de las Herramientas para webmasters de Google
se debe tener en cuenta para sitios web individuales.
La documentación de
API de Google Safe Browsing
para los desarrolladores.
Esperamos que estos artículos ayuden a proveedores de alojamiento y a webmasters a detectar y solucionar estas incidencias. Además de estos artículos, también debes tener en cuenta los aspectos cualitativos del alojamiento, como la calidad del servicio y la utilidad de la asistencia. Como siempre, si tienes preguntas o necesitas ayuda adicional, publica tu consulta en el
foro de ayuda para webmasters
.
Por
Pierre Far
, analista de tendencias de webmasters
Etiquetas
Academia para webmasters
4
accesibilidad
27
acciones
1
acciones manuales
4
ajax
1
alt
1
amp
10
analíticas de Google
1
angular universal
1
anomalias
1
api
2
api psi
1
api search analytics
2
articulos
2
artículos
1
asistente
1
avanzado
16
blog
2
Botón +1
7
búsqueda
2
busqueda de google
1
calidad
1
casos de exito
1
centro de ayuda
1
centro de datos
1
certificación
1
certificado
1
chrome
3
chromium
1
cobertura del índice
3
cocina
1
codelab
1
codigo fuente
1
colaboradores principales
1
comentarios
1
comunicación
23
comunidad
1
conexión cifrada
1
consejos
99
consola de firebase
1
contenido
1
contenido duplicado
1
criterios de posicionamiento
2
cuadro de busqueda
2
danny sullivan
1
data-nosnippet
1
datos agregados
1
datos de campo
1
datos de experimentos
1
datos estructurados
16
dcl
1
desarrolladores
2
devtools
1
diagnostico
1
directrices para webmasters
30
directrices tecnicas
1
discover
1
diseño adaptable
1
DOM Content Loaded
1
dominio
1
empleo
3
empresa local
1
enlaces
9
enlaces artificiales
1
enlaces fraudulentos
1
errores de marcado
1
evaluadores
1
event
1
eventbrite
1
evento global
1
eventos
23
experiencia de usuario
1
experto de producto
1
experto producto
1
expertos de producto
2
expertos producto
2
express.js
1
facturacion
1
faq
1
fcp
1
fechas
2
ficha de empresa
1
First Contentful Paint
1
flujo de validación de problemas
1
foro
26
foro de editores
1
fragmentos de texto
1
fragmentos destacados
1
github
1
google analytics
1
google cloud platform
1
google i/o
1
google imágenes
2
google news
1
google noticias
1
google play instant
1
guía inicio rápido
1
guia seo
1
herramientas para webmasters
123
home
1
horas
1
html
5
http
1
https
3
imagenes
1
indexacion
2
indexing
1
informe de recetas
1
informe de rendimiento
5
informe de transparencia
1
informe spam
1
inspección de url
4
iso 8601
1
javascript
1
jobposting
2
jobrapido
1
kitten corner
1
lighthouse
3
logotipo
2
max-image-preview
1
max-snippet
1
max-video-preview
1
metaetiqueta
1
mfi
1
middleware
1
móvil
21
moviles
1
navegación segura
2
no segura
1
no seguro
1
nosnippet
1
optimizar sitio web
1
oro
1
pagespeed
3
penguin
1
pki
1
plata
1
platino
1
politicas de contenido
1
prácticas recomendadas
2
preguntas y respuestas
1
producto
1
productos y servicios
40
prueba de optimizacion para moviles
1
rakuten
1
rastreo e indexación
100
recaptcha
1
receta
1
recetas
1
reconsideraciones
2
renderizado dinamico
1
Rendertron
1
rendimiento
12
reseña
1
resultados de búsqueda
94
resultados enriquecidos
2
robot
1
robot noindex
1
ruta de navegacion
1
safe browsing
1
Search Console
20
seguridad
13
servidor
1
site clinic
10
Site Reliability Engineering
1
sitemaps
14
sitios pirateados
1
software malicioso
1
software no deseado
1
spam
2
ssl
1
symantec
1
tarifas
1
titulares
1
tls
1
twitter
4
url
1
url canonica
1
url canonicas
1
url de referencia
1
usuarios destacados
1
velocidad
3
verificacion dns
1
vídeo
82
videos
1
web light
1
webmaster
2
webspam
3
youtube
1
zona horaria
1
Archivo del blog
2020
nov
sept
ago
jul
jun
may
abr
mar
feb
ene
2019
dic
nov
oct
sept
jun
abr
mar
feb
ene
2018
dic
nov
oct
jul
jun
may
abr
feb
ene
2017
dic
nov
sept
ago
jul
jun
abr
mar
ene
2016
nov
sept
ago
may
abr
mar
ene
2015
dic
nov
oct
sept
ago
jul
may
abr
mar
ene
2014
nov
oct
sept
ago
jun
may
abr
mar
feb
ene
2013
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2012
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
Cómo conseguir que tu servicio de alojamiento grat...
Sugerencias para webmasters y proveedores de aloj...
Cómo compartir el acceso a tu sitio de forma segur...
Por una búsqueda más segura
Cómo preparar tu sitio para el aumento del tráfico
feb
ene
2011
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2010
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2009
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2008
dic
nov
oct
sept
Feed
Follow @googlewmc
Recursos para webmasters
Foro para Webmasters
Centro de Asistencia
Google Search Console
Google Webmaster en castellano