El Blog para Webmasters
Noticias en castellano sobre el rastreo e indexación de sitios web en el buscador Google
SMX Advanced. Sesión de preguntas y respuestas
lunes, 17 de agosto de 2009
A principios de este verano se celebró el
SMX Advanced
[inglés]
en Seattle. Allí me hicieron una serie de preguntas para las que tuve que hacer un poco de investigación. Y, como prometí, aquí están las respuestas:
P.
Hemos oído que Google
indexa mejor ahora
el
contenido Flash
. Si tengo un archivo Flash que obtiene contenido de un archivo externo y el archivo externo está bloqueado por
robots.txt
, ¿indexará Google dicho contenido (que no está bloqueado directamente por robots.txt) o no?
R.
No vamos a ser capaces de acceder a ese contenido si se encuentra en un archivo que bloquea robots.txt, por lo tanto, a pesar de que el contenido será visible para los usuarios (a través del Flash), los robots no podrán acceder al contenido. Para obtener más detalles al respecto, puedes
consultar nuestra entrada sobre indexación de contenido Flash cargado desde fuentes externas
.
P.
Los sitios que personalizan contenido según el comportamiento de los usuarios o "clickstream" son cada vez más comunes. Si un usuario hace clic en mi sitio mediante una página de resultados de búsqueda, ¿se puede personalizar el contenido de esa página o redirigir al usuario según la consulta de búsqueda que realizó? ¿O se consideraría
encubrimiento (cloaking)
? Por ejemplo, si alguien busca [colgante camafeo vintage], pero hace clic en una página web general sobre joyería vintage, ¿puedo redirigir a mi página específica sobre colgantes camafeo vintage, ya que sé que es éso lo que estaba buscando?
R.
Si rediriges o sirves al usuario un contenido diferente al que Googlebot vería en esa URL (por ejemplo, según el referrer de google.com o la cadena de consulta), se consideraría encubrimiento (cloaking). Si el usuario decide hacer clic en el resultado "joyas vintage", deberías mostrarle la página en la que ha hecho clic, aun creyendo que otra página podría ser más adecuada. Siempre puedes enlazar entre páginas relacionadas (es decir, enlazar a tu página de "joyería vintage" desde tu página de "camafeos vintage" y viceversa, de modo que cualquier persona pueda navegar entre ambas páginas. Pero no creas que eres tú quien debe tomar esa decisión por el usuario.
P.
Aunque se trata de mostrar un contenido diferente a diferentes usuarios, Google considera ético el hecho de probar sitios web (tales pruebas A/B o multivariante) una práctica legítima que respeta las Directrices para webmasters. Una de las razones de esto es porque mientras los motores de búsqueda sólo pueden ver el contenido original de la página y no el de las diferentes variaciones, también habrá un porcentaje de usuarios que verán ese mismo contenido, por lo que esta técnica no está orientada específicamente a los motores de búsqueda.
Sin embargo, algunos servicios de pruebas recomiendan enviar el 100% del tráfico de un sitio web a la combinación ganadora tras realizarse el experimento, para verificar que las tasas de conversión se mantienen altas. ¿Cómo encaja todo esto dentro de la definición de encubrimiento (cloaking) de Google?
R.
Está bien ejecutar el 100% del tráfico a través de una combinación durante un período de tiempo breve, para verificar los resultados de tu experimento. Sin embargo, como ya
hemos afirmado
anteriormente, "si encontramos un sitio que ejecuta una única combinación no original en un 100% durante varios meses ... es posible que eliminemos el sitio de nuestro índice." Si deseas confirmar los resultados de tu experimento, pero estás preocupado por "cuanto tiempo se considera demasiado tiempo", considera la posibilidad de realizar una prueba de seguimiento en la que envías la mayor parte de tu tráfico a través de tu combinación ganadora mientras que aún envías un pequeño porcentaje a la página original como forma de control.
Esto es lo que Google recomienda
con su propia herramienta de prueba, Website Optimizer.
P.
Si la codificación de caracteres especificada en la cabecera HTTP de una página es diferente a la especificada en la etiqueta <meta equiv = "Content-Type"> ¿a cuál prestará atención Google?
R.
Tendremos a ambas en cuenta, y también miraremos un poco el contenido de la página. La mayoría de los navegadores dan prioridad a la codificación específica en la cabecera HTTP, antes que a la que se especifica en el código HTML, si ambas son válidas pero diferentes. Sin embargo, si eres consciente de que son diferentes, lo mejor es que elijas uno de ellos.
P.
¿Cómo trata Google los caracteres internacionales con codificación UTF-8 de byte triple en una dirección URL (como por ejemplo los caracteres del chino o del japonés)? Este tipo de caracteres dan problemas en algunas aplicaciones, ¿puede Google procesarlos correctamente? ¿Google comprende las palabras clave codificadas de esta manera? Es decir, se entiende que
www.example.com/%E9%9D%B4
es tan relevante como
www.example.com/shoes
?
R.
Podemos interpretar correctamente caracteres UTF-8 con código % de escape en las URL y en los parámetros de consulta, y entendemos las palabras clave que están codificadas así. Para caracteres internacionales en nombres de dominio, recomendamos utilizar
punycode
en lugar de codificación con código de escape %, ya que algunos navegadores más antiguos (como IE6) no soportan nombres de dominio con caracteres que no sean ASCII.
¿Tienes alguna pregunta más? ¡Pásate por nuestro
foro
!
Publicado por Susan Moskwa, Webmaster Trends Analyst. Traducido por Cristina, equipo de Calidad de búsqueda.
Etiquetas
Academia para webmasters
4
accesibilidad
27
acciones
1
acciones manuales
4
ajax
1
alt
1
amp
10
analíticas de Google
1
angular universal
1
anomalias
1
api
2
api psi
1
api search analytics
2
articulos
2
artículos
1
asistente
1
avanzado
16
blog
2
Botón +1
7
búsqueda
2
busqueda de google
1
calidad
1
casos de exito
1
centro de ayuda
1
centro de datos
1
certificación
1
certificado
1
chrome
3
chromium
1
cobertura del índice
3
cocina
1
codelab
1
codigo fuente
1
colaboradores principales
1
comentarios
1
comunicación
23
comunidad
1
conexión cifrada
1
consejos
99
consola de firebase
1
contenido
1
contenido duplicado
1
criterios de posicionamiento
2
cuadro de busqueda
2
danny sullivan
1
data-nosnippet
1
datos agregados
1
datos de campo
1
datos de experimentos
1
datos estructurados
16
dcl
1
desarrolladores
2
devtools
1
diagnostico
1
directrices para webmasters
30
directrices tecnicas
1
discover
1
diseño adaptable
1
DOM Content Loaded
1
dominio
1
empleo
3
empresa local
1
enlaces
9
enlaces artificiales
1
enlaces fraudulentos
1
errores de marcado
1
evaluadores
1
event
1
eventbrite
1
evento global
1
eventos
23
experiencia de usuario
1
experto de producto
1
experto producto
1
expertos de producto
2
expertos producto
2
express.js
1
facturacion
1
faq
1
fcp
1
fechas
2
ficha de empresa
1
First Contentful Paint
1
flujo de validación de problemas
1
foro
26
foro de editores
1
fragmentos de texto
1
fragmentos destacados
1
github
1
google analytics
1
google cloud platform
1
google i/o
1
google imágenes
2
google news
1
google noticias
1
google play instant
1
guía inicio rápido
1
guia seo
1
herramientas para webmasters
123
home
1
horas
1
html
5
http
1
https
3
imagenes
1
indexacion
2
indexing
1
informe de recetas
1
informe de rendimiento
5
informe de transparencia
1
informe spam
1
inspección de url
4
iso 8601
1
javascript
1
jobposting
2
jobrapido
1
kitten corner
1
lighthouse
3
logotipo
2
max-image-preview
1
max-snippet
1
max-video-preview
1
metaetiqueta
1
mfi
1
middleware
1
móvil
21
moviles
1
navegación segura
2
no segura
1
no seguro
1
nosnippet
1
optimizar sitio web
1
oro
1
pagespeed
3
penguin
1
pki
1
plata
1
platino
1
politicas de contenido
1
prácticas recomendadas
2
preguntas y respuestas
1
producto
1
productos y servicios
40
prueba de optimizacion para moviles
1
rakuten
1
rastreo e indexación
100
recaptcha
1
receta
1
recetas
1
reconsideraciones
2
renderizado dinamico
1
Rendertron
1
rendimiento
12
reseña
1
resultados de búsqueda
94
resultados enriquecidos
2
robot
1
robot noindex
1
ruta de navegacion
1
safe browsing
1
Search Console
20
seguridad
13
servidor
1
site clinic
10
Site Reliability Engineering
1
sitemaps
14
sitios pirateados
1
software malicioso
1
software no deseado
1
spam
2
ssl
1
symantec
1
tarifas
1
titulares
1
tls
1
twitter
4
url
1
url canonica
1
url canonicas
1
url de referencia
1
usuarios destacados
1
velocidad
3
verificacion dns
1
vídeo
82
videos
1
web light
1
webmaster
2
webspam
3
youtube
1
zona horaria
1
Archivo del blog
2020
nov
sept
ago
jul
jun
may
abr
mar
feb
ene
2019
dic
nov
oct
sept
jun
abr
mar
feb
ene
2018
dic
nov
oct
jul
jun
may
abr
feb
ene
2017
dic
nov
sept
ago
jul
jun
abr
mar
ene
2016
nov
sept
ago
may
abr
mar
ene
2015
dic
nov
oct
sept
ago
jul
may
abr
mar
ene
2014
nov
oct
sept
ago
jun
may
abr
mar
feb
ene
2013
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2012
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2011
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2010
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2009
dic
nov
oct
sept
ago
Antigüedad del dominio y acortadores de URL. Vídeo...
RDFa: Especifica la licencia de una imagen
Nuevas herramientas de Google para sitios web
La búsqueda en Twitter y su PageRank. Vídeos de Ma...
SMX Advanced. Sesión de preguntas y respuestas
Ubicación del servidor y metaetiquetas geográficas...
Ayúdanos a probar infraestructura de nueva generación
Optimización del rastreo y la indexación
Sobreoptimización y tiempos de carga. Vídeos de Ma...
Usabilidad y accesibilidad
jul
jun
may
abr
mar
feb
ene
2008
dic
nov
oct
sept
Feed
Follow @googlewmc
Recursos para webmasters
Foro para Webmasters
Centro de Asistencia
Google Search Console
Google Webmaster en castellano