El Blog para Webmasters
Noticias en castellano sobre el rastreo e indexación de sitios web en el buscador Google
Nuevo agente de usuario (user-agent) para Noticias
miércoles, 9 de diciembre de 2009
Anunciamos un nuevo agente de usuario (user-agent) para el archivo
robots.txt
, que se llama Googlebot-News, y que proporciona a los editores incluso más control sobre su contenido. En caso de que no hayas oído hablar sobre el archivo robots.txt, es un estándar de Internet que se lleva usando
desde 1994
y que ha sido adoptado por todos los principales motores de búsqueda y todos los "robots" que procesan la web de forma adecuada. Cuando un motor de búsqueda mira si tiene permiso para rastrear e indexar una página web, el mecanismo de "mira si tenemos permiso para rastrear esas páginas" está en el archivo robots.txt.
Los editores podrían fácilmente contactar con nosotros a través de un
formulario
si desean no ser incluidos en Google Noticias pero sí quieren aparecer en el índice de resultados de búsqueda web de Google. Ahora, los editores pueden controlar su contenido en Google Noticias de una forma incluso más automatizada. Los dueños de los sitios web pueden simplemente añadir directivas específicas a Googlebot-News en sus archivos robots.txt. De forma parecida a los agentes de usuario Googlebot y Googlebot-Image, el nuevo agente de usuario Googlebot-News puede usarse para especificar que páginas de un sitio web deberían rastrearse y aparecer en Google Noticias.
Aquí os presentamos algunos ejemplos para editores:
Incluir páginas tanto en la búsqueda web de Google como en Noticias:
User-agent: Googlebot
Disallow:
Este es el caso más sencillo. De hecho, no se necesita un archivo robots.txt para este caso.
Incluir páginas en la búsqueda web de Google, pero no en Noticias:
User-agent: Googlebot
Disallow:
User-agent: Googlebot-News
Disallow: /
Este archivo robots.txt dice que no hay ningún archivo al que no se puede acceder para el rastreador general de Google para la web, llamado Googlebot; pero el agente de usuario "Googlebot-News" tiene bloqueado el acceso a todos los archivos del sitio web.
Incluir páginas en Google Noticias, pero no en la búsqueda web de Google:
User-agent: Googlebot
Disallow: /
User-agent: Googlebot-News
Disallow:
Cuando se mira un archivo robots.txt, Google ataja las directivas más específicas. Las dos primeras líneas nos dicen que Googlebot (el agente de usuario para el índice web de Google) está bloqueado para rastrear cualquier página del sitio web. La siguiente directiva, que es para un agente de usuario más específico, para Google Noticias, suprime el bloqueo de Googlebot y da permiso a Google Noticias para rastrear las páginas de su sitio web.
Bloquear grupos diferentes de páginas de la búsqueda web de Google y Google Noticias:
User-agent: Googlebot
Disallow: /latest_news
User-agent: Googlebot-News
Disallow: /archives
Las páginas bloqueadas para la búsqueda web de Google y Google Noticias pueden controlarse de forma independiente. Este archivo robots.txt bloquea para la búsqueda web de Google las noticias más recientes (las URL que están en la carpeta /latest_news), pero permite que éstas aparezcan en Google Noticias. En cambio, bloquea contenido premium a Google Noticias (las URL que están en la carpeta /archives folder), pero permite que aparezcan en la búsqueda web de Google.
Evitar que se rastreen páginas para la búsqueda web de Google y para Google Noticias:
User-agent: Googlebot
Disallow: /
Este archivo robots.txt le dice a Google que Googlebot, el agente de usuario para nuestro rastreador de la búsqueda web, no debería rastrear ninguna página de este sitio web. Y debido a que no se ha especificado ninguna directiva a Googlebot-News, nuestra búsqueda de Noticias seguirá la guía general que de Googlebot, y no rastreará páginas para Google Noticias.
Para algunas palabras de búsqueda, mostramos resultados de Google Noticias en una discreta caja o sección en las páginas de resultados web, junto con nuestros resultados de búsqueda normales. Algunas veces también hacemos esto con Imágenes, Vídeos, Mapas y Productos. Esto se conoce como
Búsqueda Universal
. Como Google Noticias alimenta las “Noticias” Universales de los resultados de búsqueda, si bloqueas el agente de usuario de Googlebot-News, entonces las noticias de tu sitio web no se incluirán en los resultados de búsqueda Universal.
Estamos ahora probando el soporte para el nuevo agente de usuario. Si ves algún problema, por favor
háznoslo saber
. Recuerda que es
posible que Google
[inglés]
ofrezca un enlace a una página en ciertos casos, incluso cuando no hemos rastreado esa página. Si quieres leer
más sobre los archivos robots.txt
, ofrecemos documentación adicional en nuestra página web. Esperamos que los webmasters disfruten de la flexibilidad y el más fácil manejo que el agente de usuario Googlebot-News ofrece.
Publicado por Jonathan Simon, Webmaster Trends Analyst; traducido por Esperanza, equipo de Calidad de búsqueda.
Etiquetas
Academia para webmasters
4
accesibilidad
27
acciones
1
acciones manuales
4
ajax
1
alt
1
amp
10
analíticas de Google
1
angular universal
1
anomalias
1
api
2
api psi
1
api search analytics
2
articulos
2
artículos
1
asistente
1
avanzado
16
blog
2
Botón +1
7
búsqueda
2
busqueda de google
1
calidad
1
casos de exito
1
centro de ayuda
1
centro de datos
1
certificación
1
certificado
1
chrome
3
chromium
1
cobertura del índice
3
cocina
1
codelab
1
codigo fuente
1
colaboradores principales
1
comentarios
1
comunicación
23
comunidad
1
conexión cifrada
1
consejos
99
consola de firebase
1
contenido
1
contenido duplicado
1
criterios de posicionamiento
2
cuadro de busqueda
2
danny sullivan
1
data-nosnippet
1
datos agregados
1
datos de campo
1
datos de experimentos
1
datos estructurados
16
dcl
1
desarrolladores
2
devtools
1
diagnostico
1
directrices para webmasters
30
directrices tecnicas
1
discover
1
diseño adaptable
1
DOM Content Loaded
1
dominio
1
empleo
3
empresa local
1
enlaces
9
enlaces artificiales
1
enlaces fraudulentos
1
errores de marcado
1
evaluadores
1
event
1
eventbrite
1
evento global
1
eventos
23
experiencia de usuario
1
experto de producto
1
experto producto
1
expertos de producto
2
expertos producto
2
express.js
1
facturacion
1
faq
1
fcp
1
fechas
2
ficha de empresa
1
First Contentful Paint
1
flujo de validación de problemas
1
foro
26
foro de editores
1
fragmentos de texto
1
fragmentos destacados
1
github
1
google analytics
1
google cloud platform
1
google i/o
1
google imágenes
2
google news
1
google noticias
1
google play instant
1
guía inicio rápido
1
guia seo
1
herramientas para webmasters
123
home
1
horas
1
html
5
http
1
https
3
imagenes
1
indexacion
2
indexing
1
informe de recetas
1
informe de rendimiento
5
informe de transparencia
1
informe spam
1
inspección de url
4
iso 8601
1
javascript
1
jobposting
2
jobrapido
1
kitten corner
1
lighthouse
3
logotipo
2
max-image-preview
1
max-snippet
1
max-video-preview
1
metaetiqueta
1
mfi
1
middleware
1
móvil
21
moviles
1
navegación segura
2
no segura
1
no seguro
1
nosnippet
1
optimizar sitio web
1
oro
1
pagespeed
3
penguin
1
pki
1
plata
1
platino
1
politicas de contenido
1
prácticas recomendadas
2
preguntas y respuestas
1
producto
1
productos y servicios
40
prueba de optimizacion para moviles
1
rakuten
1
rastreo e indexación
100
recaptcha
1
receta
1
recetas
1
reconsideraciones
2
renderizado dinamico
1
Rendertron
1
rendimiento
12
reseña
1
resultados de búsqueda
94
resultados enriquecidos
2
robot
1
robot noindex
1
ruta de navegacion
1
safe browsing
1
Search Console
20
seguridad
13
servidor
1
site clinic
10
Site Reliability Engineering
1
sitemaps
14
sitios pirateados
1
software malicioso
1
software no deseado
1
spam
2
ssl
1
symantec
1
tarifas
1
titulares
1
tls
1
twitter
4
url
1
url canonica
1
url canonicas
1
url de referencia
1
usuarios destacados
1
velocidad
3
verificacion dns
1
vídeo
82
videos
1
web light
1
webmaster
2
webspam
3
youtube
1
zona horaria
1
Archivo del blog
2020
nov
sept
ago
jul
jun
may
abr
mar
feb
ene
2019
dic
nov
oct
sept
jun
abr
mar
feb
ene
2018
dic
nov
oct
jul
jun
may
abr
feb
ene
2017
dic
nov
sept
ago
jul
jun
abr
mar
ene
2016
nov
sept
ago
may
abr
mar
ene
2015
dic
nov
oct
sept
ago
jul
may
abr
mar
ene
2014
nov
oct
sept
ago
jun
may
abr
mar
feb
ene
2013
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2012
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2011
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2010
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2009
dic
¡Os deseamos unas felices fiestas!
Site Clinic V. Site search, organización y páginas...
Vídeos de Matt Cutts. Posicionamiento y páginas en...
Vídeos de Matt Cutts. ¿Da Google prioridad a las m...
Ayuda a Google a indexar tu sitio web para móviles
Vídeos de Matt Cutts. ¿Porqué se ignora el carácte...
Site Clinic IV. Páginas en Flash
Nuevo agente de usuario (user-agent) para Noticias
Vídeos de Matt Cutts. Relevancia de sitios sociales.
Cambios en el "Primer clic gratis" (First Click Free)
¿Cómo de rápido es tu sitio?
Site Clinic III. ¿Quiénes son tus usuarios?
Comentarios spam: La dura realidad
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2008
dic
nov
oct
sept
Feed
Follow @googlewmc
Recursos para webmasters
Foro para Webmasters
Centro de Asistencia
Google Search Console
Google Webmaster en castellano