El Blog para Webmasters
Noticias en castellano sobre el rastreo e indexación de sitios web en el buscador Google
Contenido duplicado debido a scrapers
martes, 10 de febrero de 2009
Teniendo en cuenta que el contenido duplicado es un tema candente entre los webmasters, pensamos que es un buen momento para tratar preguntas que nos hacen con regularidad en las conferencias y en el
Foro de ayuda para webmasters
de Google.
Antes de entrar de lleno en ellas me gustaría referirme rápidamente a un tema que preocupa a los webmasters: en la mayoría de casos un webmaster no tiene ninguna influencia sobre el contenido que terceras partes copian y redistribuyen sin permiso del webmaster. Nos damos cuenta de que no es culpa del webmaster en cuestión, lo que significa que un contenido idéntico se mostrará a la vez en varios sitios web aunque no se considerará en sí una violación de nuestras
directrices para webmasters
. Esto simplemente lleva a otro proceso con el que se intenta determinar la fuente original del contenido, algo en lo que Google es bastante bueno ya que en la mayoría de casos el contenido original puede ser correctamente identificado y sin tener efectos negativos para el sitio web que ha originado el contenido.
Generalmente, podemos diferenciar entre dos situaciones relacionadas con contenido duplicado:
Contenido duplicado en tu propio dominio, por ejemplo contenido idéntico que aparece involuntariamente en más de un lugar en tu sitio web.
Contenido duplicado en varios dominios, por ejemplo contenido idéntico el cual aparece, de nuevo involuntariamente, en diferentes sitios web.
En el primer caso, puedes tomar partido y evitar que Google indexe el contenido duplicado de tus sitios web. Échale un vistazo a este artículo de Adam Lasnik, "
Deftly dealing with duplicate content
"
[inglés]
y este otro de Vanessa Fox, "
Duplicate content summit at SMX Advanced
"
[inglés]
. Ambos ofrecen buenos trucos sobre cómo resolver problemas con el contenido duplicado en tu sitio web. Otro truco más que te puede ayudar a evitar que el contenido de tu página web sea rastreada como contenido duplicado es incluir la URL de la versión que prefiramos en el archivo de sitemap. Esto nos puede ayudar a aumentar las probabilidades de ofrecer la versión que el usuario prefiere cuando encontramos diferentes páginas con el mismo contenido. En el
Centro de asistencia
se puede encontrar este artículo con información adicional sobre el contenido duplicado.
En el segundo caso, quizás se de la situación en la que alguien está copiando tu contenido y poniéndolo en un sitio web diferente y a menudo sacándole partido económicamente. Es además normal que muchos proxys en Internet indexen partes de los sitios web a los que se han accedido desde el mismo proxy. Si nos encontramos este contenido duplicado en diferentes sitios web, miramos las diferentes señales para determinar cuál es el sitio original, que por regla general suele funcionar muy bien. Así que no deberías estar preocupado por los efectos negativos de la presencia de contenido copiado de tu sitio web en Google.
Si se da el caso que estas distribuyendo tu contenido pero además quieres estar seguro de que tu sitio se identifica como fuente original, es muy útil pedirle a tus "distribuidores" de contenido que incluyan un enlace de vuelta al contenido original. Puedes encontrar más información sobre cómo tratar este tipo de contenido en un artículo de Vanessa Fox, "
Ranking as the original source for content you syndicate
"
[inglés]
.
Algunos webmasters han preguntado qué puede originar que un contenido copiado tenga una mejor posicionamiento que la fuente original. Este no debería pasar a menudo, pero si te sucediese:
Comprueba si tu contenido es accesible a nuestros robots. Puede que sin querer hayas bloqueado el acceso a parte de tu contenido a través de tu archivo robots.txt.
Puedes mirar en el archivo Sitemap por si hubieses hecho cambios en ese contenido que ha sido copiado.
Comprueba que tu sitio web siga las Directrices para webmasters de Google.
Por último me gustaría señalar que en la mayoría de casos, tener contenido duplicado no tiene efectos negativos en la presencia de tu sitio web en el índice de Google, ya que este se filtra. Si te fijas en algunos de los consejos mencionados más arriba, lo que estás aprendiendo es a controlar mejor lo que rastreamos e indexamos, así como las versiones que tienen más probabilidades de aparecer en el índice. Solo cuando hay señales que apuntan a un uso deliberado y malintencionado, puede ocurrir que consideremos que el contenido duplicado está violando las directrices para webmasters.
Si deseas comentar algo sobre este tema no dudes en visitar nuestro
Foro de ayuda para webmasters
.
Publicado por Sven Naumann, Search Quality Team (traducido por Esperanza, Calidad de búsqueda)
Etiquetas
Academia para webmasters
4
accesibilidad
27
acciones
1
acciones manuales
4
ajax
1
alt
1
amp
10
analíticas de Google
1
angular universal
1
anomalias
1
api
2
api psi
1
api search analytics
2
articulos
2
artículos
1
asistente
1
avanzado
16
blog
2
Botón +1
7
búsqueda
2
busqueda de google
1
calidad
1
casos de exito
1
centro de ayuda
1
centro de datos
1
certificación
1
certificado
1
chrome
3
chromium
1
cobertura del índice
3
cocina
1
codelab
1
codigo fuente
1
colaboradores principales
1
comentarios
1
comunicación
23
comunidad
1
conexión cifrada
1
consejos
99
consola de firebase
1
contenido
1
contenido duplicado
1
criterios de posicionamiento
2
cuadro de busqueda
2
danny sullivan
1
data-nosnippet
1
datos agregados
1
datos de campo
1
datos de experimentos
1
datos estructurados
16
dcl
1
desarrolladores
2
devtools
1
diagnostico
1
directrices para webmasters
30
directrices tecnicas
1
discover
1
diseño adaptable
1
DOM Content Loaded
1
dominio
1
empleo
3
empresa local
1
enlaces
9
enlaces artificiales
1
enlaces fraudulentos
1
errores de marcado
1
evaluadores
1
event
1
eventbrite
1
evento global
1
eventos
23
experiencia de usuario
1
experto de producto
1
experto producto
1
expertos de producto
2
expertos producto
2
express.js
1
facturacion
1
faq
1
fcp
1
fechas
2
ficha de empresa
1
First Contentful Paint
1
flujo de validación de problemas
1
foro
26
foro de editores
1
fragmentos de texto
1
fragmentos destacados
1
github
1
google analytics
1
google cloud platform
1
google i/o
1
google imágenes
2
google news
1
google noticias
1
google play instant
1
guía inicio rápido
1
guia seo
1
herramientas para webmasters
123
home
1
horas
1
html
5
http
1
https
3
imagenes
1
indexacion
2
indexing
1
informe de recetas
1
informe de rendimiento
5
informe de transparencia
1
informe spam
1
inspección de url
4
iso 8601
1
javascript
1
jobposting
2
jobrapido
1
kitten corner
1
lighthouse
3
logotipo
2
max-image-preview
1
max-snippet
1
max-video-preview
1
metaetiqueta
1
mfi
1
middleware
1
móvil
21
moviles
1
navegación segura
2
no segura
1
no seguro
1
nosnippet
1
optimizar sitio web
1
oro
1
pagespeed
3
penguin
1
pki
1
plata
1
platino
1
politicas de contenido
1
prácticas recomendadas
2
preguntas y respuestas
1
producto
1
productos y servicios
40
prueba de optimizacion para moviles
1
rakuten
1
rastreo e indexación
100
recaptcha
1
receta
1
recetas
1
reconsideraciones
2
renderizado dinamico
1
Rendertron
1
rendimiento
12
reseña
1
resultados de búsqueda
94
resultados enriquecidos
2
robot
1
robot noindex
1
ruta de navegacion
1
safe browsing
1
Search Console
20
seguridad
13
servidor
1
site clinic
10
Site Reliability Engineering
1
sitemaps
14
sitios pirateados
1
software malicioso
1
software no deseado
1
spam
2
ssl
1
symantec
1
tarifas
1
titulares
1
tls
1
twitter
4
url
1
url canonica
1
url canonicas
1
url de referencia
1
usuarios destacados
1
velocidad
3
verificacion dns
1
vídeo
82
videos
1
web light
1
webmaster
2
webspam
3
youtube
1
zona horaria
1
Archivo del blog
2020
nov
sept
ago
jul
jun
may
abr
mar
feb
ene
2019
dic
nov
oct
sept
jun
abr
mar
feb
ene
2018
dic
nov
oct
jul
jun
may
abr
feb
ene
2017
dic
nov
sept
ago
jul
jun
abr
mar
ene
2016
nov
sept
ago
may
abr
mar
ene
2015
dic
nov
oct
sept
ago
jul
may
abr
mar
ene
2014
nov
oct
sept
ago
jun
may
abr
mar
feb
ene
2013
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2012
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2011
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2010
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
ene
2009
dic
nov
oct
sept
ago
jul
jun
may
abr
mar
feb
URL con permisos de redirección abiertos: ¿Están a...
Especifica tu URL canónica
¿Cómo contactar con Google?
¿Hasta el infinito y más allá? ¡No!
Nuevo Foro de Ayuda de Google
Contenido duplicado debido a scrapers
Nuevo blog oficial sobre los productos de Google e...
¿"Este sitio puede dañar su equipo" para cada resu...
ene
2008
dic
nov
oct
sept
Feed
Follow @googlewmc
Recursos para webmasters
Foro para Webmasters
Centro de Asistencia
Google Search Console
Google Webmaster en castellano