Aprendemos cosas de nuestros usuarios, de manera que cuando la gente empieza a usar nuestro motor de búsqueda, podemos mejorar en ese idioma. Aquí tienes algunos ejemplos:
Además de estos factores semánticos, Google también analiza los documentos y las consultas. Entender los detalles de cómo se usa un idioma dentro de un país es importante. La anotación de acrónimos se realiza de forma diferente en cada idioma: En hebreo se utilizan comillas dobles antes del último carácter (que está a la izquierda), como en "primer ministro" [רה"מ]. En tailandés, se usa un punto al final de la palabra, como en "estación de policía" [สน.]. Mientras que en los EE.UU. se usan puntos después de cada carácter, como sucede con [I.B.M.]. Los usuarios chinos se refieren a las obras de arte con "《", como por ejemplo en [《手机》剧情] y designan fechas con un "日", como por ejemplo [2006年1月13日].
Hay que tener en cuenta que la visualización de información debe ajustarse a los estándares de cada país, por eso mostramos la marca decimal "," para los usuarios croatas que quieren saber cúantos milímetros hay en una pulgada [inč u milimetrima], o para los usuarios italianos interesados en los tipos de cambio de divisas [50 euro in dollari]. Del mismo modo, las temperaturas en Noruega [Været i Oslo] se mostrarán en grados Celsius, mientras que en los EE.UU. se hará en grados Fahrenheit [weather Boston].
Si todo lo demás falla, también proporcionamos traducciones basadas en la tecnología de traducción de Google, que ya se ha comentado en una entrada de este blog [inglés]. Traduciremos tu consulta al inglés, buscaremos documentos en inglés en la web y traduciremos los resultados del inglés al idioma original de consulta. Por ejemplo, los usuarios japoneses interesados en ilustraciones sobre Halloween (Halloween es una fiesta que se originó en Irlanda) pueden buscar [ハロウィン イラスト]. A continuación, puedes solicitar una traducción al japonés de las páginas en inglés (en la parte inferior de la página), que te traerá la traducción de la página, como en la captura de pantalla a continuación. Del mismo modo, los usuarios coreanos pueden buscar lo último de Harry Potter [해리 포터], y los lectores árabes pueden buscar la apertura de la Ópera de Sydney [افتتاح دار الاوبرا في سيدني] (Haz clic en la imagen para ver una versión ampliada).
En total, Google Search se está desarrollando actualmente en más de 100 idiomas, para más de 150 países, con docenas de mejoras puestas en marcha cada mes. Hasta ahora he hablado del funcionamiento básico de la búsqueda internacional, pero esto es tan sólo la superficie de todo el trabajo internacional que llevamos a cabo. Hay muchos otros temas de interés con impacto en los mercados internacionales, como la usabilidad,las páginas de inicio, el diseño de la página de resultados y la conectividad. La comprensión de los factores humanos y culturales es esencial para la creación de un motor de búsqueda relevante para las personas que lo utilizan (Haz clic en la imagen para ver una versión ampliada).
(Ten en cuenta que, si bien no se aconseja copiar contenido, el hecho de que otros te copien a ti es otra historia. Consulta esta entrada [inglés] si estás preocupado por que alguien te pueda copiar).Pero la mayoría de los propietarios de sitios web que se preocupan por el contenido duplicado no hablan de contenido copiado ni de granjas de dominios, si no de cosas como tener varias URL en un mismo dominio que apuntan a un mismo contenido. Como www.example.com/patines.asp?color=negro&marca=riedell y www.example.com/patines.asp?marca=riedell&color=negro. Tener este tipo de contenido duplicado en tu sitio web puede afectar al rendimiento del mismo, pero no causará su penalización. De acuerdo con nuestro artículo sobre contenido duplicado:
El contenido duplicado de un sitio no implica que deban tomarse medidas al respecto a menos que aparentemente el objetivo sea engañar y manipular los resultados de los motores de búsqueda. Si su sitio tiene problemas relacionados con contenido duplicado y no sigue nuestros consejos anteriores, conocemos muy bien la manera de elegir la versión adecuada para mostrarla en los resultados de la búsqueda.
Este tipo de copia no maliciosa es bastante común, sobre todo porque muchos sistemas de gestión de contenidos (CMS) no las manejan muy bien por defecto. Así que cuando se dice que tener este tipo de contenido duplicado en tu sitio puede afectarte, no es porque vayan a penalizarlo, sino que es simplemente por la forma en la que trabajan los sitios web y los motores de búsqueda.La mayoría de los motores de búsqueda se esfuerzan por conseguir un cierto nivel de variedad, y quieren mostrar diez resultados diferentes en la página de resultados de búsqueda, no quieren diez URL diferentes con el mismo contenido en cada una de ellas. Con este fin, Google trata de filtrar los documentos duplicados de modo que los usuarios experimenten una menor redundancia. Puedes encontrar más información en esta entrada [inglés], que dice lo siguiente:
Como webmaster, esto podría afectarte de la siguiente manera:
En la mayoría de los casos, Google sabe cómo tratar este tipo de duplicados. También hay que tener en cuenta el duplicado de contenido entre dominios. En concreto, no es aconsejable construir un sitio cuya finalidad implique duplicar contenido, si lo que pretendes es establecer un modelo de negocio basado en el tráfico de las búsquedas, a no ser que además vayas a agregar una gran cantidad de contenido con valor añadido para los usuarios. Por ejemplo, es el caso de afiliados de Amazon.com con dificultades para posicionarse, ofreciendo contenido de Amazon únicamente. ¿Se debe esto a que Google no quiere que se venda "Todos hacemos caca"? No, se debe a que no podrán posicionarse mejor que Amazon cuando lo único que proporcionan es el contenido de Amazon. Amazon tiene mucha autoridad en cuanto a ventas en línea (probablemente más autoridad que la de un típico afiliado de Amazon) y, probablemente, los usuarios que utilizan el buscador de Google prefieran la información original en Amazon, a menos que el sitio afiliado haya añadido, además, mucho contenido con valor añadido.Por último, considera el efecto que puede causar a tu sitio el duplicar contenido. Duplicar contenido puede llevar a que éste se rastree de un modo poco eficiente: cuando Googlebot descubre diez URL en tu sitio, éste tiene que rastrear cada una de ellas antes de saber si tienen el mismo contenido (antes de que podamos agruparlas tal y como se ha descrito antes). Cuanto más tiempo y recursos gaste Googlebot rastreando contenido duplicado en varias URL, menos tiempo tendrá para llegar al resto de tu contenido.En resumen: Tener contenido duplicado puede afectar a tu sitio de muchas formas pero, a menos que se haya duplicado contenido deliberadamente, es poco probable que el sitio reciba una penalización. Esto significa que:
Publicado por Susan Moskwa, Webmaster Trends Analyst (traducido por Cristina, Calidad de Búsqueda)