Google muestra contenido duplicado

A Google no le gusta el contenido duplicado. Por eso -según Matt Cutts- el motor de búsqueda no indexa páginas web copiadas.

Resultados duplicados en Google

Buscando por “crear una lista de remarketing” Google me muestra dos páginas de ayuda de Adwords casi similares. Según el sitio “Similar Text Checker” un 34 por ciento del texto es igual en las dos páginas. Las diferencias entre las dos páginas son por ejemplo: en la una se dice “crear una lista…”; en la otra se dice “cómo crear una lista”.

Encontrar contenido duplicado con el Site Checker

Otro ejemplo de las diferencias es que en una página se dice:
La lista de remarketing puede incluir a los usuarios que visitaron una página determinada del sitio”.

en la otra se dice:
La lista de remarketing puede incluir a las personas que hayan visitado una página del sitio determinada”.

También las preguntas a lado derecho de las dos páginas son muy similares:

Google muestra dos veces la misma página en los resultados de búsqueda

Lo interesante es que esto solo pasa buscando en google.com. En google.com.ec me sale solo la página es-419, esto es la página en español para América Latina y el Caribe.

Parece que en el caso de Google.com el motor de búsqueda tiene un problema saber de donde viene la búsqueda y por eso muestra los dos. Esto puede significar que también el uso correcto de “hreflang” puede confundir a Google (sin embargo, en este ejemplo Google no utiliza el hreflang sino solo html lang=»es»/html lang=»es-419″).

Cuando yo busco algo en Google a veces utilizo google.com, a veces google.com.ec; normalmente sin pensar mucho en esto. Si es la versión .com o la versión .com.ec depende mucho del navegador, dispositivo y si ingreso a mi cuenta personal de Google.

El ejemplo también nos muestra el problema con el contenido duplicado. Buscando en la web siempre encuentro mucho contenido duplicado (también a mi me pasó que alguien copió mis textos).

La pregunta es a partir de qué porcentaje de texto igual entre dos páginas se habla de contenido duplicado. Además sería interesante saber si “crear una lista…” y “cómo crear una lista…” es contenido duplicado o no.