Scraper Report para informar a Google sobre contenido copiado/duplicado

Matt cutts informando sobre la nueva herramienta de Google para luchar contra contenido duplicado

Matt Cutts informando sobre el Scraper Report (Twitter)

Cada día me llegan algunos correos electrónicos de Talkwalker Alerts con información sobre novedades/nuevos artículos en el campo del SEO (Talkwalker funciona principalmente como Google Alerts). Lo interesante es que a veces hay en este mail un enlace a un artículo sobre un aspecto nuevo del posicionamiento web y al siguiente día aparecen 3 o 4 artículos sobre el mismo tema en los correos de Talkwalker. Estos otros 3 o 4 artículos generalmente son una copia del primer artículo. Algunas personas están copiando el texto o en todo caso las ideas principales de otra persona (más sobre este tema aquí).

Claro, a nadie le gusta que se copien sus textos. Esto es especialmente molesto si las copias consiguen un mejor ranking en los motores de búsqueda que el original. A Google o Bing no le gusta el contenido duplicado y puede ser que no muestren las copias (o – peor – el original) pero sabemos esto no funciona muy bien y por eso hay mucho contenido duplicado en los resultados de búsqueda.

Google Scraper Report

Google Scraper Report

Había muchas quejas de webmaster sobre este tema y hoy Google ha reaccionado. Google ha presentado una nueva herramienta (Scraper Report) para que puedas avisar a Google sobre contenido copiado (scrape: tomar, copiar contenido de otras páginas y utilizarlo en su propia página web). A través del formulario puedes avisar a Google cuál es la fuente original de un artículo copiado (url), donde se encuentra la copia (url) y a través de cuál búsqueda se muestra el problema (url del resultado de búsqueda). Solo debes utilizar la herramienta si la copia tiene un mejor ranking que el texto original o si Google solo muestra la copia en los resultados de búsqueda pero no el original.

Parece que llenar el formulario y enviarlo a Google no tendrá ningún impacto inmediato (por ejemplo no parece que Google va a quitar el contenido duplicado de sus resultados). En Search Engine Land se escribe que probablemente Google utilice los ejemplos mandados a través del formulario de Scraper Report para mejorar su algoritmo para que pueda evitar que en el futuro el contenido copiado aparezca en los resultados de búsqueda.

El problema es decidir cuándo un texto es una copia (cuál porcentaje de un texto debe ser copiado para decir sí, este texto es nada más que una copia de otro texto) y cuándo un texto solo usa partes de otro artículo como cita. Además existen muchos artículos que no son una copia absoluta sino textos en donde se cambia algunas palabras o frases (más información sobre este tema aquí).

Otro problema pueden ser todas las tiendas en línea que utilizan como descripción de los productos que venden el texto del fabricante: mucho contenido duplicado y todos copian de una solo fuente. Para los usuarios de Google sería malo si Google clasifica este tipo de contenido como contenido duplicado y lo quita de los SERPs porque como persona que quiere compra algo online quieres encontrar a través de Google diferentes tiendas virtuales para compartir precios, entre otros. Si el contenido es duplicado o único no es tan importante.

Scraper Report causa críticas en la web

Bromas en Twitter sobre Google y el contenido copiado (Twitter)

En la web puedes encontrar algunas bromas sobre este Scraper Report. Los internautas dicen que Google mismo copia contenido de páginas web para mostrarlo a sus usuarios, por ejemplo a través de su resultados de Knowledge Graph, a través de la búsqueda por imágenes (puedes ver las imágenes en su tamaño original sin salir de la página de las resultados de Google) o a través de los resultados para búsquedas locales.