Los sitios de spam intentan aparecer en los primeros resultados de búsqueda mediante técnicas como, por ejemplo, la repetición de palabras clave, la compra de enlaces que mejoran el PageRank o el uso de texto invisible. Esto es perjudicial para la búsqueda, porque los sitios web relevantes quedan enterrados, y para los propietarios de sitios web legítimos, porque sus sitios se vuelven más difíciles de encontrar. La buena noticia es que los algoritmos de Google pueden detectar la gran mayoría del spam y bajar su posición de forma automática. Para el resto, tenemos equipos que revisan manualmente los sitios.

Cómo identificamos el spam

Los sitios con spam se presentan en una infinidad de formas y tamaños. Algunos sitios incluyen lenguaje ininteligible para los usuarios generado automáticamente. También revisamos los sitios que utilizan técnicas de spam más sutiles. Echa un vistazo a estos ejemplos de “spam en estado puro” , que son los sitios que utilizan las técnicas de spam más agresivas. Se trata de varias capturas de pantalla de spam real que hemos identificado de forma manual y eliminado recientemente para que no vuelva a aparecer en los resultados de búsqueda.

*Hemos eliminado contenido pornográfico y software malicioso de esta demostración. Por lo demás, estos son ejemplos sin filtrar de contenido de "spam en estado puro" retirado (en inglés).

Tipos de spam

Además del spam anterior, a continuación te mostramos otros tipos de spam que detectamos y sobre los que tomamos medidas.

Redireccionamientos engañosos y encubrimiento

El sitio parece encubrir contenido (es decir, muestra contenido a usuarios humanos diferente al que se muestra en motores de búsqueda) o redirigir a los usuarios a una página diferente a la rastreada por Google.

Sitio comprometido

Es posible que un tercero haya pirateado algunas páginas de este sitio para mostrar enlaces o contenido fraudulento. Los propietarios de sitios web deben tomar medidas de forma inmediata para limpiar sus sitios y solucionar posibles vulnerabilidades de seguridad.

Texto oculto o con demasiadas palabras clave

Es posible que algunas de las páginas contengan texto oculto o hagan un uso excesivo de palabras clave.

Dominios aparcados

Los dominios aparcados son sitios con poco contenido único, por lo que Google no suele incluirlos en los resultados de búsqueda.

Spam en estado puro

Parece que el sitio utiliza técnicas de spam agresivas, como contenido ininteligible generado automáticamente, encubrimiento, contenido extraído de otros sitios web o infracciones graves o reiteradas de las directrices para webmasters de Google.

Proveedores de DNS dinámicos y hosts gratuitos de contenido malicioso

El sitio está alojado por un proveedor de DNS dinámico o por un servicio de alojamiento gratuito que incluye una cantidad significativa de contenido fraudulento.

Contenido poco relevante con poco o ningún valor añadido

Parece que el sitio tiene páginas poco relevantes o de baja calidad que no ofrecen a los usuarios un gran valor añadido (como páginas asociadas de poca importancia, doorways, sitios que siguen una misma plantilla, contenido generado automáticamente o contenido copiado).

Enlaces no naturales de un sitio

Google ha detectado un patrón de enlaces de salida manipuladores, engañosos, artificiales o no naturales en este sitio. Este patrón puede ser el resultado de la venta de enlaces que manipulan PageRank o que participan en esquemas de enlaces.

Enlaces no naturales a un sitio

Google ha detectado un patrón de enlaces manipuladores, engañosos, artificiales o no naturales que dirigen al sitio. Este patrón puede ser el resultado de la compra de enlaces que manipulan PageRank o que participan en esquemas de enlaces.

Spam generado por el usuario

Parece que el sitio incluye contenido fraudulento generado por los usuarios. El contenido problemático puede aparecer en páginas de foros, en páginas de libros de visitas o en perfiles de usuarios.

Cómo tomamos medidas

Mientras que nuestros algoritmos se utilizan frente a la gran mayoría del spam, Google lucha contra otro tipo de spam de forma manual para evitar que la calidad de los resultados se vea afectada. En este gráfico se muestra el número de dominios en los que se han realizado acciones manuales a lo largo del tiempo y se detallan los diferentes tipos de spam. Fuera de contexto, puede parecer que es un número muy elevado, pero la Web es muy amplia. La información de carácter general reciente de nuestro índice mostró que un 0,22% de los dominios se había marcado de forma manual para eliminarse.

Acción manual por mes

Hitos para la lucha manual antispam

Febrero de 2005

Ampliamos nuestro equipo de lucha manual antispam a Hyderabad (la India).

Marzo de 2005

Ampliamos nuestro equipo de lucha manual antispam a Dublín (Irlanda).

Abril de 2006

Ampliamos nuestro equipo de lucha manual antispam a Tokio (Japón).

Junio de 2006

Ampliamos nuestro equipo de lucha manual contra sitios fraudulentos a Pekín (China).

Octubre de 2007: heredados

En otoño de 2007, cambiamos nuestro sistema de clasificación para mantener los datos en un formato más estructurado basado en el tipo de infracción de spam web (lo que nos permitió crear este gráfico). Las acciones que no se podían clasificar correctamente en el nuevo sistema se encuentran en la categoría de “heredados” . Antes de esa época, ya se tomaban medidas sobre los tipos de spam, como sitios asociados poco relevantes y encubrimiento, pero no es posible acceder fácilmente al análisis por tipo de spam de los datos más antiguos.

Octubre de 2009: enlaces no naturales de tu sitio

Las mejoras en nuestros sistemas nos permitieron reducir el número de acciones aplicadas en sitios con enlaces de salida no naturales.

Noviembre de 2009: sitios comprometidos

Observamos un aumento en el número de sitios comprometidos e incrementamos nuestros esfuerzos para evitar que estos afectaran a los resultados de búsqueda.

Febrero de 2011: proveedores de DNS dinámicos y hosts libres de contenido malicioso

Aumentamos la aplicación de una política para adoptar medidas sobre los proveedores de DNS dinámicos y los servicios de alojamiento gratuitos cuando una gran parte de sus sitios o páginas infringen las directrices para webmasters. Esto nos permite proteger a nuestros usuarios contra el spam en los casos en que adoptar medidas sobre las cuentas individuales de contenido malicioso no sería práctico.

Octubre de 2011: redireccionamientos engañosos y encubrimiento

Modificamos nuestro sistema de clasificación para que la mayoría de las acciones de redireccionamiento engañoso o encubrimiento se etiqueten como "spam en estado puro". Las acciones relacionadas con infracciones menos graves se siguen etiquetando de forma individual.

Octubre de 2011: dominios aparcados

Redujimos los esfuerzos para identificar de forma manual los dominios aparcados debido a las mejoras en la detección algorítmica de estos sitios.

Abril de 2012

Lanzamos una actualización de algoritmos con nombre en código “Penguin” que disminuye la puntuación de los sitios que utilizan tácticas de spam web.

Cómo informamos a los propietarios de sitios web

Cuando se aplica una acción manual en un sitio web, tratamos de alertar al propietario del sitio para ayudarlo a solucionar los problemas. Queremos ofrecer a los propietarios de sitios web la información que necesitan para poner sus sitios a punto. Por ello, con el tiempo, hemos invertido una gran cantidad de recursos en divulgación y comunicación de webmasters. Estas barras muestran el número de notificaciones de spam enviadas a los propietarios de sitios a través de las Herramientas para webmasters de Google.

Mensajes por mes

Historia de la comunicación de los webmasters

Mayo de 2007

Anteriormente, solo enviábamos notificaciones por correo electrónico. En 2007, los webmasters nos informaron de que recibirían notificaciones falsas sobre infracciones de las directrices para webmasters. De forma temporal, dejamos de enviar notificaciones como respuesta a este incidente mientras trabajábamos en un nuevo sistema de notificaciones.

Julio de 2007

El lanzamiento de la función de centro de mensajes en las Herramientas para webmasters de Google permitió reanudar el envío de notificaciones en julio de 2007 tras una pausa en mayo debido a la falsificación de identidad en los correos electrónicos.

Marzo de 2010

Empezamos a utilizar un nuevo sistema de notificación que nos permitió enviar mensajes más fácilmente al centro de mensajes de las Herramientas para webmasters de Google al encontrar spam. La primera categoría de spam para la que se utilizó este nuevo sistema fue la de sitios comprometidos.

Julio de 2010

Un error en nuestro sistema de notificación de los sitios comprometidos redujo el número de mensajes que enviábamos a los sitios comprometidos.

Noviembre de 2010

Actualizamos nuestro sistema de notificación. Con esta actualización, solucionamos el error de notificación de sitios comprometidos y comenzamos a experimentar con el envío de mensajes de otras categorías de spam, como los enlaces no naturales de un sitio.

Febrero y marzo de 2011

Ampliamos las notificaciones para incluir otros tipos de enlaces no naturales a un sitio.

Junio de 2011

Ampliamos el número de idiomas en los que enviamos muchos de nuestros mensajes.

Septiembre de 2011

Modificamos el sistema de clasificación de spam. Los mensajes de algunas categorías de spam no se enviaron y creamos y tradujimos nuevos mensajes para adaptarlos a las nuevas categorías.

Noviembre de 2011

Un error en nuestro sistema de notificación de los sitios comprometidos redujo el número de mensajes que enviábamos a los sitios comprometidos.

Diciembre de 2011

Ampliamos las categorías de spam para las que enviamos notificaciones para incluir el spam en estado puro y el contenido poco relevante.

Febrero de 2012

Solucionamos el error que afectaba a las notificaciones de sitios comprometidos.

Escuchamos a los propietarios de sitios web

Las acciones manuales no duran eternamente. Una vez que el propietario de un sitio web haya limpiado su sitio para eliminar contenido fraudulento, podrá solicitarnos que volvamos a revisarlo. Para ello, deberá enviar una solicitud de reconsideración. Procesamos todas las solicitudes de reconsideración que recibimos e informamos a los propietarios de sitios durante el proceso para que puedan conocer el estado de su solicitud.

A lo largo del tiempo, la mayoría de los sitios que han enviado solicitudes de reconsideración no se han visto realmente afectados por las posibles acciones de spam manuales. En ocasiones, estos sitios simplemente han experimentado el proceso natural de "flujo y reflujo" del tráfico online, un cambio algorítmico o quizás un problema técnico que impedía que Google accediera al contenido del sitio. En este gráfico, se muestra el volumen semanal de solicitudes de reconsideración desde 2006.

Solicitudes de reconsideración semanales

Momentos importantes de las solicitudes de reconsideración

Diciembre de 2006

Un error nos impidió almacenar correctamente solicitudes de reconsideración durante aproximadamente una semana. El 25 de diciembre (Navidad), enviamos solicitudes en nombre de los sitios afectados por el error, lo que dio lugar a un pequeño aumento a finales de año.

Mayo/junio de 2007

Muchos webmasters recibieron notificaciones falsas de infracciones de las directrices para webmasters de Google, lo que provocó que una cantidad inusual de webmasters enviara solicitudes de reconsideración.

Diciembre de 2007

Cada año, los webmasters envían un menor número de solicitudes de reconsideración durante los últimos días de vacaciones de diciembre.

Abril de 2009

Publicamos un vídeo con sugerencias relacionadas con las solicitudes de reconsideración.

Junio de 2009

Empezamos a enviar respuestas a las solicitudes de reconsideración para informar a los webmasters del procesamiento de sus solicitudes.

Octubre de 2010

Actualizamos nuestro sistema de notificaciones y empezamos a enviar más mensajes.

Abril de 2011

Lanzamos el algoritmo Panda en todo el mundo. Anteriormente, los sitios solían enviar solicitudes de reconsideración cuando observaban cambios en el tráfico que no se debían a una acción manual.

Abril - Septiembre de 2011

Empezamos a enviar respuestas de reconsideración que incluían una mayor cantidad de información sobre los resultados de las solicitudes de reconsideración.

Junio de 2012

Empezamos a enviar mensajes para una mayor variedad de problemas relacionados con el spam web. Actualmente enviamos notificaciones de todas las acciones manuales llevadas a cabo por el equipo de spam web que pueden afectar a la posición de un sitio en los resultados de búsqueda web.