fbpx

¿Está buscando una manera de evitar que los spammers y los estafadores roben el contenido de su blog de WordPress usando raspadores de contenido?

Es muy frustrante como propietario de un sitio web ver que alguien está robando su contenido sin permiso, monetizándolo, superándolo en Google y robándose su audiencia.

En este artículo, cubriremos qué es el scraping de contenido de blog, cómo puede reducir y prevenir el scraping de contenido e incluso cómo aprovechar el scraping de contenido para su propio beneficio.

¿Qué es el raspado de contenido de blog?

El raspado de contenido de blog es cuando el contenido se toma de numerosas fuentes y se vuelve a publicar en otro sitio. Por lo general, esto se hace automáticamente a través de la fuente RSS de su blog .

El raspado de contenido es tan fácil ahora que cualquiera puede iniciar un sitio de WordPress , poner un tema gratuito o comercial e instalar algunos complementos que irán y rasparán el contenido de los blogs seleccionados.

¿Por qué los extractores de contenido roban mi contenido?

Algunos de nuestros usuarios nos han preguntado por qué están robando mi contenido. La respuesta simple es porque eres IMPRESIONANTE. La verdad es que estos raspadores de contenido tienen motivos ocultos. A continuación se presentan algunas razones por las que alguien rasparía su contenido:

  • Comisión de afiliados : hay algunos comerciantes afiliados sucios que solo quieren explotar el sistema para ganar unos cuantos dólares extra. Usarán su contenido y el contenido de otros para atraer tráfico a su sitio a través del motor de búsqueda. Estos sitios generalmente están dirigidos a un nicho específico, por lo que tienen productos relacionados que están promocionando.
  • Generación de prospectos : a menudo vemos abogados y agentes inmobiliarios haciendo esto. Quieren parecer líderes de la industria en sus pequeñas comunidades. No tienen el ancho de banda para producir contenido de calidad, por lo que salen y extraen contenido de otras fuentes. A veces, ni siquiera son conscientes de esto porque están pagando a un cabrón de $ 30 / mes para agregar contenido y ayudarlos a mejorar el SEO. Nos hemos encontrado con bastantes de estos en el pasado.
  • Ingresos por publicidad : algunas personas solo quieren crear un «centro» de conocimiento. Una ventanilla única para usuarios en un nicho específico. A menudo notamos que el contenido de nuestro sitio está siendo raspado. El raspador siempre responde, estaba haciendo esto por el bien de la comunidad. Excepto que el sitio está lleno de anuncios.

Estas son solo algunas de las razones por las que alguien robaría tu contenido.

¿Cómo atrapar raspadores de contenido?

Capturar extractores de contenido es una tarea tediosa y puede llevar mucho tiempo. Hay algunas formas en que puede capturar raspadores de contenido.

Buscar en Google con los títulos de sus publicaciones

Sí, eso es tan doloroso como suena. Este método probablemente no valga la pena, especialmente si está escribiendo sobre un tema muy popular.

Trackbacks

Si agrega enlaces internos en sus publicaciones, notará un trackback si un sitio roba su contenido. De esta manera, es más o menos el raspador que le dice que están raspando su contenido.

Si está utilizando Akismet, muchos de estos trackbacks aparecerán en la carpeta SPAM. Nuevamente, esto solo funcionará si tiene enlaces internos en sus publicaciones.

Ahrefs

Si tiene acceso a una herramienta de SEO como Ahrefs , puede monitorear sus backlinks y estar atento al contenido robado.

Cómo lidiar con los raspadores de contenido

Hay algunos enfoques que las personas adoptan cuando se trata de raspadores de contenido: el enfoque de no hacer nada, el enfoque de eliminación o el enfoque de aprovecharlos.

Echemos un vistazo a cada uno.

El enfoque de no hacer nada

Este es, con mucho, el enfoque más fácil que puede tomar. Por lo general, los bloggers más populares recomendarían esto porque lleva MUCHO tiempo luchar contra los raspadores.

Ahora, obviamente, si se trata de un blog conocido como Smashing Magazine, CSS-Tricks, Problogger u otros, entonces no tienen que preocuparse por eso. Son sitios de autoridad a los ojos de Google.

Sin embargo, conocemos algunos buenos sitios que han sido marcados como raspadores porque Google pensó que sus raspadores eran el contenido original. Así que este enfoque no siempre es el mejor en nuestra opinión.

Acercamiento de derribo

Esto es exactamente lo contrario del «enfoque de no hacer nada». En este enfoque, simplemente contacta al raspador y pídale que elimine el contenido.

Si se niegan a hacerlo o simplemente no responden a sus solicitudes, usted presenta una DMCA (Ley de derechos de autor del milenio digital) con su anfitrión.

Según nuestra experiencia, la mayoría de los sitios web de scraping no tienen un formulario de contacto disponible. Si lo hacen, entonces utilícelo. Si no tienen el formulario de contacto, debe realizar una búsqueda de Whois.

Puede ver la información de contacto en el contacto administrativo. Por lo general, el contacto administrativo y técnico es el mismo.

También mostrará el registrador de dominio. La mayoría de las empresas de alojamiento web y los registradores de dominios más conocidos tienen formularios o correos electrónicos de DMCA. Puede ver que esta persona específica está con HostGator debido a sus servidores de nombres. HostGator tiene un formulario para quejas de DMCA .

Si el servidor de nombres es algo así como ns1.theirdomain.com, entonces debe profundizar más haciendo búsquedas inversas de IP y buscando IP.

También puede usar un servicio de terceros para DMCA.com para las eliminaciones.

Jeff Starr en su artículo sugiere que deberías bloquear las direcciones IP de los malos. Acceda a sus registros para su dirección IP y luego bloquéelo con algo como esto en su archivo raíz .htaccess:

	
Deny from 123.456.789

También puede redirigirlos a un feed ficticio haciendo algo como esto:

RewriteCond %{REMOTE_ADDR} 123\.456\.789\.
RewriteRule .* http://dummyfeed.com/feed [R,L]

Puedes ser realmente creativo aquí como sugiere Jeff. Envíelos a fuentes de texto realmente grandes llenas de Lorem Ipsum. Puedes enviarles algunas imágenes repugnantes de cosas malas. También puede enviarlos directamente a su propio servidor, lo que provoca un bucle infinito que colapsará su sitio.

El último enfoque que tomamos es aprovecharlos.

Cómo aprovechar los raspadores de contenido

Este es nuestro enfoque para lidiar con los raspadores de contenido, y resulta bastante bien. Ayuda a nuestro SEO y nos ayuda a ganar dinero extra.

La mayoría de los raspadores utilizan su fuente RSS para robar su contenido. Así que estas son algunas de las cosas que puedes hacer:

  • Enlace interno : debe interconectar mucho las publicaciones de su blog. Cuando tiene enlaces internos en su artículo, le ayuda a aumentar las visitas a la página y reducir la tasa de rebote en su propio sitio . En segundo lugar, obtiene vínculos de retroceso de las personas que están robando su contenido. Por último, te permite robar su audiencia. Si eres un blogger talentoso, entonces entiendes el arte de los enlaces internos. Tienes que colocar tus enlaces en palabras clave interesantes. Haga que sea tentador para el usuario hacer clic en él. Si hace eso, entonces la audiencia del raspador también hará clic en él. Así de simple, sacaste a un visitante de su sitio y lo devolviste a donde debería haber estado en primer lugar.
  • Palabras clave de enlace automático con enlaces de afiliados : hay algunos complementos como ThirstyAffiliates que reemplazarán automáticamente las palabras clave asignadas con enlaces de afiliados.
  • Sea creativo con el pie de página RSS : puede usar el complemento SEO todo en uno para agregar elementos personalizados a su pie de página RSS. Puede agregar casi cualquier cosa que desee aquí. Conocemos a algunas personas a las que les gusta promocionar sus propios productos entre sus lectores de RSS. Entonces agregarán pancartas. Adivina qué, ahora esos banners también aparecerán en el sitio web de estos raspadores. En nuestro caso, siempre agregamos un pequeño descargo de responsabilidad en la parte inferior de nuestras publicaciones en nuestros canales RSS. Al hacer esto, obtenemos un vínculo de retroceso al artículo original del sitio del raspador que permite que Google y otros motores de búsqueda sepan que somos una autoridad. También permite que sus usuarios sepan que el sitio está robando nuestro contenido.

Cómo puede reducir y prevenir el raspado de blogs de WordPress

Teniendo en cuenta que si adopta nuestro enfoque de muchos enlaces internos, agregando enlaces de afiliados, banners RSS y otras posibilidades, es probable que reduzca el raspado de contenido en buena medida. Si acepta la sugerencia de Jeff Starr de redirigir los raspadores de contenido, eso también detendrá esos raspadores. Aparte de lo que hemos compartido anteriormente, hay algunos otros trucos que puedes usar.

Fuente RSS completa o resumida

Ha habido un debate en la comunidad de blogs sobre si tener una fuente RSS completa o una fuente RSS resumida. No vamos a entrar en muchos detalles sobre ese debate, sin embargo, una de las ventajas de tener un feed RSS de solo resumen es que evita el raspado de contenido.

Puede cambiar la configuración yendo a su panel de administración de WordPress y yendo a Configuración » Lectura . Luego cambie la configuración Para cada artículo en un programa de alimentación: Resumen.

SPAM de referencia

Trackbacks y Pingbacks definitivamente tuvieron grandes usos, sin embargo, ahora se abusa constantemente de ellos.

A menudo, los temas muestran trackbacks y pingbacks debajo o entre los comentarios. Esto le da al spammer un incentivo para raspar su sitio y enviar trackbacks. Si lo aprueba por error, obtienen un vínculo de retroceso y una mención de su sitio. Así es como puede deshabilitar Trackbacks en todas las publicaciones futuras .

¿El raspado de contenido siempre es bueno?

Puede ser. Si ve que está ganando dinero con el sitio del raspador, entonces seguro que puede ser. Si ve mucho tráfico del sitio de un raspador, entonces puede ser.

En la mayoría de los casos, sin embargo, no lo es. Siempre debe tratar de eliminar su contenido. Pero se dará cuenta de que a medida que su blog crece, es casi imposible realizar un seguimiento de todos los raspadores de contenido. Todavía enviamos quejas de DMCA, sin embargo, sabemos que hay muchos otros sitios que están robando nuestro contenido que simplemente no podemos seguir.

Esperamos que este artículo le haya ayudado a evitar el scraping de contenido de blogs en WordPress. También puede consultar nuestra guía sobre cómo evitar el robo de imágenes en WordPress .

Si te gustó este artículo, suscríbete a nuestro canal de YouTube para videos tutoriales de WordPress. También puede encontrarnos en Twitter y Facebook .