Por enxebree
Recientemente he publicado en mi sitio un articulo en el que detallaba cómo he combatido los ataques de spam (comentarios y contenido) en mi página, y que es aplicable a los portales que empleen el mismo gestor de contenidos, Drupal (Kriptópolis, sin ir más lejos).
Durante el proceso he podido observar el ingente volumen de tráfico que generan esa clase de ataques en un sitio web, llegando a ser en un sitio como el mio desproporcionado en cuanto al tráfico "natural" o "real", es decir, el de las visitas no provenientes de bots. Llegando a ser del orden del 25% del total del tráfico generado por el sitio, una auténtica barbaridad...
Y eso teniendo un un eficaz sistema antispam que combate el 99,98% de ataques (datos extraídos de mis estadísticas), no quiero ni pensar el volumen que pueda llegarse a generar en uno de esos sitios abandonados, sin un buen sistema de protección, que acaban convirtiéndose en cementerios de spam. Por no hablar de cómo falsean estas visitas no deseadas todas las estadísticas, desvirtuándolas por completo. Sí, aunque no os lo creáis, vuestros sitios no son tan güais... emplead un método similar al mio y veréis como vuestras visitas bajan del orden de un 10% mínimo... pero el bolsillo igual hasta los agradece, pudiendo tener un plan de hosting más económico o una página más "desahogada" para vuestras visitas reales.
Pero en el fondo lo que me planteo es lo siguiente, ¿hasta qué punto lo estamos haciendo bien?, porque la mayoría de sistemas antispam, incluso los más conocidos (Akismet, Mollom, Defensio, ...) son muy o bastante eficaces a la hora de evitar el contenido no deseado, y con el tiempo las oleadas de spam disminuyen. Pero como he dicho, son oleadas, volverán a la carga y puede que con más fuerza una y otra vez, mejorando sus métodos... Y en el medio del trasiego todos parecen olvidar este problema tan importante, el tráfico web, como si fuera gratis, como si no afectara a la red en general... vale, igual en dos o tres meses, el tráfico de mi web disminuye y los ataques se reducen, hasta la nueva oleada, pero... y si en esos dos meses, por ejemplo, ¿me generan tanto tráfico que me veo obligado a usar los sistemas de caché más extremos o incluso a migrar a un plan de hosting superior y por lo tanto a aligerar mi cartera?... ejem... da que pensar...
No es un tema que esté demasiado tratado en la web y al que no parece dársele mucha importancia, ¿alguno de vosotros ha observado lo mismo? ¿en qué medida os ha afectado? ¿habéis desarrollado alguna estrategia para combatirlo?
Saludos
y digo yo
PEPILLOCOJON7 Mayo 2011 - 3:11pm
Si usamos spam para combatir el spam.....por ejemplo habres tu correo te dedicas durante un par de horas a recopilar todas las direcciones de correo sdesde las que te los envian, haces una bonita presentacion y lo reenvias a todos ellos, e incluso usas sus direcciones en paginas donde la viagra te llegara por todos lados..........al final sera como un sistema cripto, el texto plano que son nuestras direcciones estara mezclado con la paja que son las suyas...........
¿Por qué discutir si se puede arreglar a hostias?
Calario18 Octubre 2010 - 12:30pm
Una de las medidas más efectivas que he tenido el disgusto de sufrir ha sido más o menos la siguiente: "O cortas el SPAM que viene de tu red o te corto la interconexión"
¡Oye, que el caso es que funciona!
Por supuesto, esta medida sólo la puedes poner en marcha cuando eres uno de los grandes, porque como administrador de una Web, poco se puede hacer para evitar el SPAM en origen, y ese poco es denunciar el SPAM, puesto que es un delito tipificado.
¿Cuántos de vosotros, queridos administradores, denunciais los casos de SPAM que sufrís?
Si encima habéis podido valorar los perjuicios económicos ¿Por qué no lo hacéis?
Denunciar por lo legal no, si reportar al administrador de red
enxebree18 Octubre 2010 - 1:15pm
Denunciar por lo legal no, si reportar al administrador de red, en el caso de una botnet desde Alemania que me traía por la calle de la amargura, ni baneandolo por el htaccess cesaba de intentarlo... y la verdad, ni me respondieron, ni hicieron nada que yo sepa, solo al cabo de tres meses cesó de atacar mi sitio.
Pero si, tienes razón, quizá me plantee empezar a reportar más casos de los más activos.
Saludos
Yo sí me lo he planteado
Envite18 Octubre 2010 - 5:04am
Sí me lo he planteado, siquiera tangencialmente.
En su momento alojé (en casa, tengo IP fija) la web de una asociación a la que pertenezco. Entre otras cosas, en la web había un foro phpBB. Cuando tiempo después fui a mirar no me acuerdo qué (no recuerdo si miré primero los registros de Apache, un volcado de la BD para mover la página o el propio foro) vi toneladas de spam.
Como el foro andaba muerto, simplemente lo cerré, pero eso me hizo plantearme algunas cosillas. No obstante, para mí fue «Muerto el perro se acabó la rabia».
Abandonar un sitio y convertirse en un cementerio de spam...
enxebree18 Octubre 2010 - 12:08pm
Abandonar un sitio y convertirse en un cementerio de spam... casi es una certeza matemática, solo basta que tengas un foro, un sistema de comentarios, un sistema de registro de usuarios, etc, que no tengas unas buenas medidas antispam y voila!! surgen de la nada decenas, cuando no cientos de ataques de spam.. y si encima empleas un sistema bien conocido como Wordpress, phpBB, Xoops, Joomla, Drupal, etc, entonces se convierte en una autentica fiesta... al final acaba afectando al PegeRank, al posicionamiento y consumiendo trafico inútil que solo les beneficia a ellos...
Saludos
Muy sutil.
car16 Octubre 2010 - 1:41pm
Muy bueno.
Kriptópolis
admin16 Octubre 2010 - 12:34pm
Kriptópolis dispone del mejor sistema posible para parar el spam: una primera línea (captcha) débil y una segunda "casi" impenetrable (moderación).
Y digo "casi" porque siempre te pueden colar algún artículo cuyo único aporte real sea el enlace al sitio del remitente, je, je.
Por otro lado no recopilar emails y -por tanto- no tenerlos almacenados evita por completo otro posible spam mucho más peligroso: el que se basa en acceder de golpe a una base de datos de miles de correos.
ja,ja... no sí me plantee
enxebree16 Octubre 2010 - 1:33pm
ja,ja... no sí me plantee postear el articulo completo, como hace Fernando, pero como tengo el hotlinking activado, sin las imágenes se perdía muchísimo contexto.
Como comento en el articulo, el captcha es una buena medida, si, pero yo la detesto... no me gusta ni tener que usarlos, ni hacérselos usar a los demás, lo veo como una batalla perdida a favor del spam, y no me gusta claudicar ni un poco ante esos indeseables...
Pero el fondo del tema, el que me preocupa, es el que intento comentar aquí, el excesivo consumo ancho de banda que consumen los spammers y que ni captchas ni otros sistemas evitan... y la solución que yo he encontrado... y sobre esto me interesa abrir el debate, porque la repercusión en la web es escasa y a mi me parece un punto muy importante a considerar
Saludos
Hotlinking
admin16 Octubre 2010 - 2:11pm
El hotlinking no es excusa porque tenemos un hermoso servidor donde albergar copias.
Pero no, en serio: el trabajo es grande y mejor que viva en tu sitio. Y si aquí se anima más el debate, pues tanto mejor.
Cierto, acabo de leer "ahora"
enxebree16 Octubre 2010 - 2:30pm
Cierto, acabo de leer "ahora" las condiciones de envío de artículos... mea culpa... no me paré a leerlo, la verdad sea dicha... de todos modos, eso es solo una parte del asunto, el script y las instrucciones se encuentran en el repositorio de ćodigo, que tampoco está alojado en mi web, si no en bitbucket.
Si lo publiqué aquí es por poder compartir la experiencia, saber si a alguien más se le había planteado antes ese dilema del consumo de ancho de banda por culpa del spam
Saludos
Pues ya que quieres debatir, debatamos
admin16 Octubre 2010 - 2:10pm
El captcha no es una batalla perdida ni tampoco una batalla ganada.
Es sólo un instrumento más, útil en combinación con otras cosas.
Ya que te has currado un buen trabajo te aportaré otro enfoque "científico": si dejo los formularios de comentarios y de registro sin captcha todos los días tengo que borrar algunos falsos usuarios y algunos intentos de "comentar". Si además no existiera moderación, esos comentarios saldrían en el sitio. En cuanto pongo el captcha ya no pierdo tiempo borrando.
"Científicamente" comprobado.
Has probado Mollom?
enxebree16 Octubre 2010 - 2:24pm
Has probado Mollom?
Te lo digo porque es eficaz, muy, muy eficaz... y usa el captcha solo para cuando duda, del comentario, del contenido, del usuario... y además usa el captcha para el registro de usuarios, para la solicitud de contraseña, etc... además de servir también para contenido inapropiado, mensajes fuera de contexto, etc...
El captcha yo lo deseche por esas dos razones, no me gusta lo que implica y era ineficaz en mi sitio, porque ya se lo saltaban y se saltaban el captcha, el recaptcha, el captcha de numeros, etc... y porqué se lo saltaban? porque ya hay personas dedicadas a hacerlo de forma manual, a meter spam manualmente y para eso no hay captcha que valga... que como lo sé? din.amica de los usuarios, que metían un mensaje hoygan... volvían tiempo después, comprobaban la existencia del comentario en las búsquedas y luego se dedicaban a sembrar spam, desde la misma ip, desde el mismo navegador/S.O.
En serio, Mollom acabó con todo eso... de 49144 mensajes spam bloqueados por Mollom se me han colado 11 mensajes en un año... y bueno, eran muy sutiles y astutos... pero una vez reportados, jamás volvieron a aparecer...
Moderación, ni me lo planteo, está claro que tengo el sitio prácticamente abandonado (no es mi intención hacer promoción con este articulo del sitio, seria ridículo, dada la escasa actividad) y muy poco tiempo libre para atenderlo... por eso me curre ese script en mis ratos libres, porque o era encontrar una solución o cerrar el sitio definitivamente. Pero aún lo conservo porque aún hay algún contenido útil a día de hoy en él...
Pero lo que más me preocupaba era el consumo de ancho de banda, ya que tampoco estaba dispuesto a cambiar de plan de hosting más por mantener un sitio casi abandonado... y los spammers casi me obligan a ello el mes que consumieron casi 7 GB de trafico de mi sitio... y ese es el tema que veo que casi nadie trata en ningún lado...
No
admin16 Octubre 2010 - 3:26pm
¿Y por qué? Porque el spam no es un problema en este sitio.
Por cierto ¿cómo has llegado a valorar en 7 GB/mes el tráfico que te roban?
La verdad, no fue fácil...
enxebree16 Octubre 2010 - 5:17pm
La verdad, no fue fácil...
Al principio observe que de un mes para otro el spam se disparó de forma desproporcionada, y al mismo tiempo se disparó el consumo de ancho de banda, entonces, una vez solucionado el spam con antispam (el primer modulo que probé que empezó a ser realmente eficaz, usando el servicio Akismet) empecé a relacionar cosas... aumento de spam -> aumento de trafico
Así que empece a observar los logs y a descubrir las ips y la forma de trabajar de los spammers... la mayoría opera en forma de redes organizadas, compartiendo en muchas ocasiones un mismo rango de ips, donde unos se dedican a sembrar spam y una o dos ips del mismo rango se dedican a hacer búsquedas en principio sin sentido, pero que son parte del contenido de esos comentarios spam enviados. Lo que hacen es evaluar la eficacia de sus ataques y la capacidad de respuesta de las medidas antispam del webmaster. En el sitioprojecthoneypot.org si haces una consulta por una ip de spammers, puedes ver esas relaciones, y la verdad tienen una información muy buena, y coincidia con lo que observaba en mis logs. Al final tenia una relación de ips, confirmadas después con los mensajes que deja Mollom en el registro, y una relación de visitas por ip con kbs descargados por visita... y de ahí los datos del tráfico... confirmados después mes a mes, aunque nunca volvieron a llegar a esa magnitudes una vez que puse a funcionar el script. Eso si, hay ciertas botnets especialmente persistentes, una en Alemania y otra en Turquia, que tuve que bloquear directamente en el .htaccess hasta que se cansaron después de tres meses..
Soy informático y estas cosas al final me divierten más que publicar artículos, y además era un reto, así que me decidí a encontrar una solución, asi que una cosa me llevó la otra... lo que más me gusta de tener la web no es el frontend, es el backend... de hecho estoy montando un sitio con Django y estoy creando una solución parecida combinando Mollom y los baneos a estas ips...
Saludos
Interesante...
admin16 Octubre 2010 - 6:06pm
Y otra cosa: ¿tienes idea de qué tipo de rentabilidad obtienen estas redes? Supongo que debe ser alta a juzgar por los medios que utilizan, pero yo no lo veo.
No lo se, pero me hago una idea...
enxebree16 Octubre 2010 - 6:42pm
Es difícil tener datos de algo así, pero la rentabilidad debe de ser muy elevada, en cuando que los recursos si usan bots automáticos son ridículos y si emplean personas imagino que deben estar en el ajo, cuando no son de países muy necesitados, que supongo que se buscan ganar la vida de algún modo...
Pero es fácil hacer una idea fijándose por ejemplo en la de sitios que hay que se dedican a la venta de enlaces entre páginas para favorecerse del pagerank y la cantidad de dinero que pagan por ello... si a uno le pagan ese dinero por vender enlaces, ¿cuanto ganan ellos? la respuesta está siempre en lo mismo, el volumen, que igual que hacen inmensamente rico a el buscador más famoso con su red de anuncios, también permiten sobrevivir a muchas otras empresas de publicidad en la red con muchos sitios web haciendo de anunciantes haciéndoles el trabajo casi por la cara...
Y teniendo en cuenta lo que más meten en el spam: sexo, medicamentos para elevar el espíritu (esas pastillitas azules), automoción, juegos, etc... y lo relación con los anunciantes legales, vemos que esos temas son precisamente los que más se pagan en la red. Tienes un sitio de tecnología y ganas la mitad en anuncios que lo que gana otro con un sitio de automoción con un tercio de las visitas, pues lo mismo pasa con el spam, supongo.
Tienen que ganar mucha, mucha pasta, por el esfuerzo que emplean en descubrir nuevos métodos y en ampliar sus botnets.,,, eso si, después aunque luego solo tengan un éxito mínimo, dada la magnitud de ataques, son muchos, muchísimos a hacerles el trabajo desde sus sitios por la cara y ellos a recoger las ganancias...