2012-05-22 64 views
6

Ho alcuni moduli sul mio sito che sono stati martellati dai bot SPAM recentemente. Finalmente l'ho preso sotto controllo (senza l'uso di un captcha).Invio di bot SPAM a un blackhole

Fondamentalmente, sto controllando il modulo per varie bandiere. Se rilevato, ho semplicemente reindirizzato la richiesta a google.

C'è un modo per reindirizzare il bot o al suo indirizzo IP, o qualche tipo di ciclo infinito che sarà possibile rallentarlo, o almeno causare un piccolo mal di testa per la persona dietro di esso?

PRECISAZIONE:

Sono già bloccando la SPAM, sto cercando un modo intelligente per irritare lo spammer una volta li ho reindirizzamento.

+4

Persona dietro? SPAM ** bot ** ?? Sarebbe una cattiva forma per '* ifinite loop *' la loro richiesta sul tuo server. Potrebbe rallentare il tuo (server) e continuare a prendere le tue risorse. – PenguinCoder

+0

Scusate, era mal formulata. Sto cercando di spingerli fuori dal mio server e in una specie di loop, blackhole, ecc. –

+0

E, sì, la persona dietro di esso. C'è sempre qualcuno dietro il bot. Sto cercando di rendere la loro vita un po 'più difficile. –

risposta

2

Una volta uno dei miei insegnanti ci ha detto di aver sviluppato una sorta di honeypot anti-spambot. È stato piuttosto semplice, ha reindirizzato i bot a una pagina generata dinamicamente che conteneva un loop infinito di indirizzi falsi. Gli obiettivi in ​​cui due: tenerli occupati e riempire il loro DB con indirizzi e-mail inutilizzabili, danneggiando gli spammer. Questa è stata solo un'idea, non so se soddisfa le tue esigenze ma.è vale lo scatto ^^ Ovviamente, è più semplice abbandonare la richiesta relativa a spambot se sei in grado di identificarli ..

+0

Questo è wpoison; ma è principalmente rivolto ai robot di raschiamento degli indirizzi. http://www.monkeys.com/wpoison/ – tripleee

+0

sì, e vuoi davvero divorare tutta la tua CPU del server che alimenta l'URL con informazioni false? Le probabilità sono che verrai bloccato dagli spider validi, oops non sei più su google. – FlavorScape

+1

Ecco un'altra trappola per i robot di scraping degli indirizzi: http://officeofstrategicinfluence.com/spam/ – Sophivorus

2

È necessario bloccare queste richieste se è possibile identificarle. Blocca i loro indirizzi IP sul lato server.

Inoltre, questo thread è correlato agli attacchi DOS, ma potrebbe essere utile.

BOT/Spider Trap Ideas

+0

Lo svantaggio di un blocco definitivo è che lo realizzeranno e si adegueranno di conseguenza. Il modo più efficace per bloccare un bot è tenerlo occupato e farlo pensare che stia facendo il suo lavoro. –

1

Tecnicamente è ancora un captcha, ma che dire usando una domanda statica 'generale' con il modulo.

What is the value of two plus two?

Verificare che il campo nello script PHP per assicurare la risposta è in realtà corretto. Se non lo è, interrompi l'elaborazione!

In caso contrario, se si ha il controllo del firewall (e della registrazione corretta), avviare la richiesta dall'indirizzo IP più offensivo. Attenzione, questo approccio potrebbe rendere gli utenti legittimi impossibilitati ad accedere al tuo sito!

+0

Giusto, capisco come fermarli, sto cercando un modo per dare loro un assaggio della loro stessa medicina. Una volta rilevato, voglio mandarli in un buco profondo che sarà difficile uscire da –

-1

I bot di spam cercano moduli di posta elettronica e commenti chiari. Non faranno nulla con un reindirizzamento. È possibile configurare un server che sia una trappola spider piena di moduli e-mail che non funzionano.

Quindi, si vorranno meccanismi di generazione automatica degli URL per definire un albero del sito, con ogni nuovo URL con un altro modulo di posta elettronica. Probabilmente vorrai farlo su un server dedicato.

Ma alla fine NO. Pensaci: in che modo il tuo minuscolo server PHP avrà mai problemi con gli zombi o un server spam a 64 core in Russia?

Non penso che tu capisca cosa fa un reindirizzamento. Imposta un codice di risposta e dice che il contenuto viene spostato "qui". Un bot antispam non si preoccuperà e probabilmente non farà nulla se non ci sono moduli email lì.

Se vuoi davvero evitare lo spam, leggi questo.Puoi intrappolarli, ma se hai a che fare con gli zombi alla fine non ha importanza. http://www.neilgunton.com/doc/?doc_id=8580

0

questo è stato lavorato per me da un giorno all'altro:

ho impostato questo formfield invisibile che i bot compilano con parole senza senso e se è piena, non ha elaborato la forma e appena restituito un pagina di successo.

Ma il post su questa particolare forma è cresciuto su base giornaliera. Ha iniziato con 2 richieste POST al giorno e alla fine ci sono state più di 20 richieste.

Quindi TL; DR invio un 404 http non trovata intestazione su questa pagina particolare ora. Umani e browser non vedono il diverso, ma per quanto ho osservato, il bot ha prima verificato la disponibilità della pagina (richiesta HEAD) - quindi il modulo era ancora lì, ma come può sapere il bot quando ottiene un 404?

Questo ha trasformato l'azione POST dei bot completamente fino a quel momento. So che questa soluzione non funziona per le pagine che devono essere visibili per i buoni bot (google ecc.), Ma per un modulo di contatto o per il modulo di accesso funziona correttamente.

Forse uno può autorizzare i bot "buoni" e inviare 404 per tutti?

Problemi correlati