Ho creato un progetto Scrapy con diversi spider per eseguire la scansione di alcuni siti Web. Ora voglio usare TOR per:Scrapy with TOR (Windows)
- Nascondere il mio ip dai server sottoposti a ricerca per indicizzazione;
- Associare le mie richieste a diversi IP, simulando gli accessi da utenti diversi.
Ho letto alcune informazioni su questo, per esempio: using tor with scrapy framework, How to connect to https site with Scrapy via Polipo over TOR?
Le risposte da questi collegamenti non sono stati utili a me. Quali sono i passi che dovrei fare per far funzionare correttamente Scrapy con TOR?
EDIT 1:
Considerando risposta 1, ho iniziato con l'installazione di Tor. Mentre sto usando Windows ho scaricato il pacchetto TOR Expert (https://www.torproject.org/dist/torbrowser/5.0.1/tor-win32-0.2.6.10.zip) e ho letto il capitolo su come configurare TOR come relè (https://www.torproject.org/docs/tor-doc-windows.html.en). Purtroppo ci sono poche informazioni su come farlo su Windows. Se decomprimo l'archivio scaricato ed eseguo il file Tor \ Tor.exe non succede nulla. Tuttavia, posso vedere nel Task Manager che viene creato un nuovo processo. Non so quale sia il modo migliore per procedere da qui.
Cosa hai già raggiunto? Qual è il tuo problema? Modifica la tua domanda e spiegaci queste informazioni per consentirci di essere in grado di aiutarti. – GHajba
questo progetto scrapy su github spiega come rottamare anonymoulsy: https://github.com/WiliTest/Anonymous-scrapping-Scrapy-Tor-Privoxy-UserAgent –