Sto utilizzando scrapy per eseguire la ricerca per indicizzazione di un sito che sembra aggiungere valori casuali alla stringa di query alla fine di ciascun URL. Questo sta trasformando la scansione in una sorta di ciclo infinito.Come rimuovo una query da un url?
Come faccio a rendere scrapy trascurabile la parte stringa di query degli URL?
In questo caso: 'da urllib.parse import urlparse'? –
@RyanCady yes 'da urllib.parse import urlparse' ha funzionato per me. – nipunasudha