Quindi sto provando ad accedere a Quora usando Python e poi raschiare qualcosa.Il selenio è lento o il mio codice è sbagliato?
Sto usando Selenium per accedere al sito. Qui è il mio codice:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Firefox()
driver.get('http://www.quora.com/')
username = driver.find_element_by_name('email')
password = driver.find_element_by_name('password')
username.send_keys('email')
password.send_keys('password')
password.send_keys(Keys.RETURN)
driver.close()
Ora le domande:
Ci sono voluti ~ 4 minuti per trovare e riempire il form di login, che dolorosamente lenti. C'è qualcosa che posso fare per accelerare il processo?
Al momento dell'accesso, come faccio a verificare che non vi siano errori? In altre parole, come posso controllare il codice di risposta?
Come faccio a salvare i cookie con selenio in modo da poter continuare a fare scraping una volta effettuato l'accesso?
Se non c'è modo di rendere il selenio più veloce, c'è qualche altra alternativa per l'accesso? (Quora non ha un'API)
Quali linee stanno prendendo il tempo? –
@vincebowdren Quasi tutti loro. Il browser si apre bene, ma poi trovare i campi e riempirli richiede circa un minuto ciascuno. –
@ user1177636 Sì. Funziona bene su Google. Deve essere un problema con quora. –