Ho problemi con Selenium e PhantomJS su Windows7 quando voglio ottenere l'origine della pagina di un URL. browser.page_source
restituisce solo <html><head></head></html>
. Ho dormito prima dello browser.page_source
ma non è stato d'aiuto.Python: selenio con origine pagina PhantomJS vuota
Questo è il mio codice:
from selenium import webdriver
browser = webdriver.PhantomJS('phantomjs-1.9.7-windows\phantomjs.exe')
url = 'myurl'
browser.get(url)
print browser.page_source
su Linux con la stessa versione di PhantomJS funziona perfettamente. Funziona anche su Windows Server 2003.
Provate un po 'di debug, catturare uno screenshot ad esempio –
La schermata è vuota, un'immagine vuota. Ho pensato che fosse un problema con PhantomJS e ho provato a caricare la pagina con il webkit di PyQt4 ma il risultato è lo stesso, solo i tag e
. Questo è l'URL che mi dà questo mal di testa: https://www.homesearch.com/browse?fulltextquery=miami+fl&page=0 –Ho riscontrato lo stesso problema durante l'esplorazione di alcuni _https_: // url. Usa 'time.sleep (few_seconds)' o il webdriver [condizioni previste] (http://selenium-python.readthedocs.org/en/latest/api.html#selenium.webdriver.support.expected_conditions.presence_of_element_located) per aspettare un po ' elemento presente sulla pagina dopo aver chiamato 'browser.get (url)' –