Sto cercando di raccogliere informazioni da un insieme di pagine Web che sono tutte formattate in modo molto simile. Ho bisogno di alcune informazioni che vengono caricate nella pagina da Javascript dopo l'apertura. Sembra che HTMLUnit sia uno strumento abbastanza comune per farlo, quindi è quello che sto usando. È sfortunatamente molto lento, che è una lamentela che ho visto in molti forum. Il comando webClient.getPage() è ciò che sta richiedendo per sempre. Quando spengo Javascript, viene eseguito rapidamente, ma ho bisogno di eseguire alcuni comandi Javascript. Mi stavo chiedendo, c'è un modo per eseguire selettivamente alcuni comandi Javascript invece di tutti?Posso configurare HTMLUnit per eseguire solo processi javascript specifici e non il tutto?
In alternativa, esiste un programma molto più veloce di HTMLUnit per l'elaborazione di Javascript?
Grazie, ho appena provato la seconda parte, e lo ha fatto aiutare un po '. Proverò la prima parte domani e vedrò come va. Qualche idea su altri strumenti da usare? Sono a conoscenza del fatto che questo è un kit di test e quindi funziona lentamente per poter gestire bene il codice malformato. Dal momento che lo sto usando su siti web che funzionano chiaramente, c'è uno strumento più veloce che conosci? –
@ user3598519 puoi provare anche phantomJS. è piuttosto veloce. HtmlUnit è un po 'più robusto però. –
Che ne dici di usare NodeJS? Ho appena iniziato a leggerlo, sembra che sia veloce ma forse ha delle limitazioni di funzionalità che non conosco. Per il compito di caricare una pagina Web, eseguire un comando javascript dalla pagina e raccogliere i risultati, NodeJS sarebbe un'alternativa più veloce? –