2010-04-25 13 views

risposta

5

Dai un'occhiata alla this article che descrive utilizzando Windmill fare scrape una pagina dopo che Javascript è stato eseguito dal browser

In questo articolo verrà mostrato come estrarre le informazioni desiderate utilizzando gli stessi tre passaggi quando la pagina Web non viene scritta direttamente utilizzando HTML, ma viene generata automaticamente utilizzando JavaScript per aggiornare l'albero DOM

Hanno alcuni esempi, sono sicuro che si può facilmente adattare.

+0

Ho visto questo articolo ieri.Ma sembra che l'utente debba aprire un browser Web per raschiare la pagina, e non è quello che voglio ... Grazie comunque. – wong2

+1

È possibile (non facile ma possibile) eseguire ad es. Firefox in modalità senza testa. –

0

Per la precisione con la terminologia, Javascript non genera HTML. Javascript genera e manipola il DOM nel tuo browser. Firebug ti mostra la rappresentazione HTML di quel DOM in modo che sia leggibile. L'HTML non esiste realmente. :)

Non penso che esista una soluzione semplice e immediata. Si consiglia di guardare this blog post and comments che hanno alcune indicazioni.

Problemi correlati