Come posso raschiare dati generati dinamicamente da JavaScript nel documento html utilizzando C#?Scraping dei dati generati dinamicamente da JavaScript nel documento html utilizzando C#
Utilizzando WebRequest
e HttpWebResponse
nella libreria C#, sono in grado di ottenere l'intero codice sorgente HTML come stringa, ma la difficoltà è che i dati che desidero non sono contenuti nel codice sorgente; i dati sono generati dinamicamente da JavaScript.
D'altra parte, se i dati che desidero sono già nel codice sorgente, sono in grado di ottenerli facilmente utilizzando le espressioni regolari.
Ho scaricato HtmlAgilityPack
, ma non so se sarebbe preso cura del caso in cui gli elementi sono generati dinamicamente da JavaScript ...
La ringrazio molto!
Dovrete correre attraverso un motore JavaScript di qualche tipo. Forse qualcosa come [Awesomium] (http://www.awesomium.com/)? –
Prendi uno sguardo qui: http://stackoverflow.com/questions/18539491/headless-browser-and-scraping-solutions – sagibb