Di seguito è riportato un esempio di PhantomJS che ottiene qualche elemento dal DOM id da una pagina web esterna:Come ottenere il sorgente HTML di un sito web con PhantomJS
var page = require('webpage').create();
console.log('The default user agent is ' + page.settings.userAgent);
page.settings.userAgent = 'SpecialAgent';
page.open('http://www.httpuseragent.org', function(status) {
if (status !== 'success') {
console.log('Unable to access network');
} else {
var ua = page.evaluate(function() {
return document.getElementById('myagent').textContent;
});
console.log(ua);
}
phantom.exit();
});
voglio ottenere l'intero sorgente HTML di una pagina web ... Come faccio a fare questo?
Se si desidera che il sorgente HTML, quindi usare qualcosa come [il modulo HTTP] (http://nodejs.org/docs/v0.5.2/ api/http.html # http.request) piuttosto che eseguire la pagina attraverso un browser (che eseguirà JS e manipolerà il DOM con esso). – Quentin
puoi mostrarmi un esempio? – MOB