mio modo preferito per farlo è:
docker run -it --rm --name chrome --shm-size=1024m --cap-add=SYS_ADMIN --entrypoint=/usr/bin/google-chrome-unstable yukinying/chrome-headless-browser --headless --disable-gpu --dump-dom https://www.facebook.com
Se non hai familiarità con il funzionamento Docker, siate pazienti - la prima volta sarà lento ma invocazioni successive sarà rapida.
Altre informazioni
Testato su
Ubuntu 16
Linux intel-nuc 4.4.0-21-generiC#37-Ubuntu SMP Mon Apr 18 18:33:37 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
Docker versione:
Docker version 1.10.3, build 20f81dd
Mac OS X Sierra
Darwin MacBook-Pro.local 16.7.0 Darwin Kernel Version 16.7.0: Thu Jun 15 17:36:27 PDT 2017; root:xnu-3789.70.16~2/RELEASE_X86_64 x86_64 i386 MacBookPro14,3 Darwin
versione Docker:
Docker version 17.06.1-ce, build 874a737
Se si installa tidy
è possibile far rientrare il codice HTML troppo.
fonte
2017-09-19 21:35:14
Ho fatto questo al momento della pubblicazione ma penso ci fosse un motivo per cui questa non è la soluzione perfetta. Penso che volevo salvare i gestori di eventi sul DOM che il dump HTML non fa. – styfle
@styfle Non sono sicuro di averlo capito. Quando si preme F12 è il rendering (testo corretto?) HTML che vedo, non il dump di base che ti darà "View Page Source". Ho seguito il consiglio di Damon e ho ottenuto tutto ciò di cui avevo bisogno (una casella di selezione popolata da jquery). È ancora un approccio molto maldestro, una semplice Seleziona tutto dalla pagina degli elementi sarebbe molto più intuitiva. –
Solo "Copia" invece di "Copia come HTML" fa il trucco. Quindi incollare nel blocco note. – Karlth