2010-10-06 17 views
12

ho bisogno di automatizzare qualcosa di simile:Come script di Firefox o qualsiasi browser basato su Mozilla

  1. aprire un URL
  2. Attendere che la pagina viene caricata completamente
  3. Salva pagina completa come ... (Posso fornire un nome).

Ho visto https://developer.mozilla.org/en/Command_Line_Options ma non riesco a trovare un'opzione per richiamare il comando "salva pagina come ... (in modalità pagina Web completa)". Quindi posso avere tutti i file CSS, js, xml e relativi necessari per visualizzare la pagina.

Conosco un po 'di Python che potrei usare se trovo un modo per "parlare" con Firefox. Il modulo webbrowser non è di aiuto in quanto non consente di salvare una pagina: http://docs.python.org/library/webbrowser.html

Sono aperto a qualsiasi tipo di soluzione.

Piattaforma: Linux, ma potrei usarne un altro se non c'è altro modo.

Importante: Non riesco a recuperare l'HTML fornito dal server Web, poiché ho bisogno di tutti i file CSS, js, immagini e file che vengono utilizzati per visualizzare la pagina come resi dal browser. Ad esempio, un'immagine può non essere collegata nell'HTML ma referenziata da un js che viene eseguito quando viene eseguito il rendering della pagina. L'unico modo in cui penso di poter recuperare questa immagine è eseguire la pagina come se fossi il browser e quindi ottenere tutti i file dalla pagina risultante (e non dalla pagina originale).

+1

Windows, * Nix o OS X? Sto pensando che potresti semplicemente usare un downloader HTTP come cURL o wget, a la http://superuser.com/questions/55040/ –

+8

Stai cercando di salvare una copia di Internet? – JoshD

+1

Penso che tu possa averlo su DVD da Amazon. – bobber205

risposta

4

Forse qualcosa dalla raccolta di strumenti funziona per voi.

Selenium IDE è un ambiente di sviluppo integrato per gli script di selenio. È implementato come estensione per Firefox e consente di registrare, modificare e eseguire il debug dei test. L'IDE Selenium include l'intero nucleo di selenio, che consente di registrare e riprodurre facilmente e rapidamente i test nell'ambiente reale in cui verranno eseguiti.

1

Altre alternative selenio può essere utilizzato

E qualcosa di scritto n in cima a quella

+0

twill è abbastanza buono, mega sintassi semplificata rispetto alla base della forcella (Mechanize) e abbastanza buono come AutoIT per Windows. Vedo persone di alto livello che chiedono alternative a AutoIT per Linux e nessuno lo ha menzionato. Grazie per avermi segnalato. – erm3nda

Problemi correlati