2013-08-29 12 views
13

Ho un piccolo sito Web che cerco di eseguire il mirroring sulla macchina locale con solo il file html, nessuna immagine, file di immagine allegata ... pdf, ..etc.Solo HTML Wget Mirror

Non ho mai specchiato un sito Web prima e penso che sarebbe una buona idea porre la domanda prima di fare qualcosa di catastrofico.

Questo è il comando che voglio eseguire e mi chiedo se è necessario aggiungere altro.

wget --mirror <url> 

Grazie!

risposta

17

Il -R e -A opzioni vengono utilizzate per rifiutare o accettare specifici tipi di file.

Considerare anche la larghezza di banda utilizzata per scaricare un intero sito Web. Si consiglia di aggiungere l'opzione --random-wait.

Se si desidera saltare tutte le immagini e PDF, il comando sarà simile:

wget --mirror --random-wait -R gif,jpg,pdf <url> 

Nota: il mirroring di un sito web può andare contro la politica, quindi ti suggerisco di controllare prima.

Fonti:

2

Ci sono anche le patch wget che aggiungono opzioni di filtro mimetypes ...