urllib.urlretrieve
ritorna in silenzio anche se il file non esiste sul server http remoto, semplicemente salva una pagina HTML per il file denominato. Per esempio:Come sapere se urllib.urlretrieve ha esito positivo?
urllib.urlretrieve('http://google.com/abc.jpg', 'abc.jpg')
torna solo in silenzio, anche se abc.jpg non esiste sul server di google.com, il generato abc.jpg
non è un file jpg valida, in realtà è una pagina html. Credo che le intestazioni restituite (un'istanza httplib.HTTPMessage) possono essere utilizzati per dire realmente se i successi di recupero o no, ma non riesco a trovare alcun documento per httplib.HTTPMessage
.
Qualcuno può fornire alcune informazioni su questo problema?
È possibile che urllib2 fornisca il comportamento di caching di urlretrieve? O dovremmo reimplementarlo? – Kiv
Vedere questa fantastica destinazione da ActiveState: http://code.activestate.com/recipes/491261/ Lo stiamo usando nel nostro progetto attuale, funziona perfettamente –
urlopen non fornisce una funzione di aggancio (per mostrare la barra di avanzamento per esempio) come urlretrieve. –