Quando eseguo questo comando:Siti non accettando utente wget intestazione agente
wget --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" http://yahoo.com
... ottengo questo risultato (con niente altro nel file):
<!-- hw147.fp.gq1.yahoo.com uncompressed/chunked Wed Jun 19 03:42:44 UTC 2013 -->
Ma quando corro wget http://yahoo.com
con l'opzione --user-agent
, ottengo l'intera pagina.
L'agente utente è la stessa intestazione inviata dal browser corrente. Perché succede? C'è un modo per assicurarsi che l'agente utente non venga bloccato quando si usa wget?
Non è solo Yahoo a filtrare richieste come questa - Qualcosa di cui essere sempre consapevoli! – user3791372