Ho 1000+ URL che voglio raschiare per recuperare il valore del titolo dall'HTML. Dopo aver provato cose diverse, alla fine ho usato gli script iMacros, di cui non so nulla. Tuttavia, sono riuscito a creare una sceneggiatura dopo aver letto le guide.Come ignorare gli errori HTTP in uno script iMacros?
Il mio script è perfettamente funzionante, ma ha un problema: quando leeching URL titoli, se incontra un errore HTTP (ad esempio link morto, pagina proibito, ecc), si blocca con un messaggio d'errore come questo:
Error -1350: Error loading page. Http status 403. Line 4: URL GOTO= http://url.com
Invece di andare in crash quando lo script rileva questi errori, vorrei semplicemente saltare l'URL e continuare a correre. Come posso modificare il mio script per farlo? Qui è il mio script:
VERSION BUILD=9002379
TAB T=1
TAB CLOSEALLOTHERS
URL GOTO=http://google.com/
ADD !EXTRACT {{!URLCURRENT}}
TAG POS=1 TYPE=TITLE ATTR=* EXTRACT=TXT
SAVEAS TYPE=EXTRACT FOLDER=d:/ FILE=links.txt
SET !EXTRACT_TEST_POPUP NO
uscita:
http://google.com/,Google
Vorrei anche per sostituire la virgola dopo l'URL nell'output con un punto e virgola.
Sembra che tu voglia usare [! ERRORIGNORE] (http://wiki.imacros.net/!ERRORIGNORE) –
puoi dirmi come usarlo? forse rieditare il mio config con le modifiche e abbiamo bisogno di aggiungere questa linea per ogni url, causa mal copia incolla queste righe più volte – Texh
Basta posizionare la linea 'set! ERRORIGNORE affermativa sopra tutte le altre comandi –