2015-08-12 10 views
5

Ho 1000+ URL che voglio raschiare per recuperare il valore del titolo dall'HTML. Dopo aver provato cose diverse, alla fine ho usato gli script iMacros, di cui non so nulla. Tuttavia, sono riuscito a creare una sceneggiatura dopo aver letto le guide.Come ignorare gli errori HTTP in uno script iMacros?

Il mio script è perfettamente funzionante, ma ha un problema: quando leeching URL titoli, se incontra un errore HTTP (ad esempio link morto, pagina proibito, ecc), si blocca con un messaggio d'errore come questo:

Error -1350: Error loading page. Http status 403. Line 4: URL GOTO= http://url.com

Invece di andare in crash quando lo script rileva questi errori, vorrei semplicemente saltare l'URL e continuare a correre. Come posso modificare il mio script per farlo? Qui è il mio script:

VERSION BUILD=9002379 
TAB T=1 
TAB CLOSEALLOTHERS 
URL GOTO=http://google.com/ 
ADD !EXTRACT {{!URLCURRENT}} 
TAG POS=1 TYPE=TITLE ATTR=* EXTRACT=TXT 
SAVEAS TYPE=EXTRACT FOLDER=d:/ FILE=links.txt 
SET !EXTRACT_TEST_POPUP NO 

uscita:

http://google.com/,Google 

Vorrei anche per sostituire la virgola dopo l'URL nell'output con un punto e virgola.

+2

Sembra che tu voglia usare [! ERRORIGNORE] (http://wiki.imacros.net/!ERRORIGNORE) –

+0

puoi dirmi come usarlo? forse rieditare il mio config con le modifiche e abbiamo bisogno di aggiungere questa linea per ogni url, causa mal copia incolla queste righe più volte – Texh

+2

Basta posizionare la linea 'set! ERRORIGNORE affermativa sopra tutte le altre comandi –

risposta

1

nei punti critici in cui non si desidera uscire a fallisce:

SET !ERRORIGNORE YES 

Se si desidera tornare a un certo punto si fermano su un errore:

SET !ERRORIGNORE NO 

Puoi usa queste due quante volte vuoi, anche ogni seconda fila si accende e si spegne.

Problemi correlati