Sto cercando di raschiare i dati del Regno Unito Valutazioni Food Agency aspx pagine dei risultati delle paroli di ricerca utilizzando Mechanize/Python su scraperwiki (http://scraperwiki.com/scrapers/food_standards_agency/), ma fino a venire con un (e, g http://ratings.food.gov.uk/QuickSearch.aspx?q=po30.) problema quando si cerca di seguire "prossimi" link della pagina che hanno la forma:Screenscaping aspx con Python Mechanize - Javascript modulo di presentazione
<input type="submit" name="ctl00$ContentPlaceHolder1$uxResults$uxNext" value="Next >" id="ctl00_ContentPlaceHolder1_uxResults_uxNext" title="Next >" />
il gestore del modulo si presenta come:
<form method="post" action="QuickSearch.aspx?q=po30" onsubmit="javascript:return WebForm_OnSubmit();" onkeypress="javascript:return WebForm_FireDefaultButton(event, 'ctl00_ContentPlaceHolder1_buttonSearch')" id="aspnetForm">
<input type="hidden" name="__EVENTTARGET" id="__EVENTTARGET" value="" />
<input type="hidden" name="__EVENTARGUMENT" id="__EVENTARGUMENT" value="" />
<input type="hidden" name="__LASTFOCUS" id="__LASTFOCUS" value="" />
Una traccia HTTP quando clicco manualmente i collegamenti prossimi concerti __E VENTTARGET come vuoto? Tutti i presepi che posso trovare su altri scrapers mostrano la manipolazione di __EVENTTARGET come modo di gestire le pagine successive.
In effetti, non sono sicuro di come la pagina che voglio rasentare carichi la pagina successiva? Qualunque cosa io lanci al raschietto, riesce sempre a caricare la prima pagina dei risultati. (Anche essere in grado di cambiare il numero di risultati per pagina sarebbe utile, ma non riesco a vedere come farlo!)
Quindi - qualsiasi idea su come raschiare le pagine dei risultati 1 + N'th per N> 0?