Sto tentando di aprire il seguente sito Web e recuperare il cookie iniziale e usarlo per il secondo url-open, MA se si esegue il seguente codice vengono emessi 2 cookie diversi. Come posso utilizzare il cookie iniziale per il secondo url-open?Python - urllib2 & cookielib
import cookielib, urllib2
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
home = opener.open('https://www.idcourts.us/repository/start.do')
print cj
search = opener.open('https://www.idcourts.us/repository/partySearch.do')
print cj
Output mostra 2 diverse cookie ogni volta come si può vedere:
<cookielib.CookieJar[<Cookie JSESSIONID=0DEEE8331DE7D0DFDC22E860E065085F for www.idcourts.us/repository>]>
<cookielib.CookieJar[<Cookie JSESSIONID=E01C2BE8323632A32DA467F8A9B22A51 for www.idcourts.us/repository>]>
Questo sembra non funzionare più. Stranamente, infatti ... – albertov
Funziona ora :) Avevo lasciato il 'opener.addheaders' a dondolare nella mia sessione ipython. Quel codice dovrebbe funzionare così com'è (funziona per me su Python 2.6 su un Mac almeno) – albertov
Il codice che ho postato non è robusto. A volte la sessione si attaccherà, altre volte no. La mia ipotesi è che ci sia qualcosa di implementato sul lato server per scoraggiare l'accesso non umano (cioè: politiche di invalidazione delle sessioni piuttosto rigide) – albertov