Sto provando a creare un programma python che acceda al sito della mia università usando il mio id e password. Questa è la pagina formale per l'accesso: https://webapp.pucrs.br/consulta/HTTP POST e GET con i cookie per l'autenticazione in python
Come si può notare, i due campi sono denominati pr1 e pr2. La pagina utilizza POST per inviare i dati. INOLTRE, c'è un cookie che viene scaricato quando viene caricata la pagina, si tratta di un JSESSIONID contenente un valore casuale che, come ho capito, è necessario tornare sull'intestazione del metodo POST per autenticare l'accesso.
Ho scritto il seguente codice, ma la pagina di ritorno sul metodo GET dice "La sessione non è stata inizializzata", probabilmente perché il cookie non è stato restituito correttamente.
from urllib2 import Request, build_opener, HTTPCookieProcessor, HTTPHandler
import httplib, urllib, cookielib, Cookie, os
conn = httplib.HTTPConnection('webapp.pucrs.br')
#COOKIE FINDER
cj = cookielib.CookieJar()
opener = build_opener(HTTPCookieProcessor(cj),HTTPHandler())
req = Request('http://webapp.pucrs.br/consulta/principal.jsp')
f = opener.open(req)
html = f.read()
for cookie in cj:
c = cookie
#FIM COOKIE FINDER
params = urllib.urlencode ({'pr1':111049631, 'pr2':<pass>})
headers = {"Content-type":"text/html",
"Set-Cookie" : "JSESSIONID=70E78D6970373C07A81302C7CF800349"}
# I couldn't set the value automaticaly here, the cookie object can't be converted to string, so I change this value on every session to the new cookie's value. Any solutions?
conn.request ("POST", "/consulta/servlet/consulta.aluno.ValidaAluno",params, headers) # Validation page
resp = conn.getresponse()
temp = conn.request("GET","/consulta/servlet/consulta.aluno.Publicacoes") # desired content page
resp = conn.getresponse()
print resp.read()
Dove inserisco questo cookie in modo che l'accesso sia autenticato?
È possibile utilizzare la sessione per gestire automaticamente i cookie. Da [docs] (http://docs.python-requests.org/en/latest/user/advanced/#session-objects): L'oggetto * Session consente di mantenere determinati parametri attraverso le richieste. Persiste anche i cookie su tutte le richieste fatte dall'istanza Session. * –
@PiotrDobrogost Che bello, grazie! E il codice sembra ancora migliore. – jorgeca
Ora puoi migliorare la tua risposta ... –