Una domanda complicata sulle regex. Ho url di un tale modello:Come trovare l'URL in un altro URL?
come posso estrarre imgurl
valore?
Una domanda complicata sulle regex. Ho url di un tale modello:Come trovare l'URL in un altro URL?
come posso estrarre imgurl
valore?
Date un'occhiata a urlparse
http://docs.python.org/2/library/urlparse.html
Si può facilmente dividere il tuo URL in parametri e poi estratto valido qualunque cosa avete bisogno.
Esempio:
import urlparse
url = "http://www.domain.com/img?res=high&refurl=http://www.ahother_domain.com/page/&imgurl=http://www.one_more.com/static/images/mercedes.jpg&w=640&h=480"
urlParams = urlparse.parse_qs(urlparse.urlparse(url).query)
urlInUrl = urlParams['imgurl']
print urlInUrl
Questa soluzione asssumes che il valore imgurl
parametri sta sempre seguita da params dimensioni quali: &w=...
:
import re
re.findall('imgurl=([^&]+)&', url)
http://example.com/imgurl=foo/?imgurl=bar&imgurl=baz – atk
Usa un parser URL - i valori saranno disponibili come interrogazione parametri. L'utilizzo di un parser * effettivo * è importante in quanto si prenderà cura delle regole di codifica. – user2864740
è sempre un parametro 'refurl'? – Dropout
@Dropout è sempre come parametro 'imgurl'. –