Sto usando BeautifulSoup per raschiare un URL e ho avuto il seguente codicepossiamo usare xpath con BeautifulSoup?
import urllib
import urllib2
from BeautifulSoup import BeautifulSoup
url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html"
req = urllib2.Request(url)
response = urllib2.urlopen(req)
the_page = response.read()
soup = BeautifulSoup(the_page)
soup.findAll('td',attrs={'class':'empformbody'})
Ora nel codice qui sopra possiamo utilizzare findAll
per ottenere i tag e le informazioni relative a loro, ma voglio usare XPath. È possibile usare xpath con BeautifulSoup? Se possibile, qualcuno può fornirmi un codice di esempio in modo che sia più utile?
Grazie mille Pieters, ho due informazioni dal codice ur, 1. Un chiarimento sul fatto che non possiamo usare xpath con BS 2. Un bell'esempio su come usare lxml. Possiamo vederlo su una particolare documentazione che "non possiamo implementare xpath usando BS in forma scritta", perché dovremmo mostrare delle prove a qualcuno che chiede chiarimenti, giusto? –
In ogni caso grazie per il tuo aiuto prezioso –
È difficile provare un risultato negativo; la [documentazione di BeautifulSoup 4] (http://www.crummy.com/software/BeautifulSoup/bs4/doc/) ha una funzione di ricerca e non ci sono risultati per 'xpath'. –