sto cercando di analizzare recensione da questa pagina: http://www.amazon.co.uk/product-reviews/B00143ZBHYNon in grado di analizzare HTML usando lxml Xpath parser
Utilizzando seguente approccio:
Codice
html # a variable which contains exact html as given at the above page.
from lxml import etree
tree = etree.HTML(html)
r = tree.xpath(".//*[@id='productReviews']/tbody/tr/td[1]/div[9]/text()[4]")
print len(r)
print r[0].tag
uscita
0
Traceback (most recent call last):
File "c.py", line 37, in <module>
print r[0].tag
IndexError: list index out of range
p, s ,: Mentre si utilizza lo stesso xpath su xpath checker addon di firefox, sono in grado di farlo facilmente. Ma nessun risultato qui, per favore aiuto!
non so perché Chrome ha mostrato tbody in XPath :( – codersofthedark
E 'generati automaticamente – fedosov