Ho un aggiornamento del sito Web (le persone possono aggiornare il contenuto (testo) non l'aspetto del sito Web) che ha HTML, javascript come front end lingue & python come lato back-end/server.Miglior modulo Python per l'analisi HTML
mi sto trovando che l'aggiornamento HTML è molto difficile dal front-end, perché quando prendo il codice HTML aggiornata da ele.innerHTML o $ (ele) .html() dà HTML alterato a seconda del browser (DAMN IE).
così ho deciso di aggiornare il mio HTML dal back-end, vale a dire, in Python
Cosa pensi sia il miglior modulo Python per analizzare HTML & informazioni afferrare?
miei requisiti sono:
- che il modulo sia atleast in Python 2.5 o inferiore (a causa del mio provider)
- sarò parsing del codice HTML & trovare tutti gli elementi HTML che sono della classe "aggiornabile"
- Per ogni elemento della classe "aggiornabile": estrai il testo interiore (non solo testo/contenuto html)
Quale modulo Python suggeriresti per questo?
- HTMLParser.py
- htmllib.py
- Conoscere altri moduli compatibili con Python 2.5?
La bella zuppa ora sembra essere di nuovo attiva, con una versione dal 3 luglio 2012. http://www.crummy.com/software/BeautifulSoup/ – jforberg
In effetti, questa è una grande notizia! – David