Utilizzando il modulo Beautiful Soup, come posso ottenere i dati di un tag div
il cui nome classe è feeditemcontent cxfeeditemcontent
? È:Ottieni il nome e il contenuto della classe utilizzando Beautiful Soup
soup.class['feeditemcontent cxfeeditemcontent']
o:
soup.find_all('class')
Questa è la sorgente HTML:
<div class="feeditemcontent cxfeeditemcontent">
<div class="feeditembodyandfooter">
<div class="feeditembody">
<span>The actual data is some where here</span>
</div>
</div>
</div>
e questo è il codice Python:
from BeautifulSoup import BeautifulSoup
html_doc = open('home.jsp.html', 'r')
soup = BeautifulSoup(html_doc)
class="feeditemcontent cxfeeditemcontent"
'classes = dict (tag.attrs) .get ('class', '')' è molto più corto del blocco 'try'. Except' e la sua funzionalità è la stessa. –
@DoronCohen è 'dict()' necessario? Sembra funzionare senza. – Mark
@Mark Ricevo un'eccezione senza 'dict()' perché è un elenco 'TypeError: gli indici di lista devono essere interi, non str'. Inoltre, questa risposta presuppone Beautiful Soup 3 (potrebbe essere il motivo per cui stai vedendo risultati diversi), probabilmente dovresti usare la versione 4 e usare l'altra risposta. – jadkik94