Sto usando BeautifulSoup e analizzo alcuni HTML.Voglio gestire l'indice dell'elenco di eccezioni fuori intervallo. '
Ricevo determinati dati da ciascun codice HTML (utilizzando il ciclo) e aggiungo tali dati a un determinato elenco.
Il problema è che alcuni HTML hanno un formato diverso (e non hanno i dati che voglio in essi).
Così, stavo cercando di usare la gestione delle eccezioni e aggiungere valore null
alla lista (. Devo fare questo in quanto la sequenza di dati è importante)
Per esempio, ho un codice come:
soup = BeautifulSoup(links)
dlist = soup.findAll('dd', 'title')
# I'm trying to find content between <dd class='title'> and </dd>
gotdata = dlist[1]
# and what i want is the 2nd content of those
newlist.append(gotdata)
# and I add that to a newlist
e alcuni dei collegamenti non hanno alcun <dd class='title'>
, quindi quello che voglio fare è aggiungere stringa null
alla lista, invece.
appare l'errore:
list index out of range.
quello che ho fatto provato è quello di aggiungere alcune righe come questo:
if not dlist[1]:
newlist.append('null')
continue
Ma non funziona. Si mostra ancora errore:
list index out of range.
Cosa devo fare? Dovrei usare la gestione delle eccezioni? o c'è un modo più semplice?
Qualche suggerimento? Qualsiasi aiuto sarebbe davvero fantastico!
@JhonIntriagoThoth: Mentre 'None' è chiaramente più pulito, in questo caso l'OP vuole" null ". – ThiefMaster