Come ottenere un elemento nidificato in una bella zuppa

Sto lottando con la sintassi richiesta per afferrare alcuni hrefs in un td. Gli elementi table, tr e td non hanno classe o id.Come ottenere un elemento nidificato in una bella zuppa

Se volessi prendere l'ancora in questo esempio, di cosa avrei bisogno?

< tr> < td> < a> ...

Grazie

fonte

2009-06-29 joepour

Come per i documenti, per prima cosa fare un albero sintattico:

import BeautifulSoup 
html = "<html><body><tr><td><a href='foo'/></td></tr></body></html>" 
soup = BeautifulSoup.BeautifulSoup(html)

e poi si cerca in esso, ad esempio per <a> variabili il cui padre immediato è un <td>:

for ana in soup.findAll('a'): 
    if ana.parent.name == 'td': 
    print ana["href"]

fonte

2009-06-29 14:37:27

purtroppo non funziona – Greyshack

@Greyshack, funziona bene per me (utilizzando l'attuale versione, ovviamente, 6+ anni dopo l'installazione post-pip originale di beautifulsoup4, e quindi ovviamente il nome del modulo è ora bs4) - stampa 'foo' , come richiesto. Ovviamente è impossibile offrirti un aiuto basato su una descrizione del tuo problema tanto vaga quanto "doesnt [sic] work"! -) –

qualcosa di simile?

from BeautifulSoup import BeautifulSoup 
soup = BeautifulSoup(html) 
anchors = [td.find('a') for td in soup.findAll('td')]

Questo dovrebbe trovare il primo "a" all'interno di ciascun "td" nel codice HTML fornito. È possibile modificare td.find in modo più specifico oppure utilizzare findAll se si dispone di più collegamenti all'interno di ciascun td.

UPDATE: re il commento di Daniele, se si vuole fare in modo di non ha nessun None 's nella lista, allora si potrebbe modificare l'elenco di comprensione così:

from BeautifulSoup import BeautifulSoup 
soup = BeautifulSoup(html) 
anchors = [a for a in (td.find('a') for td in soup.findAll('td')) if a]

che fondamentalmente solo aggiunge un controlla se hai un elemento reale restituito da td.find('a').

fonte

2009-06-29 14:37:15

che è molto inteligente! ma se 'a' non è presente, includerebbe una None nell'elenco delle ancore? come posso popolare la lista delle ancore solo l'attuale 'a's skypping the Nones? –

Ok, ho aggiornato la domanda per gestire la rimozione di Nessuno dall'elenco. –

è fantastico! Grazie! –

Come ottenere un elemento nidificato in una bella zuppa

risposta

Problemi correlati