Mi piacerebbe davvero essere in grado di consentire a Beautiful Soup di abbinare qualsiasi elenco di tag, in questo modo. So che attr accetta regex, ma c'è qualcosa nella bella zuppa che ti permette di farlo?Beautiful Soup Usando Regex per trovare i tag?
soup.findAll("(a|div)")
uscita:
<a> ASDFS
<div> asdfasdf
<a> asdfsdf
Il mio obiettivo è quello di creare un raschietto che può afferrare tabelle da siti. Talvolta i tag vengono denominati in modo incoerente e mi piacerebbe poter inserire un elenco di tag per denominare la parte "dati" di una tabella.
è possibile utilizzare un elenco di tag: 'soup.find_all ([ 'a', 'div']) ' –
@ behzad.nouri dovresti assolutamente metterlo come risposta. – alecxe