ho una stringa che contiene l'HTML markup come i collegamenti, il testo in grassetto, eccutilizzando python, rimuovere i tag HTML/formattazione da una stringa
Voglio mettere a nudo tutti i tag in modo non mi resta che il testo grezzo.
Qual è il modo migliore per farlo? regex?
Questo funziona solo in modo affidabile su ben formato HTML (cioè, senza escape '' <' or '> al di fuori dei tag effettivi, nessun tag malformati come '
Si prega di aggiungere ulteriori chiarimenti in merito alle situazioni molto limitate in cui sarebbe una buona idea e rimuoveremo il mio voto negativo. Grazie. – Trufa
più questo rimuoverà anche il seguente testo => "if 3 < 5 then 5 > 3" – Shaokan