Ho un mucchio di dati HTML che sto scrivendo in un file PDF usando PHP. Nel PDF, voglio che tutto il codice HTML venga rimosso e ripulito. Così, per esempio:Pulire HTML con PHP per creare una stringa pulita
<ul>
<li>First list item</li>
<li>Second list item which is quite a bit longer</li>
<li>List item with apostrophe 's 's</li>
</ul>
dovrebbe diventare:
First list item
Second list item which is quite a bit longer
List item with apostrophe 's 's
Tuttavia, se semplicemente uso strip_tags()
, ho qualcosa di simile:
First list item

Second list item which is quite a bit
longer

List item with apostrophe ’s ’s
Si noti inoltre il rientro della produzione.
Qualche suggerimento su come pulire correttamente l'HTML con stringhe piacevoli e pulite senza spazi vuoti e caratteri strani?
Grazie :)
Dubito che 'strip_tags()' solo codifichi le tue entità. Sei sicuro di non perdere una chiamata a 'htmlentities' da qualche parte? – Yoshi
Il rientro è esattamente quello che mi aspetterei, PHP sta tagliando i tag, ma non il testo extra che li circonda. – scragar
Vuoi dire che * dovrei * o * non dovrei * usare htmlentities() da qualche parte? In questo momento non lo sono. I dati HTML provengono direttamente da un database. – Rein