Voglio rimuovere i tag HTML da una stringa. Questo è facile, lo so, l'ho fatto:Rimuovere alcuni tag HTML con RegExp e Java
public String removerTags(String html)
{
return html.replaceAll("\\<(/?[^\\>]+)\\>", " ").replaceAll("\\s+", " ").trim();
}
Il problema è che io non voglio rimuovere tutti i tag .. Voglio che il tag
<span style=\"background-color: yellow\"> (text) </ span>
soggiorno intatta nella stringa ..
sto usando questo come una sorta di "punto culminante" nella ricerca di un'applicazione web utilizzando GWT che sto facendo ...
E ho bisogno di fare questo, perché se la ricerca trova TE xt che contiene qualche tag HTML (l'indicizzazione è fatta da Lucene), ed è rotta, appendHTML da safeHTMLBuilder non è in grado di montare una stringa.
È possibile farlo in un modo abbastanza buono?
Abbracci.
queste domande sono molto frequenti in questi giorni. Perché non possiamo raggruppare le domande simili insieme? * # SO tip *;) –
è un vero uomo. – caarlos0
Assicurati di prendere in considerazione anche i valori di riferimento delle entità. – Edward