Ho il seguente codice Java:Java espressione regolare per togliere tag XML, ma non tag contenuti
str = str.replaceAll("<.*?>.*?</.*?>|<.*?/>", "");
Questo trasforma una stringa in questo modo:
How now <fizz>brown</fizz> cow.
Into:
How now cow.
Tuttavia, desidero semplicemente rimuovere i tag <fizz>
e </fizz>
o solo standalone </fizz
> e lascia il contenuto dell'elemento da solo. Quindi, una regex che avrebbe trasformato il sopra in:
How now brown cow.
o, per usare una stringa più complessa, somethng che trasforma:
How <buzz>now <fizz>brown</fizz><yoda/></buzz> cow.
Into:
How now brown cow.
Ho provato questo:
str = str.replaceAll("<.*?></.*?>|<.*?/>", "");
E ciò non lavorare affatto Qualche idea? Grazie in anticipo!
di solito se i tag 'xml' e' regex' mostrano insieme, si otterrebbe un commento, si dice .... – Kent
Hai provato a utilizzare un parser XML? Trovo la mia vita molto più semplice con JDOM per l'analisi di XML. –
Non posso entrare nei dettagli senza cadere in un enorme backstory ma non è possibile qui (XML Parser). Sto solo cercando una soluzione regex. – IAmYourFaja