Attualmente sto lavorando alla conversione di codici HTML con caratteri equivalenti in java. Ho bisogno di convertire il codice seguente in caratteri.Sostituisci codici HTML con caratteri equivalenti in Java
è - è
® - ®
& - &
ñ - ñ
& - &
Ho provato ad utilizzare il modello di espressione regolare
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
Quando il debug, matcher.find()
mi dà true
ma il controllo salta il ciclo in cui ho scritto il codice per la conversione. Non so cosa sta succedendo lì.
Inoltre, c'è un modo per ottimizzare questo regex?
Qualsiasi aiuto è apprezzato.
Eccezione
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)
E 'già una risposta :). [Metodo consigliato per l'escape dell'HTML in Java] (http://stackoverflow.com/questions/1265282/recommended-method-for-escaping-html-in-java) –