Sto provando a convertire una stringa HTML in una dom per apportare alcune modifiche a livello di dominio e convertirla in una stringa. L'HTML è in francese e caratteri come é sono mostrati come é
è la stringa convertita dopo la trasformazione.é mostrato come & eacute; dopo la conversione dom in java
TransformerFactory transformerFactory = TransformerFactory.newInstance();
Transformer transformer = transformerFactory.newTransformer();
DOMSource source = new DOMSource(doc);
String modifiedContent = "";
StringWriter writer = new StringWriter();
StreamResult result = new StreamResult(writer);
transformer.transform(source, result);
modifiedContent = writer.toString();
"Résultats de recherche" è una stringa, dopo dom viene convertito in stringa, "Résultats de recherche
" è il risultato.
Lo sto inserendo in un processore FOP per convertirlo in un pdf, quindi ho bisogno dei caratteri nella sua forma originale.
Provate a convertire é a \ u00E9 (presentazione Unicode) date un'occhiata a questo link potrebbe aiutarvi http://tutorials.jenkov.com/java-internationalization/unicode.html – esprittn
'writer.toString()' stampa 'R & Atilde; © sultats'? – sp00m
@ sp00m, si, esattamente – stackMan10