Supponiamo di voler ripristinare la seguente stringa "áe".Come ottenere una stringa inversa (unicode safe)
L'unicode per questo è "\ u0061 \ u0101 \ u0065".
L'aproach ingenua di un ritorno sarebbe char da char
private static String reverseStringNaive(String s) {
char[] characters = new char[s.length()];
for (int i = s.length() - 1; i >= 0; i--) {
int j = s.length() - i - 1;
characters[j] = s.charAt(i);
}
return new String(characters);
}
che ci dà "EA" (\ u0065 \ u0301 \ u0061), quando speriamo di ottenere "EA" (\ u0065 \ u0061 \ u0301). L'accuto d'accento "'" dovrebbe rimanere unito alla "a", non cambiare alla "e".
Il seguente codice mi dà il risultato atteso per quella stringa:
private static String reverseString(String s) {
char[] characters = new char[s.length()];
for (int i = s.length() - 1; i >= 0; i--) {
int j = s.length() - i - 1;
if (Character.isLetterOrDigit(s.charAt(i)) || Character.isISOControl(s.charAt(i))) {
characters[j] = s.charAt(i);
} else {
characters[j] = s.charAt(i-1);
characters[j+1] = s.charAt(i);
i--;
}
}
return new String(characters);
}
Sto controllando se ogni personaggio è lettera, numero o ISO Control. In caso contrario, presumo che dovrebbe restare unito al personaggio precedente.
La domanda è: ci sono altre cose da controllare o preoccupare? Il mio aproach è ancora ingenuo?
E a proposito di http://commons.apache.org/lang/api-2.5/org/apache/commons/lang/StringUtils.html#reverse(java.lang.String)? –
Fa l'apioach ingenuo. Dà il risultato sbagliato – pablosaraiva
Secondo javadoc, usa un 'StringBuffer.reverse()' e questo dovrebbe funzionare vedere http://download.oracle.com/javase/1.5.0/docs/api/java/lang/StringBuffer.html#reverse () –