ho avuto un problema simile oggi, e non aveva l'aspetto di tutte le opzioni standard come StringTokenizer, StrTokenizer, Sc Anner era una buona misura. Tuttavia, non è difficile implementare le basi.
Questo esempio gestisce tutti i casi limite attualmente commentati su altre risposte. Stai attento, non l'ho ancora verificato per la piena conformità POSIX. Elenco comprensivo dei test unitari disponibili on GitHub - rilasciato in pubblico dominio tramite l'unlicenza.
public List<String> parseArgs(CharSequence argString) {
List<String> tokens = new ArrayList<String>();
boolean escaping = false;
char quoteChar = ' ';
boolean quoting = false;
StringBuilder current = new StringBuilder() ;
for (int i = 0; i<argString.length(); i++) {
char c = argString.charAt(i);
if (escaping) {
current.append(c);
escaping = false;
} else if (c == '\\' && !(quoting && quoteChar == '\'')) {
escaping = true;
} else if (quoting && c == quoteChar) {
quoting = false;
} else if (!quoting && (c == '\'' || c == '"')) {
quoting = true;
quoteChar = c;
} else if (!quoting && Character.isWhitespace(c)) {
if (current.length() > 0) {
tokens.add(current.toString());
current = new StringBuilder();
}
} else {
current.append(c);
}
}
if (current.length() > 0) {
tokens.add(current.toString());
}
return tokens;
}
fonte
2013-12-22 00:44:45
In particolare - "come se la shell li elaborasse" è un compito abbastanza difficile; 'shlex' lo fa bene, ma molti algoritmi ingenui non lo faranno. Ad esempio, in shell, "tre quattro" e "tre" quattro sono esattamente equivalenti, così come "tre \ quattro". –