aggiornato con una nuova, versione ancora più contorto. Questo è ufficialmente ridicolo; la prossima iterazione utilizzerà un parser appropriato (o c.c.monads e un po 'di logica simile a Parsec). Vedi la cronologia delle revisioni su questa risposta per l'originale.
Questo gruppo contorto di funzioni sembra fare il trucco (non il mio più secco con questo, scusate!):
(defn initial-state [input]
{:expecting nil
:blocks (mapcat #(str/split % #"(?<=\s)|(?=\s)")
(str/split input #"(?<=(?:'|\"|\\))|(?=(?:'|\"|\\))"))
:arg-blocks []})
(defn arg-parser-step [s]
(if-let [bs (seq (:blocks s))]
(if-let [d (:expecting s)]
(loop [bs bs]
(cond (= (first bs) d)
[nil (-> s
(assoc-in [:expecting] nil)
(update-in [:blocks] next))]
(= (first bs) "\\")
[nil (-> s
(update-in [:blocks] nnext)
(update-in [:arg-blocks]
#(conj (pop %)
(conj (peek %) (second bs)))))]
:else
[nil (-> s
(update-in [:blocks] next)
(update-in [:arg-blocks]
#(conj (pop %) (conj (peek %) (first bs)))))]))
(cond (#{"\"" "'"} (first bs))
[nil (-> s
(assoc-in [:expecting] (first bs))
(update-in [:blocks] next)
(update-in [:arg-blocks] conj []))]
(str/blank? (first bs))
[nil (-> s (update-in [:blocks] next))]
:else
[nil (-> s
(update-in [:blocks] next)
(update-in [:arg-blocks] conj [(.trim (first bs))]))]))
[(->> (:arg-blocks s)
(map (partial apply str)))
nil]))
(defn split-args [input]
(loop [s (initial-state input)]
(let [[result new-s] (arg-parser-step s)]
(if result result (recur new-s)))))
Un po 'incoraggiante, le seguenti rese true
:
(= (split-args "asdf 'asdf \" asdf' \"asdf ' asdf\" asdf")
'("asdf" "asdf \" asdf" "asdf ' asdf" "asdf"))
Quindi:
(= (split-args "asdf asdf ' asdf \" asdf ' \" foo bar ' baz \" \" foo bar \\\" baz \"")
'("asdf" "asdf" " asdf \" asdf " " foo bar ' baz " " foo bar \" baz "))
Speriamo che s dovrebbe regolare gli argomenti regolari, ma non quelli racchiusi tra virgolette, gestire virgolette doppie e singole, tra virgolette doppie racchiuse tra virgolette doppie senza virgolette (si noti che attualmente tratta citazioni singole citate all'interno di virgolette singole senza virgolette nello stesso modo, che è apparentemente alla varianza con la * nix shell way ... argh) ecc. Si noti che si tratta fondamentalmente di un calcolo in una monade di stato ad-hoc, appena scritta in un modo particolarmente brutto e in un disperato bisogno di DRY up. :-P
fonte
2010-07-15 04:02:44
Penso che la shell abbia il compito di dividere gli argomenti della riga di comando, non Java. –
Indipendentemente da ciò, sto ancora cercando un modo decente per farlo. – Rayne