Esiste un metodo rapido per specificare un ordine personalizzato su sort
/sort!
su Julia DataFrames?Ordinamento personalizzato efficiente in Julia DataFrames?
julia> using DataFrames
julia> srand(1);
julia> df = DataFrame(x = rand(10), y = rand([:high, :med, :low], 10))
10×2 DataFrames.DataFrame
│ Row │ x │ y │
├─────┼────────────┼──────┤
│ 1 │ 0.236033 │ med │
│ 2 │ 0.346517 │ high │
│ 3 │ 0.312707 │ high │
│ 4 │ 0.00790928 │ med │
│ 5 │ 0.488613 │ med │
│ 6 │ 0.210968 │ med │
│ 7 │ 0.951916 │ low │
│ 8 │ 0.999905 │ low │
│ 9 │ 0.251662 │ high │
│ 10 │ 0.986666 │ med │
julia> sort!(df, cols=[:y])
10×2 DataFrames.DataFrame
│ Row │ x │ y │
├─────┼────────────┼──────┤
│ 1 │ 0.346517 │ high │
│ 2 │ 0.312707 │ high │
│ 3 │ 0.251662 │ high │
│ 4 │ 0.951916 │ low │
│ 5 │ 0.999905 │ low │
│ 6 │ 0.236033 │ med │
│ 7 │ 0.00790928 │ med │
│ 8 │ 0.488613 │ med │
│ 9 │ 0.210968 │ med │
│ 10 │ 0.986666 │ med │
Mi piacerebbe avere la colonna y
ordinati con :low
primo, seguito da :med
e :high
. Quale sarebbe il modo migliore per farlo? So che posso fare quanto segue:
julia> subdfs = []
0-element Array{Any,1}
julia> for val in [:low, :med, :high]
push!(subdfs, df[df[:y] .== val, :])
end
julia> vcat(subdfs...)
10×2 DataFrames.DataFrame
│ Row │ x │ y │
├─────┼────────────┼──────┤
│ 1 │ 0.951916 │ low │
│ 2 │ 0.999905 │ low │
│ 3 │ 0.236033 │ med │
│ 4 │ 0.00790928 │ med │
│ 5 │ 0.488613 │ med │
│ 6 │ 0.210968 │ med │
│ 7 │ 0.986666 │ med │
│ 8 │ 0.346517 │ high │
│ 9 │ 0.312707 │ high │
│ 10 │ 0.251662 │ high │
C'è un modo per fare questo senza l'allocazione della memoria in quanto nel mio esempio reale, df
è abbastanza grande?
Bello! Grazie! Ho dovuto cercare nei [docs] (http://docs.julialang.org/en/latest/stdlib/sort/) per comprendere appieno l'argomento 'lt' qui. Hanno detto: "Tutte le funzioni di ordinamento e ordine si basano su una relazione" minore di "che definisce un ordine totale sui valori da manipolare. La funzione' isless' viene invocata di default, ma la relazione può essere specificata tramite 'lt 'parola chiave." –