Mi piace scrivere una funzione utilizzando ddply
che restituisce le statistiche di riepilogo basate sul nome di due colonne di data.frame
mat
.Statistiche riassuntive con ddply
mat
è un grandedata.frame
con il nome di colonne"metric", "length", "species", "tree", ...,"index"
index
è fattore di 2 livelli"Short", "Long"
"metric", "length", "species", "tree"
e gli altri sono tutti variabili continue
Funzione :
summary1 <- function(arg1,arg2) {
...
ss <- ddply(mat, .(index), function(X) data.frame(
arg1 = as.list(summary(X$arg1)),
arg2 = as.list(summary(X$arg2)),
.parallel = FALSE)
ss
}
mi aspetto l'uscita a guardare come questo dopo aver chiamato summary1("metric","length")
Short metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
Long metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
Al momento la funzione non produce il risultato desiderato? Quale modifica dovrebbe essere fatta qui?
Grazie per il vostro aiuto.
Ecco un esempio giocattolo
mat <- data.frame(
metric = rpois(10,10), length = rpois(10,10), species = rpois(10,10),
tree = rpois(10,10), index = c(rep("Short",5),rep("Long",5))
)
Questo sarebbe più facile rispondere se hai fornito i dati di esempio (prefereably con ' dput'). –
@ Richie- Ecco un esempio di giocattolo 'mat <-data.frame (metrico = rpois (10,10), lunghezza = rpois (10,10), specie = rpois (10,10), albero = rpois (10, 10), index = c (rep ("Short", 5), rep ("Long", 5))) - Grazie – Tony
È possibile modificare la domanda per aggiungere dati di esempio anziché scrivere un commento (l'ho fatto per te;)). – Marek