2009-10-29 9 views
13

Sto utilizzando ggplot2 per creare pannelli di istogrammi e mi piacerebbe poter aggiungere una linea verticale alla media di ogni gruppo. Ma geom_vline() utilizza la stessa intercetta per ogni pannello (vale a dire la media globale):Aggiungi una linea verticale con intercettazione diversa per ciascun pannello in ggplot2

require("ggplot2") 
# setup some sample data 
N <- 1000 
cat1 <- sample(c("a","b","c"), N, replace=T) 
cat2 <- sample(c("x","y","z"), N, replace=T) 
val <- rnorm(N) + as.numeric(factor(cat1)) + as.numeric(factor(cat2)) 
df <- data.frame(cat1, cat2, val) 

# draws a single histogram with vline at mean 
qplot(val, data=df, geom="histogram", binwidth=0.2) + 
    geom_vline(xintercept=mean(val), color="red") 

# draws panel of histograms with vlines at global mean 
qplot(val, data=df, geom="histogram", binwidth=0.2, facets=cat1~cat2) + 
    geom_vline(xintercept=mean(val), color="red") 

Come posso ottenere in modo da utilizzare il gruppo di ciascun pannello significa come x-intercetta? (Punti bonus se è anche possibile aggiungere un'etichetta di testo per la riga con il valore della media.)

risposta

9

Un modo è di costruire il data.frame con i valori medi prima della mano.

library(reshape) 
dfs <- recast(data.frame(cat1, cat2, val), cat1+cat2~variable, fun.aggregate=mean) 
qplot(val, data=df, geom="histogram", binwidth=0.2, facets=cat1~cat2) + geom_vline(data=dfs, aes(xintercept=val), colour="red") + geom_text(data=dfs, aes(x=val+1, y=1, label=round(val,1)), size=4, colour="red") 
13

Immagino che questa sia una rielaborazione di @ eduardo in realtà, ma in una riga.

ggplot(df) + geom_histogram(mapping=aes(x=val)) 
    + geom_vline(data=aggregate(df[3], df[c(1,2)], mean), 
     mapping=aes(xintercept=val), color="red") 
    + facet_grid(cat1~cat2) 

alt text http://www.imagechicken.com/uploads/1264782634003683000.png

o utilizzando plyr (require(plyr) un pacchetto dall'autore di ggplot, Hadley):

ggplot(df) + geom_histogram(mapping=aes(x=val)) 
    + geom_vline(data=ddply(df, cat1~cat2, numcolwise(mean)), 
     mapping=aes(xintercept=val), color="red") 
    + facet_grid(cat1~cat2) 

Sembra insoddisfacente che vline non è tagliato sulle sfaccettature, I' Non sono sicuro del perché.

Problemi correlati