2013-07-18 18 views
7

Supponiamo che io ho questa trama:Il modo più semplice per discretizzare le scale continue per le scale di colori ggplot2?

ggplot(iris) + geom_point(aes(x=Sepal.Width, y=Sepal.Length, colour=Sepal.Length)) + scale_colour_gradient()

qual è il modo corretto per discretizzare la scala di colore, come la trama mostrato di seguito la risposta accettata qui (gradient breaks in a ggplot stat_bin2d plot)?

ggplot riconosce correttamente i valori discreti e utilizza scale discrete per questi, ma la mia domanda è se si dispone di dati continui e si desidera una barra di colore discreto per esso (con ogni quadrato corrispondente a un valore e quadrati colorati in una sfumatura ancora), Qual'è il miglior modo di farlo? Se la discretizzazione/binning avviene al di fuori di ggplot e viene inserita nel dataframe come una colonna separata con valori discreti, o esiste un modo per farlo in ggplot? un esempio di quello che sto cercando è simile alla scala mostrato qui: enter image description here

tranne Sto tracciando un grafico a dispersione e non qualcosa di simile geom_tile/heatmap.

grazie.

risposta

9

La soluzione è leggermente complicata, perché si desidera una scala discreta. Altrimenti probabilmente potresti semplicemente usare round.

library(ggplot2) 

bincol <- function(x,low,medium,high) { 
    breaks <- function(x) pretty(range(x), n = nclass.Sturges(x), min.n = 1) 

    colfunc <- colorRampPalette(c(low, medium, high)) 

    binned <- cut(x,breaks(x)) 

    res <- colfunc(length(unique(binned)))[as.integer(binned)] 
    names(res) <- as.character(binned) 
    res 
} 

labels <- unique(names(bincol(iris$Sepal.Length,"blue","yellow","red"))) 
breaks <- unique(bincol(iris$Sepal.Length,"blue","yellow","red")) 
breaks <- breaks[order(labels,decreasing = TRUE)] 
labels <- labels[order(labels,decreasing = TRUE)] 


ggplot(iris) + 
    geom_point(aes(x=Sepal.Width, y=Sepal.Length, 
       colour=bincol(Sepal.Length,"blue","yellow","red")), size=4) + 
    scale_color_identity("Sepal.Length", labels=labels, 
         breaks=breaks, guide="legend") 

enter image description here

+0

Ha l'ordine di etichette funziona se esistono i numeri negativi nella variabile utilizzata per la colorazione? – gvrocha

5

Si potrebbe provare quanto segue, ho il codice di esempio modificato in modo appropriato di seguito:

#I am not so great at R, so I'll just make a data frame this way 
#I am convinced there are better ways. Oh well. 
df<-data.frame() 
for(x in 1:10){ 
    for(y in 1:10){ 
    newrow<-c(x,y,sample(1:1000,1)) 
    df<-rbind(df,newrow) 
    } 
} 
colnames(df)<-c('X','Y','Val') 


#This is the bit you want 
p<- ggplot(df, aes(x=X,y=Y,fill=cut(Val, c(0,100,200,300,400,500,Inf)))) 
p<- p + geom_tile() + scale_fill_brewer(type="seq",palette = "YlGn") 
p<- p + guides(fill=guide_legend(title="Legend!")) 

#Tight borders 
p<- p + scale_x_continuous(expand=c(0,0)) + scale_y_continuous(expand=c(0,0)) 
p 

Nota l'uso strategico di taglio per discretizzare i dati seguiti da l'uso del colore birraio per rendere le cose belle.

Il risultato è il seguente.

2D heatmap with discretized colour

+0

Mi piace, ma mi chiedo se c'è un modo per contrassegnare la scala come nell'esempio mostrato nella domanda. Più precisamente: come far apparire gli estremi nei punti di taglio tra gli "strati" di colore? – gvrocha

Problemi correlati