2016-05-25 12 views
11

Ho una matrice bidimensionale di dati, con alcuni valori mancanti. Ci sono tre colonne:Interpolazione bidimensionale in R, senza alcuna estrapolazione

  • x
  • y
  • intensità

posso tracciare x contro y in ggplot2, con intensità una scala di colori.

enter image description here

vorrei appianare le transizioni tra i colori, e sono venuto attraverso la funzione di idw, dal pacchetto gstat. idw ha lo scopo di interpolare le NA in 2 dimensioni. Non dovrebbe estrapolare, e mentre tecnicamente rispetta i limiti dei dati (± 20 in entrambe le direzioni), fa anche un tentativo di colmare le lacune sul bordo della trama, come illustrato di seguito:

enter image description here

Vorrei evitare qualsiasi estrapolazione che si verifichi al di fuori dei limiti dei dati che ho, compresa la parte in basso a destra dei dati mostrati nella prima figura.

Come posso ottenere questo risultato?

Modifica: Ecco un set di dati di esempio. Questo non è esattamente lo stesso set di dati mostrato sopra, ma contiene ancora una grande area mancante nell'angolo in basso a destra.

structure(list(x = c(10L, 15L, -10L, 0L, -5L, -10L, -15L, 0L, 
-15L, 15L, 5L, 10L, -20L, -5L, -15L, -15L, -5L, 5L, 20L, -20L, 
-15L, 20L, -15L, 5L, -5L, -20L, -5L, 15L, 0L, 0L, 15L, 10L, 0L, 
20L, -10L, 5L, 5L, 0L, 20L, 5L, -15L, 5L, -5L, -5L, -15L, -10L, 
-10L, -10L, -5L, -10L, 15L, 20L, 0L, 20L, -15L, 20L, -20L, -15L, 
10L, 15L, 15L, -5L, 5L, 15L, 20L, 20L, -10L, -20L, -20L, 15L, 
-10L, 10L, 5L, -20L, 20L, 10L, 0L, 10L, -10L, 0L, 10L, 10L, 10L, 
-20L, 15L, -20L, 0L, -20L, -5L, 5L), y = c(0L, -10L, 0L, 20L, 
0L, -10L, 0L, 0L, -20L, 20L, 0L, -10L, -10L, -10L, -10L, 20L, 
10L, -10L, -20L, -20L, -10L, -10L, 0L, 10L, -20L, 20L, 0L, 0L, 
0L, -20L, 0L, 0L, 10L, 10L, -20L, -20L, -10L, 20L, 10L, 20L, 
10L, -20L, 20L, -10L, 20L, 20L, 10L, 10L, -20L, -10L, -10L, 20L, 
-10L, -10L, -20L, 0L, -10L, 10L, -10L, 10L, -20L, 10L, 20L, 20L, 
-20L, 20L, 0L, 10L, 10L, -20L, 20L, -20L, 10L, 0L, 0L, 10L, 10L, 
-20L, -20L, -20L, 20L, 20L, 10L, 20L, 10L, -20L, -10L, 0L, 20L, 
0L), intensity = c(12.9662, NA, 24.4379, 26.3923, 26.9449, 16.7372, 
13.7691, 8.029, 11.922, 11.1967, 15.2792, NA, 14.4159, 20.6542, 
22.0509, 17.356, 14.3841, NA, NA, 10.326, 6.0451, NA, 12.9515, 
3.6745, NA, 18.1552, 9.9532, 9.9361, 7.0392, NA, 10.9814, 10.8351, 
4.9017, 5.7864, 14.098, NA, NA, 6.3305, 6.4405, 49.2791, 19.9774, 
NA, 25.1955, 28.5234, 20.2077, 20.3224, 12.688, 22.1371, NA, 
17.5108, NA, 7.9351, NA, NA, 11.0975, 8.2349, 12.1194, 21.865, 
NA, 10.7178, NA, 21.8222, 13.5971, 6.9751, NA, 8.8046, 22.0709, 
14.2043, 27.8561, NA, 17.4329, NA, 7.4057, 15.2797, 1.0122, 11.1874, 
35.5814, NA, 27.5919, NA, 11.8159, 15.8433, 12.297, 29.1978, 
20.4151, 22.6336, NA, 16.0019, 16.9746, 10.8613)), .Names = c("x", 
"y", "intensity"), row.names = c(NA, -90L), class = "data.frame") 
+0

Si potrebbe semplicemente ricampionare i dati originali per le dimensioni della griglia che si desidera, lasciando AN cui si dispone non ci sono dati. Quindi, usa i dati ricampionati per mascherare l'output IDW. –

+0

Trovo curioso di trovare un punto di alta intensità nella tua regione estrapolata (circa 5, -20). Per quanto comprendo Idw, questo non dovrebbe accadere. –

risposta

6

Se ho capito ciò che si sta cercando di fare, si può fare questo con i metodi di base in ggplot2 rimuovendo NA prima di interpolazione.

library(ggplot2) 

data<-data.frame(data) 
data_NA.rm<-data[!is.na(data$intensity),] 

ggplot(data=data_NA.rm,aes(x=x,y=y))+ 
     geom_raster(aes(fill=intensity),interpolate=TRUE) 

Risultati in:

enter image description here