2014-06-18 14 views
6

Sto lavorando con il set di dati HURDAT per tracciare le tracce di uragano. ho attualmente prodotto un oggetto SpatialPointsDataFrame in R che sembra qualcosa di simile per l'anno 2004.Converti SpatialPointsDataFrame in SpatialLinesDataFrame in R

> str(cluster.2004.sdf) 
Formal class 'SpatialPointsDataFrame' [package "sp"] with 5 slots 
    [email protected] data  :'data.frame': 2693 obs. of 4 variables: 
    .. ..$ Sid  : int [1:2693] 1331 1331 1331 1331 1331 1331 1331 1331 1331 1331 ... 
    .. ..$ clusterid: num [1:2693] 2 2 2 2 2 2 2 2 2 2 ... 
    .. ..$ name  : Factor w/ 269 levels "","ABBY  ",..: 6 6 6 6 6 6 6 6 6 6 ... 
    .. ..$ WmaxS : num [1:2693] 78.9 82.8 80.9 70.9 76.9 ... 
    [email protected] coords.nrs : num(0) 
    [email protected] coords  : num [1:2693, 1:2] 754377 612852 684956 991386 819565 ... 
    .. ..- attr(*, "dimnames")=List of 2 
    .. .. ..$ : NULL 
    .. .. ..$ : chr [1:2] "lon" "lat" 
    [email protected] bbox  : num [1:2, 1:2] -3195788 1362537 4495870 9082812 
    .. ..- attr(*, "dimnames")=List of 2 
    .. .. ..$ : chr [1:2] "lon" "lat" 
    .. .. ..$ : chr [1:2] "min" "max" 
    [email protected] proj4string:Formal class 'CRS' [package "sp"] with 1 slots 
    .. .. [email protected] projargs: chr "+proj=lcc +lat_1=60 +lat_2=30 +lon_0=-60 +ellps=WGS84" 

    > summary(cluster.2004.sdf) 
Object of class SpatialPointsDataFrame 
Coordinates: 
     min  max 
lon -3195788 4495870 
lat 1362537 9082812 
Is projected: TRUE 
proj4string : 
[+proj=lcc +lat_1=60 +lat_2=30 +lon_0=-60 +ellps=WGS84] 
Number of points: 2693 
Data attributes: 
     Sid   clusterid    name   WmaxS  
Min. :1331 Min. :1.000 IVAN  :517 Min. : 14.83 
1st Qu.:1334 1st Qu.:2.000 FRANCES :403 1st Qu.: 31.35 
Median :1337 Median :3.000 JEANNE :379 Median : 50.04 
Mean :1337 Mean :2.898 KARL  :283 Mean : 61.66 
3rd Qu.:1339 3rd Qu.:4.000 DANIELLE :271 3rd Qu.: 90.40 
Max. :1341 Max. :4.000 BONNIE :253 Max. :142.52 
           (Other) :587 

Ogni tempesta ha un riferimento id tempesta unica etichetta "Sid". Vorrei raggruppare SpatialPointsDataFrame con "Sid" e convertire tutti i punti in una Linea.

Ho avuto un tentativo con ddply dal pacchetto plyr ma francamente non ho idea di cosa sto facendo. So di poter fare ciò girando ogni riga nel frame di dati e aggiungendo le coordinate a un elenco, quindi convertendo quell'elenco usando la funzione Lines dal pacchetto sp.

Tuttavia, preferirei un modo di convertire più R. Grazie Richard

+0

Tutte le "R vie" in ultima analisi, che fare con un elenco , ma puoi usare split (x, id) come inizio. Più importante è se vuoi linee semplici (probabilmente) o complesse. Vuoi una riga di dati di attributi per ogni ID univoco? (semplice) – mdsumner

risposta

6

Il problema con la soluzione di mdsumner è che il data.frame risultante deve avere una riga per ogni linea, ma nel suo codice c'è una riga per ciascun punto. Il codice corretto sarebbe:

## example data 
d <- data.frame(x=runif(7), y=runif(7), id = c(rep("a", 3), rep("b", 4))) 

library(sp)  
coordinates(d) <- ~x+y 

## list of Lines per id, each with one Line in a list 
x <- lapply(split(d, d$id), function(x) Lines(list(Line(coordinates(x))), x$id[1L])) 

# the corrected part goes here: 
lines <- SpatialLines(x) 
data <- data.frame(id = unique(d$id)) 
rownames(data) <- data$id 
l <- SpatialLinesDataFrame(lines, data) 

Quindi il problema fondamentalmente è che si deve creare un data.frame per le linee, raggruppate per id (una riga per ogni riga). Nel caso in cui non ci siano dati a parte lo id è piuttosto facile. Se avete bisogno di gruppo di alcuni altri dati fro l'originale SpatialPointDataFrame, però, è necessario utilizzare alcune funzioni di raggruppamento come tapply, aggregate, o utilizzare il mio preferito - sqldf:

data <- sqldf(' 
select id, max(something), sum(something_else) 
from d 
group by id 
') 
+0

Grazie, ho dovuto contrassegnarlo come risposta ma anche update mdsumner –

+0

@Richard sei il benvenuto – TMS

3
## example data 
d <- data.frame(x=runif(7), y=runif(7), id = c(rep("a", 3), rep("b", 4))) 
##split(d, d$id) 

library(sp)  
coordinates(d) <- ~x+y 

## list of Lines per id, each with one Line in a list 
x <- lapply(split(d, d$id), function(x) Lines(list(Line(coordinates(x))), x$id[1L])) 

## or one Lines in a list, with all Line objects 
## x <- list(Lines(lapply(split(d, d$id), function(x) Line(coordinates(x))), paste(unique(d$id), collapse = "_"))) 

## etc. 
SpatialLines(x, CRS(as.character(NA))) 

## need to be careful here, assuming one Lines per original row 
## and we trash the original rownames . . . 
SpatialLinesDataFrame(SpatialLines(x, CRS(as.character(NA))), d[,"id", drop = FALSE], match.ID = FALSE) 
+0

@mdsummer. Grazie per la risposta. Non riesco a far funzionare il tuo codice però. Se copio esattamente la linea per linea e corro in RI, ricevo l'errore:> SpatialLinesDataFrame (SpatialLines (x, CRS (as.character (NA))), d [, "id", drop = FALSE], match.ID = FALSE) Errore in SpatialLinesDataFrame (SpatialLines (x, CRS (as.character (NA))),: lunghezza di data.frame non corrisponde al numero di elementi Lines –