2013-02-28 11 views
5

Ho un file .csv nel seguente formato:Come raggruppare un data.frame per data?

Date  ,  Time , Value 
1899-01-01 , 4:00:00 , 1 
1899-01-01 , 4:01:00 , 2 
1899-01-01 , 4:02:00 , 3 
1899-01-01 , 4:03:00 , 4 
1899-01-01 , 4:04:00 , 5 
1900-08-22 , 22:00:00 , 101 
1900-08-22 , 22:01:00 , 102 
2013-08-29 , 4:00:00 , 1000 
2013-02-29 , 4:02:00 , 1001 
2013-02-29 , 4:03:00 , 1002 

E 'possibile group by date per produrre un data.table nel seguente formato:

Date  , Vector(variable length) 
1899-02-28, c(1,2,3,4,5) 
1900-08-22, c(101,102) 
1900-08-22, c(1000,1001,1002) 

Questo è il meglio che ho così lontano (dopo un giorno di tentativi):

raw <- read.csv(pathName, header = TRUE, stringsAsFactors = FALSE) 
groupedByDate <- split(raw, raw$Date) 

Tuttavia, questo sembra produrre una tabella molto ampia con una colonna per ogni d mangiato, che non è molto vicino a quello che voglio.

risposta

8

Cosa succede ad usare aggregate su un data.frame denominato "mydf" come segue:

> temp <- aggregate(Value ~ Date, mydf, as.vector) 
> temp 
     Date   Value 
1 1899-01-01 1, 2, 3, 4, 5 
2 1900-08-22  101, 102 
3 2013-02-29  1001, 1002 
4 2013-08-29   1000 

La colonna "Valore" è ora un list che contiene i vettori.

> temp$Value 
$`0` 
[1] 1 2 3 4 5 

$`1` 
[1] 101 102 

$`2` 
[1] 1001 1002 

$`3` 
[1] 1000 

Cosa si erano probabilmente cercando con split è:

> split(mydf$Value, mydf$Date) 
$`1899-01-01 ` 
[1] 1 2 3 4 5 

$`1900-08-22 ` 
[1] 101 102 

$`2013-02-29 ` 
[1] 1001 1002 

$`2013-08-29 ` 
[1] 1000 
+0

Grazie, questo funziona assolutamente brillante! Segnerò la tua come risposta, come eri prima. – Contango

3

Usa aggregate e paste0

> aggregate(Value ~ Date, data=DF, FUN=paste0) 
     Date   Value 
1 1899-01-01 1, 2, 3, 4, 5 
2 1900-08-22  101, 102 
3 2013-02-29  1001, 1002 
4 2013-08-29   1000 
+0

Grazie mille per questa risposta, molto apprezzata. post scriptum In realtà volevo un vettore di numeri, quindi la sua "c" invece di "incolla". – Contango

Problemi correlati