ho un set di dati con circa 3 milioni di righe e la seguente struttura:modo più veloce per rimodellare i valori delle variabili come colonne
PatientID| Year | PrimaryConditionGroup
---------------------------------------
1 | Y1 | TRAUMA
1 | Y1 | PREGNANCY
2 | Y2 | SEIZURE
3 | Y1 | TRAUMA
Essendo abbastanza nuovo per R, ho qualche difficoltà a trovare il modo giusto per rimodellare i dati nella struttura delineata:
PatientID| Year | TRAUMA | PREGNANCY | SEIZURE
----------------------------------------------
1 | Y1 | 1 | 1 | 0
2 | Y2 | 0 | 0 | 1
3 | Y1 | 1 | 0 | 1
la mia domanda è: Qual è il/modo più veloce più elegante per creare un data.frame, dove i valori di PrimaryConditionGroup diventano colonne, raggruppati per PatientID e Anno (contando il numero di occorrenze)?
+1 'ddply' non sarà molto meno digitato, davvero, e sarà ovviamente molto più lento. – joran
Perché dovresti anche considerare ddply per questo problema? – hadley
Ciao Josh, grazie, funziona come previsto e funziona bene. Quale sarebbe il modo più sintetico/idiomatico per rimodellare i dati (se le prestazioni non fossero un problema) – Matt