Sono sicuro che questa è una domanda molto semplice:In R, come comprimere le categorie o ricategorizzare le variabili?
In RI hanno 600.000 variabili categoriali - ognuno dei quali è classificato come "0", "1", o "2"
Quello che vorrei do è collassare "1" e "2" e lasciare "0" da solo, in modo tale da riclassificare "0" = "0"; "1" = "1" e "2" = "1" --- alla fine voglio solo "0" e "1" come categorie per ciascuna delle variabili.
Inoltre, se possibile, preferirei non creare 600.000 nuove variabili, se posso sostituire le variabili esistenti con i nuovi valori che sarebbe fantastico!
Quale sarebbe il modo migliore per farlo?
Grazie!
Grazie per la risposta! Questo è il modo in cui lo sto applicando specificamente ai miei dati. I miei dati sono sotto forma di data.frame, che vorrei conservare: data <- read.table ("k.csv", header = TRUE, sep = ",") dta <- data [ , 1: 30] col = dim (dta) [2] per (y in 1: col) { py <- factor (pmin (as.data.frame (dta [, y]), 2) , labels = c ("0", "1")) py } Ovviamente questo genera un errore - Sono sicuro che non lo sto applicando correttamente – CCA