C'è un modo - diverso da un ciclo for - per generare nuove variabili in un frame di dati R, che saranno tutte le possibili interazioni a 2 vie tra quelle esistenti? cioè supponendo un dataframe con tre variabili numeriche V1, V2, V3, desidero generare i seguenti nuove variabili:Generazione di variabili di interazione in R dataframes
Inter.V1V2 (= V1 * V2)
Inter.V1V3 (= V1 * V3)
Inter.V2V3 (= V2 * V3)
Esempio con ciclo:
x <- read.table(textConnection('
V1 V2 V3 V4
1 9 25 18
2 5 20 10
3 4 30 12
4 4 34 16'
), header=TRUE)
dim.init <- dim(x)[2]
for (i in 1: (dim.init - 1)) {
for (j in (i + 1) : (dim.init)) {
x[dim(x)[2] + 1] <- x[i] * x[j]
names(x)[dim(x)[2]] <- paste("Inter.V",i,"V",j,sep="")
}
}
+1 Non era a conoscenza della funzione model.matrix. Molto utile! – Shane
Eccellente! Potresti anche eliminare l'irrilevante (nel nostro caso) intercettare model.matrix (~ (V1 + V2 + V3 + V4)^2-1, x) –
proprio come sei. o per il caso generale as.data.frame (model.matrix (~.^2-1, x)) –