2015-10-22 20 views
6

Vorrei applicare una trasformazione a tutte le colonne tramite dplyr :: mutate_each, ad es.Passare il nome della colonna per funzionare da mutate_each

library(dplyr) 
mult <- function(x,m) return(x*m) 
mtcars %>% mutate_each(funs(mult(.,2))) # Multiply all columns by a factor of two 

Tuttavia, la trasformazione deve avere parametri in base al nome della colonna. Pertanto, il nome della colonna deve essere passato alla funzione come parametro aggiuntivo

named.mult <- function(x,colname) return(x*param.A[[colname]]) 

Esempio: moltiplicare ogni colonna da un fattore diverso:

param.A <- c() 
param.A[names(mtcars)] <- seq(length(names(mtcars))) 
param.A 
# mpg cyl disp hp drat wt qsec vs am gear carb 
# 1 2 3 4 5 6 7 8 9 10 11 

Poiché il nome di colonna viene perso durante mutate_each, attualmente lavoro intorno a questo passando un elenco con evalution pigro per mutate_ (la versione SE):

library(lazyeval) 
named.mutate <- function(fun, cols) sapply(cols, function(n) interp(~fun(col, n), fun=fun, col=as.name(n))) 
mtcars %>% mutate_(.dots=named.mutate(named.mult, names(.))) 

Funziona, ma esiste una variabile speciale come .name che contiene il nome della colonna . per ogni esecuzione colwise? Quindi potrei fare qualcosa come

mtcars %>% mutate_each(funs(named.mult(.,.name))) 

risposta

0

Suggerirei di adottare un approccio diverso. Invece di utilizzare mutate_each una combinazione di dplyr::mutate con tidyr::gather e tidyr::spread può ottenere lo stesso risultato.

Ad esempio:

library(dplyr) 
library(tidyr) 

data(mtcars) 

# Multiple each column by a different interger 
mtcars %>% 
    dplyr::tbl_df() %>% 
    dplyr::mutate(make_and_model = rownames(mtcars)) %>% 
    tidyr::gather(key, value, -make_and_model) %>% 
    dplyr::mutate(m = as.integer(factor(key)), # a multiplication factor dependent on column name 
       value = value * m) %>% 
    dplyr::select(-m) %>% 
    tidyr::spread(key, value) 

# compare to the original data 
mtcars[order(rownames(mtcars)), order(names(mtcars))] 

# the muliplicative values used. 
mtcars %>% 
    tidyr::gather() %>% 
    dplyr::mutate(m = as.integer(factor(key))) %>% 
    dplyr::select(-value) %>% 
    dplyr::distinct() 
Problemi correlati