Sto provando a leggere in un file csv che contiene informazioni sui contributi politici. Da quanto ho capito, le colonne per impostazione predefinita vengono importate come fattori, ma ho bisogno della colonna quantità ('CTRIB_AMT' nel set di dati) da importare come una colonna numerica in modo da poter eseguire una varietà di funzioni che non funzionerebbero per fattori. La colonna è formattata come valuta con un "$" come prefisso.Leggere il file csv in R con la colonna della valuta come numerico
ho usato un semplice comando di lettura per importare il file inizialmente:
contribs <- read.csv('path/to/file')
E poi ha cercato di convertire la CTRIB_AMT da valuta a numerico:
as.numeric(as.character(sub("$","",contribs$CTRIB_AMT, fixed=TRUE)))
Ma che non ha funzionato. Le funzioni che sto cercando di utilizzare per le colonne CTRIB_AMT sono:
vals<-sort(unique(dfr$CTRIB_AMT))
sums<-tapply(dfr$CTRIB_AMT, dfr$CTRIB_AMT, sum)
counts<-tapply(dfr$CTRIB_AMT, dfr$CTRIB_AMT, length)
Vedi domanda relativa here.
Qualche idea su come importare il file inizialmente in modo che la colonna sia numerica o come convertirla dopo l'importazione?
Un piccolo esempio del contenuto del file sarebbe utile. –
La conversione 'sub' ->' as.character' -> 'as.numeric' dovrebbe fare il trucco. Cosa intendi con "non ha funzionato"? –
Funziona per me. 'CTRIB_AMT <- factor (c (" $ 5000 "," $ 2500 "," $ 100 ")); as.numeric (as.character (sub ("$", "", CTRIB_AMT, fixed = TRUE))) ' –