Proprio ora ho risposto a questa domanda Removing characters after a EURO symbol in R. Ma non funziona per me, dove il codice r funziona per gli altri che sono su Ubuntu.Confuso con le impostazioni locali in R
Questo è il mio codice.
x <- "services as defined in this SOW at a price of € 15,896.80 (if executed fro"
euro <- "\u20AC"
gsub(paste(euro , "(\\S+)|."), "\\1", x)
# ""
Penso che si tratta di modificare le impostazioni locali, non so come farlo.
Sono in esecuzione rstudio su Windows 8.
> sessionInfo()
R version 3.2.0 (2015-04-16)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 8 x64 (build 9200)
locale:
[1] LC_COLLATE=English_United States.1252
[2] LC_CTYPE=English_United States.1252
[3] LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C
[5] LC_TIME=English_United States.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods
[7] base
loaded via a namespace (and not attached):
[1] tools_3.2.0
@ risposta di Anada è buona, ma abbiamo bisogno di aggiungere che il parametro encoding
per ogni volta quando usiamo unicodes in regex. C'è un modo per modificare la codifica predefinita su utf-8
su Windows?
"Se non si imposta una codifica di default, i file verranno aperti usando UTF-8 (sul desktop Mac, desktop Linux e server) o la codifica predefinita del sistema (su Windows) "(da [qui] (https://support.rstudio.com/hc/en-us/articles/200532197-Character-Encoding)). –
È possibile impostare la codifica predefinita usando 'options (encoding =" UTF-8 ")'. Questa non è la soluzione magica che vuoi che sia. Il supporto UTF-8 in R su Windows non è eccezionale; Ricordo a metà una conversazione su di essa che richiede molte conversioni da e verso UTF-16 che ha rotto le cose. –