2013-09-07 16 views
6

R non visualizza correttamente il testo in arabo. Ottengo cose molto strane quando uso l'arabo. Ecco uno screenshot:Assegnazione di testo arabo a variabili R

enter image description here

Il problema è che voglio creare un wordcloud con testo arabo e ho bisogno di risolvere questo problema in primo luogo.

versione R: R 2.15.2 GUI 1.53 Leopard costruire a 64 bit (6335)

Qui ci sono ulteriori informazioni:

> options("encoding") 
$encoding 
[1] "native.enc" 

> Encoding("الله") 
[1] "unknown" 

SessionInfo():

> sessionInfo() 
R version 2.15.2 (2012-10-26) 
Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit) 

locale: 
[1] C/C/C/C/de_DE/C 

attached base packages: 
[1] stats  graphics grDevices utils  datasets methods base  

loaded via a namespace (and not attached): 
[1] tools_2.15.2 
> 

po 'di lavoro :

> x = "مرحبا" 
> Encoding(x) = "UTF-8" 
> x 
[1] "<U+0645><U+0631><U+062D><U+0628><U+0627>" 
> Encoding(iconv(x)) 
[1] "unknown" 

Altre informazioni:

> Sys.getlocale() 
[1] "C/C/C/C/de_DE/C" 
> Sys.setlocale("LC_ALL", "en_US.utf8") 
[1] "" 
Warning message: 
In Sys.setlocale("LC_ALL", "en_US.utf8") : 
    OS reports request to set locale to "en_US.utf8" cannot be honored 
> 

Questo ha risolto il problema:

Sys.setlocale("LC_ALL", "en_US.UTF-8") 
+0

potete inserire il vostro 'sessionInfo()'? – nograpes

+0

@nograpes L'ho fatto –

+1

@guckogucko 'sessionInfo()', non 'sessionInfo' –

risposta

2

Questo funziona:

Sys.setlocale("LC_ALL", "en_US.UTF-8") 
0

Volevo solo far notare che non sto avendo questo problema (caratteri arabi vengono visualizzati correttamente senza alcuna passare alla locale), anche se non sono in una locale UTF-8. Non sono sicuro di cosa fare di questo, quindi se qualcun altro ci prega di illuminarci.

sto usando RStudio 0.98.1091 e il mio sessionInfo è la seguente:

> sessionInfo() 
R version 3.1.2 (2014-10-31) 
Platform: i386-w64-mingw32/i386 (32-bit) 

locale: 
[1] LC_COLLATE=French_France.1252 LC_CTYPE=French_France.1252 LC_MONETARY=French_France.1252 
[4] LC_NUMERIC=C     LC_TIME=French_France.1252  
Problemi correlati