2012-06-19 12 views
13

Alcuni dati Unicode sono archiviati nel file come \ u84b8 \ u6c7d \ u5730 'senza alcuna codifica.Stringa di Python Unicode memorizzata come ' u84b8 u6c7d u5730' nel file, come convertirla nuovamente in Unicode?

C'è un modo per nasconderli in Python?

+3

Intendi ''\\ u84b8 \\ u6c7d \\ u5730'' o come' u '\ u84b8 \ uc7d \ u5730''? –

+0

@Chris: Non c'è bisogno di sfuggire alle barre inverse, poiché '\ u' non è una fuga valida nei bytestrings. –

+0

@ IgnacioVazquez-Abrams: lo so; Lo metto con i backslash raddoppiati per rendere il mio significato più ovvio –

risposta

43
>>> print '\u84b8\u6c7d\u5730'.decode('unicode-escape') 
蒸汽地 
+2

Penso che questo sia probabilmente ciò che intende, ma non sono sicuro ... se lo è, è un duplicato, comunque. –

+0

Va bene. Ecco un'altra forma alternativa: 's = unicode ('\ u84b8 \ u6c7d \ u5730'," unicode-escape ")'. – Keith

+0

Ho passato molto tempo a cercare di risolvere questo problema, ora ho visto la soluzione! – SKandeel