2013-04-17 9 views
6

Ho una stringa unicode, sono sicuro che sia UTF-8, ma non posso decodificarlo. La stringa è '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'. Come decodificarlo?Python decode la stringa " u041b"

+1

decodifica a ciò che - come si desidera utilizzarlo? – Mark

+0

Oh, sono stupido :) stampa u '\ u0441 \ u0438 \ u0434 \ u0435 \ u044c \ u044f' dà una normale stringa leggibile da umani. – arts777

+0

Non è sicuramente UTF8. – glglgl

risposta

24

Si può usare aString.decode('unicode_escape'), è convertire una stringa unicode-formato oggetto Unicode

>>> u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435' 
u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435' 
>>> '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'.decode('unicode_escape') 
u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435' 
>>> 

Nel tuo caso

>>> print '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'.decode('unicode_escape') 
Легковые 
>>>