Ho una stringa dicono s = 'Chocolate Moelleux-M\xe8re'
quando sto facendo:come decodificare un carattere non unicode in python?
In [14]: unicode(s)
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 20: ordinal not in range(128)
Allo stesso modo in cui sto provando a decodificare questo utilizzando s.decode()
restituisce lo stesso errore.
In [13]: s.decode()
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 20: ordinal not in range(128)
Come decodificare tale stringa in unicode.
sta andando per aiutare me in tutta la situazione? C'è una soluzione generalizzata? – user12345
Possiamo rimuovere quei caratteri come '\ x' nel mio esempio, dalla stringa originale. – user12345
@alis: è possibile utilizzare chardet (http://chardet.feedparser.org/) per indovinare la codifica. – johnbaum