In Python 2.7, come si converte una stringa latin1 in UTF-8.Python che converte latin1 in UTF8
Ad esempio, sto cercando di convertire é in utf-8.
>>> "é"
'\xe9'
>>> u"é"
u'\xe9'
>>> u"é".encode('utf-8')
'\xc3\xa9'
>>> print u"é".encode('utf-8')
é
La lettera è é che è minuscola latina con accento acuto (U + 00E9) La codifica byte UTF-8 per è: c3a9
La codifica byte latino è: e9
Come fare Ottengo la versione codificata UTF-8 di una stringa latina? Qualcuno potrebbe dare un esempio di come convertire l'é?
Hai già letto [Python Unicode HOWTO] (http://docs.python.org/2/howto/unicode.html)? Se no, dovresti! –
@MartijnPieters Ho, ma la codifica è sempre un po 'confusa. – Eugene