Ho un mucchio di stringhe di byte (str
, non unicode
, in python 2.7) contenenti dati unicode (nella codifica utf-8
).python 2.7 string.join() con unicode
Sto cercando di unirsi a loro (da "".join(utf8_strings)
o u"".join(utf8_strings)
) che getta
UnicodeDecodeError: 'ascii' codec can't decode byte 0xec in position 0: ordinal not in range(128)`
C'è un modo di fare uso di .join()
metodo per le stringhe non-ASCII? sicuro di poterli concatenare in un ciclo for, ma non sarebbe economicamente conveniente.
come si rimuovono gli oggetti 'unicode' e' str'? – fiona
@fiona decide le stringhe di byte in Unicode, quindi partecipa. È meglio decodificarlo il prima possibile, codificare solo quando hai finito il testo e devi passarlo a qualcosa che accetterà solo byte. –