2011-11-08 20 views
13

Ho un file binario. Questo file contiene una stringa UTF-8. Inoltre, è garantito che questa stringa è solo una parola. In python, come posso ottenere il numero di lettere in questa stringa?python get unicode stringa size

Diciamo, ho aperto questo file e leggere byte:

bytes = open("1.dat", "rb").read() 

Quale futuro ho da fare per scoprire la lunghezza (in lettere, non byte) di stringa UTF-8?

+0

Qual è la rilevanza di "è garantito che questa stringa è solo una parola"? –

+2

Non aprire il file in modalità binaria. Aprilo con 'codecs.open' e dagli un argomento di codifica. Problema risolto. – tchrist

risposta

28
unicode_string = bytes.decode("utf-8") 
print len(unicode_string) 
+2

In Python 3, puoi impostare 'bytes = len (open ('1.dat', encoding = 'utf-8'). Read())' – Cito

Problemi correlati