Sto cercando di leggere un file gunzipped (.gz) in python e sto avendo qualche problema.Lettura di utf-8 caratteri da un file gzip in python
Ho usato il modulo gzip per leggerlo ma il file è codificato come un file di testo utf-8 così alla fine legge un carattere non valido e si blocca.
Qualcuno sa leggere i file gzip codificati come file utf-8? So che c'è un modulo di codec che può aiutare ma non riesco a capire come usarlo.
Grazie!
import string
import gzip
import codecs
f = gzip.open('file.gz','r')
engines = {}
line = f.readline()
while line:
parsed = string.split(line, u'\u0001')
#do some things...
line = f.readline()
for en in engines:
print(en)
Puoi pubblicare il codice che hai finora? –
Puoi convertire il file utf-8 in ASCII e poi provare a decomprimerlo? hmm .... – whatsisname