Come indicato nel titolo, desidero controllare l'oggetto file specificato (aperto come flusso binario) è un file UTF-8 valido.Come scrivere un check in python per vedere se il file è UTF-8 valido?
Chiunque?
Grazie
Come indicato nel titolo, desidero controllare l'oggetto file specificato (aperto come flusso binario) è un file UTF-8 valido.Come scrivere un check in python per vedere se il file è UTF-8 valido?
Chiunque?
Grazie
Si potrebbe fare qualcosa di simile
import codecs
try:
f = codecs.open(filename, encoding='utf-8', errors='strict')
for line in f:
pass
print "Valid utf-8"
except UnicodeDecodeError:
print "invalid utf-8"
def try_utf8(data):
"Returns a Unicode object on success, or None on failure"
try:
return data.decode('utf-8')
except UnicodeDecodeError:
return None
data = f.read()
udata = try_utf8(data)
if udata is None:
# Not UTF-8. Do something else
else:
# Handle unicode data
Ovviamente non ho fatto abbastanza bene i miei compiti quando c'è più di una soluzione semplice come questa :( Grazie! – Jox
che ha lavorato come un fascino per me! grazie – Somar