Come faccio a forzare l'output di Latin-1 (che suppongo significhi iso-8859-1?) In Python?Python: Come posso forzare l'output del file iso-8859-1?
Ecco il mio codice al momento. Funziona, ma il tentativo di importare il file di output risultante in una tabella MySQL Latin-1 produce weird encoding errors.
outputFile = file("textbase.tab", "w")
for k, v in textData.iteritems():
complete_line = k + '~~~~~' + v + '~~~~~' + " ENDOFTHELINE"
outputFile.write(complete_line)
outputFile.write("\n")
outputFile.close()
Il file di output risultante sembra essere salvati in "occidentale (Mac OS romana)", ma se poi salvarlo in Latin-1, ho ancora problemi di codifica strani. Come posso assicurarmi che le stringhe utilizzate e il file stesso siano tutti codificati in Latin-1 non appena vengono generati?
Le stringhe originali (nel dizionario textData
) sono state analizzate da un file RTF: non so se questo faccia la differenza.
Sono un po 'nuovo per Python e per la codifica in generale, quindi scuse se questa è una domanda stupida. Ho provato a guardare i documenti ma non sono arrivato molto lontano.
Sto usando Python 2.6.1.
Grazie. Ho appena provato questo codice, ma ho ottenuto: "UnicodeDecodeError: il codec 'ascii' non può decodificare il byte 0xa3 nella posizione 753: ordinale non nel range (128)". Ora cercherò di assicurarmi che k e v siano oggetti unicode, come suggerito sopra. – AP257