Nel tentativo di sistemare un file PML (Palm Markup Language), sembra che il mio file di prova abbia caratteri non ASCII che sta causando il rifiuto di MakeBook. La soluzione sarebbe quella di eliminare tutti i caratteri non ASCII nel PML.Come rimuovere estesi ascii usando python?
Quindi, nel tentativo di risolvere questo problema in python, ho
import unicodedata, fileinput
for line in fileinput.input():
print unicodedata.normalize('NFKD', line).encode('ascii','ignore')
Tuttavia, questo si traduce in un errore che la linea deve essere "unicode, non str". Ecco un frammento di file.
\B1a\B \tintense, disordered and often destructive rage†.†.†.\t
Non proprio sicuro come passare correttamente la linea in essere elaborato a questo punto.
Vuoi filtrare qualsiasi carattere il cui valore ASCII è maggiore di 255? –
Strettamente parlando, non esiste una cosa come ASCII estesa. ASCII definisce valori da 0 a 127. Qualsiasi valore superiore a quello può essere interpretato solo arbitrariamente. Forse dovresti usare il termine * caratteri non ASCII *. – dreamlax
Correlati: Funzione di escape sicura per l'output del terminale http://stackoverflow.com/questions/437476/safe-escape-function-for-terminal-output – jfs