Ho un file CSV che ho scaricato dal sito dell'OMS (http://apps.who.int/gho/data/view.main.52160, Download, "tabella multiuso in formato CSV"). Provo a caricare il file in una matrice numpy. Ecco il mio codice:Caricamento file UTF-8 in Python 3 con numpy.genfromtxt
import numpy
#U75 - unicode string of max. length 75
world_alcohol = numpy.genfromtxt("xmart.csv", dtype="U75", skip_header=2, delimiter=",")
print(world_alcohol)
E ho
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 2: ordinal not in range(128).
immagino che NumPy ha un problema di lettura della stringa "Costa d'Avorio". Il file è correttamente codificato UTF-8 (secondo il mio editor di testo). Sto usando Python 3.4.3 e Numpy 1.9.2.
Cosa sto sbagliando? Come posso leggere il file in numpy?
Non OP ma grazie per l'accumulo chiaro e utile della risposta. – KobeJohn
Grazie per la risposta. Funziona! Sto solo iniziando con Python e trovo strano che numpy non possa leggere l'UTF-8 immediatamente. Ho letto che Python è facile e sviluppato con semplicità e facilità d'uso in mente ma leggere UTF-8 richiede una conversione aggiuntiva? Pensavo che vivessimo nel 2015. – JustAC0der