Qualcos'altro che puoi provare se hai problemi di codifica per "utf-8" e vuoi passare da una cella all'altra puoi provare quanto segue.
Python 2
(Dove "df" è l'oggetto dataframe.)
for column in df.columns:
for idx in df[column].index:
x = df.get_value(idx,column)
try:
x = unicode(x.encode('utf-8','ignore'),errors ='ignore') if type(x) == unicode else unicode(str(x),errors='ignore')
df.set_value(idx,column,x)
except Exception:
print 'encoding error: {0} {1}'.format(idx,column)
df.set_value(idx,column,'')
continue
quindi provare:
df.to_csv(file_name)
È possibile controllare la codifica del colonne di:
for column in df.columns:
print '{0} {1}'.format(str(type(df[column][0])),str(column))
Attenzione: errori = 'ignora' ometteranno il carattere ad es.
IN: unicode('Regenexx\xae',errors='ignore')
OUT: u'Regenexx'
Python 3
for column in df.columns:
for idx in df[column].index:
x = df.get_value(idx,column)
try:
x = x if type(x) == str else str(x).encode('utf-8','ignore').decode('utf-8','ignore')
df.set_value(idx,column,x)
except Exception:
print('encoding error: {0} {1}'.format(idx,column))
df.set_value(idx,column,'')
continue
fonte
2017-01-18 21:00:59
'encoding = 'utf-8'' – Private
È possibile anche usare' df.toCSV (nome_file, settembre =' \ t ') 'ecc – Blairg23
@ Blairg23 Penso che questo fosse il vecchio nome di questa funzione e che fosse deprezzato, infatti - questo non è più disponibile nella versione più recente dei panda! (Non sono sicuro quando è stato rimosso ... stranamente sembra che to_csv sia stato usato fin da 0.4! Http://pandas.pydata.org/pandas-docs/stable/whatsnew.html#id45 Nota: noi ora sono 0.14.1) –