Ho cercato di lavorare su questo problema per un po '. Sto cercando di rimuovere i caratteri non ASCII dalla colonna DB_user e provando a sostituirli con spazi. Ma continuo ad avere degli errori. Ecco come il mio frame di dati appare:Rimozione di caratteri non ASCII e sostituzione con spazi dal riquadro dati di Pandas
+----------------------------------------------------------- | DB_user source count | +----------------------------------------------------------- | ???/"Ò|Z?)?]??C %??J A 10 | | ?D$ZGU ;@D??_???T(?) B 3 | | ?Q`H??M'?Y??KTK$?Ù‹???ЩJL4??*?_?? C 2 | +-----------------------------------------------------------
stavo usando questa funzione, che mi ero imbattuto, mentre la ricerca il problema su SO.
def filter_func(string):
for i in range(0,len(string)):
if (ord(string[i])< 32 or ord(string[i])>126
break
return ''
And then using the apply function:
df['DB_user'] = df.apply(filter_func,axis=1)
continuo a ricevere l'errore:
'ord() expected a character, but string of length 66 found', u'occurred at index 2'
Tuttavia, ho pensato utilizzando il ciclo nella funzione filter_func, avevo a che fare con questo inputing un char in 'ord'. Quindi nel momento in cui colpisce un carattere non ASCII, dovrebbe essere sostituito da uno spazio.
Qualcuno potrebbe aiutarmi?
Grazie!
@red_devil, nessun problema, ci sono molti modi diversi per farlo, ma sapere dove hai sbagliato è importante. –