Sto utilizzando l'encoder di etichette per convertire i dati categoriali in valori numerici.codifica encoder codifica valori mancanti
In che modo LabelEncoder gestisce i valori mancanti?
from sklearn.preprocessing import LabelEncoder
import pandas as pd
import numpy as np
a = pd.DataFrame(['A','B','C',np.nan,'D','A'])
le = LabelEncoder()
le.fit_transform(a)
uscita:
array([1, 2, 3, 0, 4, 1])
Per l'esempio precedente, encoder etichetta cambiato NaN valori da una categoria. Come faccio a sapere quale categoria rappresenta i valori mancanti?
modo che sarebbe una marcatura di 'NaN' come un valore fittizio? Ho lo stesso problema ma voglio usare il valore imputato per la regressione lineare. –