so formula per calcolare l'entropia:Calcolo entropia albero di decisione (apprendimento automatico)
H(Y) = - ∑ (p(yj) * log2(p(yj)))
In parole, selezionare un attributo e per ogni target di controllo valore valore di attributo ... modo p (YJ) è la frazione di pattern a Node N nella categoria yj - una per true in target value e one for false.
Ma ho un set di dati in cui l'attributo target è il prezzo, quindi l'intervallo. Come calcolare l'entropia per questo tipo di set di dati?
(di cui: http://decisiontrees.net/decision-trees-tutorial/tutorial-5-exercise-2/)
ma come posso decidere gli intervalli? supponiamo che ho ordinato i dati, come decidere l'intervallo ... solo a indovinare, se voglio fare un binario di questi dati? –
Ci sono molti metodi usati per questo, aggiungerò altre informazioni alla risposta, datemi un secondo ... –
oops questo non ha senso .. se gli attributi hanno due valori allora binario ... grazie a @Vic Smith! –