Sto utilizzando TensorFlow LinearClassifier e anche DNN per classificare un set di dati di due classi.Classificazione Tensorflow con serie di dati estremamente sbilanciata
Tuttavia, il problema è che il set di dati contiene il 96% di output positivo e il 4% di output negativo e il mio programma restituisce sempre la previsione come positiva. Naturalmente, in questo caso otterrò l'accuratezza del 96%, ma non ha alcun senso.
Qual è il modo migliore per gestire questo tipo di situazione?
Utilizzare il sovracampionamento di minoranza. – Riyaz