Inizio a utilizzare NaiveBayes/Simple classificatore per la classificazione (Weka), tuttavia ho alcuni problemi da capire durante l'addestramento dei dati. Il set di dati che sto usando è weather.nominal.arff.interpretare i risultati di Naive Bayes
Mentre io uso di test di formazione uso dalle opzioni, il risultato è classificatore:
Correctly Classified Instances 13 - 92.8571 %
Incorrectly Classified Instances 1 - 7.1429 %
a b classified as
9 0 a =yes
1 4 b = no
La mia prima domanda che cosa devo capire dalle istanze classificati errate? Perché si è verificato un problema simile? quale collezione di attributi è classificata come errata? c'è un modo per capirlo?
In secondo luogo, quando provo la convalida incrociata di 10 volte, perché ottengo istanze classificate correttamente (meno) correttamente?
I risultati sono:
Correctly Classified Instances 8 57.1429 %
Incorrectly Classified Instances 6 42.8571 %
a b <-- classified as
7 2 | a = yes
4 1 | b = no
grazie per la risposta chiara e suggerimento weka + 1. il punto di confusione è di parte, cosa intendi? Devo usare sempre la convalida incrociata per tutti i miei diversi algoritmi di classificazione? – berkay
pensaci, vuoi imparare una rete Naive Bayes che modella i tuoi dati, quindi vuoi testarne la precisione di previsione. Se si allena il modello e lo si verifica sullo stesso insieme di istanze, si sta sovrastimando la sua accuratezza (ha visto quegli esempi particolari che quindi si comportano bene su di essi), ma probabilmente avrà meno successo sui nuovi dati. Il punto chiave qui è ** generalizzazione **: vogliamo generalizzare oltre le istanze che sono state fornite in "tempo di allenamento" a nuovi esempi mai visti. – Amro
Amro ringrazia per le risposte chiare. sto postando qui per fare una domanda di richiamo e precisione dei risultati della convalida incrociata. recall (7/(2 + 7)) = 0778 e precision is (1/(1 + 4)) = 0.2, tuttavia weka dice per precisione = 0.636? qualche idea su questo? – berkay