Recentemente ho iniziato a utilizzare weka e sto cercando di classificare i tweet in positivo o negativo utilizzando Naive Bayes. Quindi ho un set di formazione con tweet a cui ho dato l'etichetta e un set di test con tweet che hanno tutti l'etichetta "positivo". Quando mi sono imbattuto Naive Bayes, ottengo i seguenti risultati:Significato di istanze classificate correttamente weka
istanze correttamente classificati: 69 92% casi erroneamente classificati: 6 8%
Poi se cambio le etichette dei tweet nel test impostato su " negativo" e corse di nuovo Naive Bayes, i risultati sono invertiti:
casi correttamente classificati: 6 8% casi erroneamente classificati: 69 92%
ho pensato che le istanze correttamente classificati mostrano la precisione del Naive Bayes e che dovrebbe essere lo stesso no importa le etichette dei tweet nel set di prova. C'è qualcosa di sbagliato nei miei dati o non capisco correttamente il significato di istanze classificate correttamente?
Grazie mille per il vostro tempo,
Nantia
Grazie mille @Junnux e Antimonio per le risposte rapide! Il set di test è stato creato in questo modo: fornisco un termine di ricerca al mio programma, twitter api restituisce tweet che includono questo termine, questi tweet compongono il mio set di test e poi esegue Naive Bayes. Quindi non sono in grado di aggiungere le etichette corrette per il set di test. Se ti capisco bene, in questo caso sarò in grado di ottenere le risposte del classificatore per le etichette del set di test, ma non sarò in grado di valutare l'accuratezza. Ho capito bene? – nadia
Hai ragione, supponendo che tu abbia etichette per il set di allenamento almeno. Se non lo hai nemmeno, allora stai prendendo l'approccio sbagliato. Naive Bayes è un algoritmo per l'apprendimento supervisionato. Se non hai etichette, allora quello che stai cercando è l'apprendimento __unsupervised__, che richiede un diverso set di algoritmi, e in generale dà risultati molto peggiori. Ti suggerirei di trovare un modo per etichettare i tuoi dati o google per l'apprendimento senza supervisione. – Antimony
Sì, il mio scopo è l'apprendimento supervisionato, quindi ho le etichette per il mio set di allenamento. Grazie mille ancora! Mi hai davvero aiutato a risolvere alcune cose. :) – nadia