Ho bisogno di classificare il testo e sto usando il modulo blob python di testo per realizzarlo. Posso usare sia il classificatore di Naive Bayes che l'albero delle decisioni. Sono preoccupato per i punti sotto indicati.Classificazione del testo in python - (NLTK Sentence based)
1) I Ho bisogno di classificare frasi come argomento/Non un argomento. Sto usando due classificatori e sto allenando il modello usando i set di dati apt. La mia domanda è tutta su devo allenare il modello con solo parole chiave? o posso addestrare il set di dati con tutte le possibili argomentazioni e senza argomenti frasi di esempio? Quale sarebbe l'approccio migliore in termini di accuratezza della classificazione del testo e tempo di recupero?
2) Poiché la classificazione sarebbe o argomento/non argomento, quale classificatore otterrebbe risultati esatti? È Naive Bayes/Decision tree/Positive Naive bayes?
Grazie in anticipo.