Sto cercando di classificare i documenti di testo in numero di categorie. mio codice qui sotto funziona beneCreate_Analytics in RTextTools
matrix[[i]] <- create_matrix(trainingdata[[i]][,1], language="english",removeNumbers=FALSE,stemWords=FALSE,weighting=weightTf,minWordLength=3)
container[[i]] <- create_container(matrix[[i]],trainingdata[[i]][,2],trainSize=1:50,testSize=51:100) ,
models[[i]] <- train_models(container[[i]], algorithms=c("MAXENT","SVM"))
results[[i]] = classify_models(container[[i]],models[[i]])
Quando provo al codice sottostante per ottenere precisione, di richiamo, valori di precisione:
analytic[[i]] <- create_analytics(container[[i]], results[[i]])
ottengo il seguente errore:
Error in `row.names<-.data.frame`(`*tmp*`, value = c(NA_real_, NA_real_ :
duplicate 'row.names' are not allowed
mio Categories
sono nel formato text
. Se converto quelli categories
in Numeric
- il codice sopra funziona correttamente.
Esiste un modo per aggirare le categorie nel formato text
e ottenere Precisione, richiamo, valori di precisione.
Il mio obiettivo è ottenere precisione, richiamo, valori di precisione e matrice di confusione per il classificatore multi-classe. Esiste un altro pacchetto per ottenere i valori sopra indicati per il classificatore Testo a più classi (uno contro tutti)
si può provare se 'fattore (Categorie)' funziona per voi – OdeToMyFiddle
No non ha funzionato – RUser
C'è qualche lavoro in giro, a fai questo – RUser