Sto cercando di classificarmi con randomForest, ma ricevo ripetutamente un messaggio di errore per il quale non sembra esserci alcuna soluzione apparente (randomForest ha funzionato bene per me fare regressione in passato). Ho incollato il mio codice qui sotto. 'successo' è un fattore, tutte le variabili dipendenti sono numeri. Qualche suggerimento su come eseguire correttamente questa classificazione?R randomForest per la classificazione
> rf_model<-randomForest(success~.,data=data.train,xtest=data.test[,2:9],ytest=data.test[,1],importance=TRUE,proximity=TRUE)
Error in randomForest.default(m, y, ...) :
NA/NaN/Inf in foreign function call (arg 1)
anche, ecco un esempio di dataset:
head(data)
success duration goal reward_count updates_count comments_count backers_count min_reward_level max_reward_level
True 20.00000 1500 10 14 2 68 1 1000
True 30.00000 3000 10 4 3 48 5 1000
True 24.40323 14000 23 6 10 540 5 1250
True 31.95833 30000 9 17 7 173 1 10000
True 28.13211 4000 10 23 97 2936 10 550
True 30.00000 6000 16 16 130 2043 25 500
Senza un esempio completamente riproducibile, no. Per lo meno, vorrei (1) controllare che non ci siano valori NA nei tuoi dati, e (2) lanciare 'traceback()' per vedere se puoi ottenere alcune informazioni più dettagliate su dove si verifica l'errore. – joran
prova a cambiare i valori "successo" in nomi di specie invece di "Veri". puoi come noi l'output di srt (dati) ?? –
Sembra che tu abbia già accettato una risposta; Mi sono imbattuto in questo e ho trovato che per la classificazione, era dovuto alla mia variabile di risposta che era della classe 'chr'. O facendo 'data $ var <- as.factor (data $ var)', o predicendo con 'randomForest (as.factor (data $ var) ~., ...)' ha risolto questo problema per me. – Hendy