Ho letto attentamente la documentazione CARET a: http://caret.r-forge.r-project.org/training.html, le vignette, e tutto è abbastanza chiaro (gli esempi sul sito aiutano molto!), Ma sono ancora confuso sulla relazione tra due argomenti trainControl
:CARET. Relazione tra la suddivisione dei dati e trainControl
method
index
e l'interazione tra trainControl
e la suddivisione dei dati funzioni in cursore (es createDataPartition
, createResample
, createFolds
e createMultiFolds
)
Per inquadrare meglio la mia domande, mi permetta di utilizzare il seguente esempio dalla documentazione:
data(BloodBrain)
set.seed(1)
tmp <- createDataPartition(logBBB,p = .8, times = 100)
trControl = trainControl(method = "LGOCV", index = tmp)
ctreeFit <- train(bbbDescr, logBBB, "ctree",trControl=trControl)
Le mie domande sono:
Se uso
createDataPartition
(che presumo che fa stratificati bootstrap), come nell'esempio di cui sopra, e ho passato il risultato comeindex
atrainControl
ho bisogno di usareLGOCV
come metodo nella mia chiamatatrainControl
? Se ne utilizzo un altro (ad esempiocv
) Che differenza farebbe? Nella mia testa, una volta risolto il problema conindex
, in sostanza si sceglie il tipo di convalida incrociata, quindi non sono sicuro del ruolomethod
se si utilizzaindex
.Qual è la differenza tra
createDataPartition
ecreateResample
? È checreateDataPartition
esegue il bootstrap stratificato, mentre locreateResample
no?
3) Come posso fare stratificato k-fold (ad esempio 10 volte) croce convalida utilizzando accento circonflesso? Lo farebbe il seguente?
tmp <- createFolds(logBBB, k=10, list=TRUE, times = 100)
trControl = trainControl(method = "cv", index = tmp)
ctreeFit <- train(bbbDescr, logBBB, "ctree",trControl=trControl)
Interessante. Grazie! Ho difficoltà a mappare la tua risposta alle mie domande. Basandoti su questo, quale ruolo pensi 'index' giocato qui allora? –
@ user273158 cosa intendi con il ruolo dell'indice? index is just you tmp vector ... le tue partizioni .. – agstudy
Hmm, ma come fa un metodo come 'boot' (bootstrap) usa le partizioni specificate in' index'? Capisco il bootstrap come metodo per CV (campione con sostituzione per allenarsi e valutare su ciò che è rimasto), ma non come 'index' è usato nel bootstrap. –