Sto lavorando al normale data.frame
che sembra essere troppo grande per la funzione glm
quindi ho deciso che lavorerò su una rappresentazione sparsa di una matrice del modello in modo da poter mettere questo scarso matrice nella funzione glmnet
. Ma sparse.model.matrix
sembra cadere alcune righe dalla matrice originale. Qualche idea del perché ciò accada e di qualsiasi soluzione su come evitarlo? codice qui sotto:sparse.model.matrix perde righe in R
> mm <- sparse.model.matrix(~clicks01+kl_tomek*bc1+hours+plec+1,
data = daneOst)
> dim(mm)
[1] 1253223 292
> dim(daneOst)
[1] 1258836 6
Si noti che lo sto utilizzando per i modelli basati su albero che possono gestire i valori NA. YMMV – Bar
Penso che questa sia la soluzione migliore, finora. Ecco perché accetto questo come risposta. –