Ho due seguenti DTM-s:R DocumentTermMatrix elenco di controllo non funziona, ignora automaticamente parametri ignoti
dtm <- DocumentTermMatrix(t)
dtmImproved <- DocumentTermMatrix(t,
control=list(minWordLength = 4, minDocFreq=5))
Quando a implementare questo, vedo due uguali DTM-s e se apro il dtmImproved
, ci sono parole con 3 simboli. Perché il parametro minWordLength
non funziona? Grazie!
> dtm
A document-term matrix (591 documents, 10533 terms)
Non-/sparse entries: 43058/6181945
Sparsity : 99%
Maximal term length: 135
Weighting : term frequency (tf)
> dtmImproved
A document-term matrix (591 documents, 10533 terms)
Non-/sparse entries: 43058/6181945
Sparsity : 99%
Maximal term length: 135
Weighting : term frequency (tf)
Inoltre, quando aggiungo niente nella "lista (...)" non succede nulla, nessun avviso o qlc altro –