Usando il TM-pacchetto RI creare un documento-Term-Matrix:Filtrare le righe/documenti dal documento-Term-Matrix in R
dtm <- DocumentTermMatrix(cor, control = list(dictionary=c("someTerm")))
whichs risultati in qualcosa di simile:
A document-term matrix (291 documents, 1 terms)
Non-/sparse entries: 48/243
Sparsity : 84%
Maximal term length: 8
Weighting : term frequency (tf)
Terms
Docs someTerm
doc1 0
doc2 0
doc3 7
doc4 22
doc5 0
Ora desidero filtrare questo documento-Term-Matrix in base al numero di occorrenze di alcuni TERM nei documenti. Per esempio. filtra solo i documenti in cui alcuniTerm appare almeno una volta. Cioè doc3 e doc4 qui.
Come posso ottenere questo risultato?
Questo lo risolve perfettamente - molte grazie! Anche un buon suggerimento per il pacchetto di slam. – user3316599