se ho un vettoredeterminare la frequenza di stringa utilizzando grep
x <- c("ajjss","acdjfkj","auyjyjjksjj")
e fare:
y <- x[grep("jj",x)]
table(y)
ottengo:
y
ajjss auyjyjjksjj
1 1
Tuttavia la seconda stringa "auyjyjjksjj" dovrebbe contare la sottostringa "jj" due volte. Come posso cambiare questo da un calcolo vero/falso, per contare effettivamente la frequenza di "jj"?
Anche se per ciascuna stringa è possibile calcolare la frequenza della sottostringa divisa per la lunghezza della stringa, sarebbe ottimo.
Grazie in anticipo.
questo è eccellente, grazie. Mi accorgo che calcoli la lunghezza della stringa - nel data.frame posso chiamare la frequenza/lunghezza? questo sarebbe molto utile. Grazie. – brucezepplin
oh scusa - cosa intendo dire, posso restituire per ogni stringa la frequenza della sottostringa divisa per la lunghezza della stringa? – brucezepplin
scusate - I; sto ottenendo errore in nchar (df $ x): 'nchar()' richiede un vettore di caratteri – brucezepplin