Ho una porzione di frasi e voglio creare la lista di edge non associata della co-occorrenza di parole e vedere la frequenza di ogni spigolo. Ho dato un'occhiata al pacchetto tm
ma non ho trovato funzioni simili. C'è qualche pacchetto/script che posso usare? Molte grazie!elenco di costi di co-occorrenza di parole in R
Nota: una parola non coincide con se stessa. Una parola che appare due o più volte co-si verifica con altre parole per una sola volta nella stessa frase.
DF:
sentence_id text
1 a b c d e
2 a b b e
3 b c d
4 a e
5 a
6 a a a
USCITA
word1 word2 freq
a b 2
a c 1
a d 1
a e 3
b c 2
b d 2
b e 2
c d 2
c e 1
d e 1
@TylerRinker grazie! Esattamente l'output dovrebbe rimanere uguale a quello della riga 5 ha solo 'a' e nella riga 6 'a' non coincide con se stesso. – leoce