esempio, ho miliardi di brevi frasi, e voglio gruppi di loro che sono simili.come trovare frasi/frasi simili in R?
> strings.to.cluster <- c("Best Toyota dealer in bay area. Drive out with a new car today",
"Largest Selection of Furniture. Stock updated everyday" ,
" Unique selection of Handcrafted Jewelry",
"Free Shipping for orders above $60. Offer Expires soon",
"XXXX is where smart men buy anniversary gifts",
"2012 Camrys on Sale. 0% APR for select customers",
"Closing Sale on office desks. All Items must go"
)
presupporre che questo vettore sia centinaia di migliaia di righe. Esiste un pacchetto in R per raggruppare queste frasi in base al significato? oppure qualcuno potrebbe suggerire un modo per classificare frasi "simili" in base a una determinata frase.
Come si propone di definire "significato"? Quali delle tue frasi di esempio dovrebbero essere raggruppate insieme? – tripleee