Sto usando this LDA package per R. In particolare sto cercando di fare supervised latent dirichlet allocation (slda). Nel pacchetto collegato, c'è una funzione slda.em. Tuttavia ciò che mi confonde è
Ho usato tf/idf per calcolare la somiglianza tra i due documenti. Ha alcune limitazioni e non ha prestazioni molto buone. Ho cercato LDA (assegnazione di dirichlet latente) per calcolare la somiglianz