2014-04-12 11 views
5

Io so che dopo l'allenamento il modello lda per gensim, possiamo ottenere il tema di un documento invisibile:Gensim ottenere argomento per un documento (documento visto)

lda = LdaModel(corpus, num_topics=10) 
doc_lda = lda[doc_bow] 

Ma come circa i documenti che sono già usato per la formazione? Voglio dire c'è un modo per ottenere l'argomento per un documento in corpus che è stato utilizzato in allenamento senza trattarlo come un nuovo documento?

risposta

4

No.

informazioni da singoli documenti viene distillata nel modello, poi dimenticato. Nessuna informazione per documento è conservata (più in generale: nessuna informazione che richiede la memoria O(#docs) viene mantenuta).

+0

Ma se voglio ottenere la distribuzione dell'argomento per il documento addestrato, così posso avere qualche tipo di operazione di clustering, quindi cosa posso fare? – storen

Problemi correlati