Sto studiando il modello Okapi BMS25. Capisco tutto ma due confusione. Durante il calcolo della lunghezza del documento (dl) e della lunghezza media del documento (avdl). Ho trovato la lunghezza del documento èLunghezza documento media in Okapi BM25
Quindi è un riepilogo delle mie parole chiave/termini in un particolare documento. Ma quando vedo def del wiki:
Così | D | è la lunghezza del documento D in parole (vale a dire la somma delle parole totali). Ora, la domanda che cosa è effettivamente dl?
Ora, seconda domanda come calcolare avdl? (basta calcolare (doc1 + doc2 + ... N)/N dove N è il mio totale nessun documento in collezione? (e avdl è fisso per l'intera collezione?)
Davvero bello quando qualcuno si prende il tempo di spiegare la matematica. Cheers –
Da dove viene fornito l'idf (t) nella formula R (q, d)? Dove viene utilizzato? – PaulSchell