risposta

16

Un CRF è un modello discriminante, batch, di codifica, nella stessa famiglia generale del modello di Markov di Entropia massimo.

Una spiegazione completa è la lunghezza del libro.

Una breve spiegazione è la seguente:

  1. Gli esseri umani annotare 200-500K parole di testo, che segna le entità.
  2. Gli esseri umani selezionano una serie di funzioni che, a loro avviso, indicano entità. Cose come la maiuscola, o se la parola è stata vista nel set di allenamento con un tag.
  3. Una procedura di addestramento conta tutte le occorrenze delle funzionalità.
  4. La carne dell'algoritmo CRF ricerca lo spazio di tutti i modelli possibili che si adattano ai conteggi per trovarne uno abbastanza buono.
  5. In fase di esecuzione, un decodificatore (probabilmente un decodificatore di Viterbi) esamina una frase e decide quale etichetta assegnare a ciascuna parola.

le parti dure di questo sono funzionalità di selezione e l'algoritmo di ricerca nel passaggio 4.

0

bene a capire che devi studiare un sacco di cose.
Per inizio

Comprendere la base delle reti markov e bayesiane.
Corso online disponibile in Coursera da Daphne Coller
https://class.coursera.org/pgm/lecture/index

CRF è un particolare tipo di rete di Markov dove abbiamo osservazione e stati nascosti.
L'obiettivo è trovare il miglior attributo di stato per le variabili non osservate, noto anche come problema MAP.
Essere preparati per un sacco di probabilità e ottimizzazione. :-)

Problemi correlati