Titolo praticamente riassume la domanda. Ho notato che in alcuni documenti le persone hanno fatto riferimento a uno schema di codifica BILOU per NER rispetto al tipico schema di tagging BIO (come questo documento di Ratinov e Roth nel 2009 http://cogcomp.cs.illinois.edu/page/publication_view/199)Cosa significano le etichette BILOU nel riconoscimento di entità nominali?
Dal lavoro con i dati del CoNLL 2003 so che
B stands for 'beginning' (signifies beginning of an NE)
I stands for 'inside' (signifies that the word is inside an NE)
O stands for 'outside' (signifies that the word is just a regular word outside of an NE)
Mentre mi è stato detto che le parole Bilou stanno per
B - 'beginning'
I - 'inside'
L - 'last'
O - 'outside'
U - 'unit'
ho visto anche persone di riferimento un altro tag
E - 'end'
e utilizzarlo contemporaneamente al tag "last".
Sono abbastanza nuovo nella letteratura NER, ma non sono riuscito a trovare qualcosa che spiegasse chiaramente questi tag. Le mie domande riguardano in particolare la differenza tra i tag 'last' e 'end' e il tag 'unit'.
si può mettere i riferimenti su "Ho visto anche persone fai riferimento ad un altro tag "? – Daniel