Le espressioni regolari del parser di chunk di NLTK possono corrispondere ai tag POS, ma possono anche corrispondere a parole specifiche?
Quindi, supponiamo di voler bloccare qualsiasi struttura con un nome seguito dal verbo "sinistra" (chiama questo modello L). Ad esempio, la frase "the \ DT dog \ NN left \ VB" deve essere suddivisa in
(S (DT the) (L (NN dog) (VB sinistra))), ma la frase "the \ DT dog \ NN ha dormito \ VB "non sarebbe stato affatto suddiviso.Parole corrispondenti con l'analizzatore chunk di NLTK
Non sono stato in grado di trovare alcuna documentazione sulla sintassi regex dei chunking e tutti gli esempi che ho visto corrispondono solo ai tag POS.
Potete fornire un esempio lungo le linee di: chunkGram = r "" "Chunk: {? * * + }" "" –
ProfVersaggi