Volevo utilizzare wordnet lemmatizer in python e ho appreso che il tag pos predefinito è NOUN e che non emette il lemma corretto per un verbo, a meno che il tag pos sia esplicitamente specificato come VERBO.wordnet lemmatization e pos tagging in python
La mia domanda è che cosa è il miglior colpo inorder per eseguire la lemmatizzazione sopra con precisione?
Ho eseguito il tagging pos utilizzando nltk.pos_tag
e mi sono perso nell'integrare i tag pos del tree bank sui tag pos compatibili con wordnet. Please help
from nltk.stem.wordnet import WordNetLemmatizer
lmtzr = WordNetLemmatizer()
tagged = nltk.pos_tag(tokens)
Ottengo i tag di uscita in NN, JJ, VB, RB. Come posso cambiarle in tag compatibili con wordnet?
fare Inoltre devo allenare nltk.pos_tag()
con un corpus etichettato o posso utilizzarlo direttamente sui miei dati per la valutazione?
aggettivi satellite =) 'ADJ_SAT = 's'' http://wordnet.princeton.edu/wordnet/man/wngloss.7WN.html – alvas
il tag pos per'' it'' in '" I "Mi piace". 'stringa è' 'PRP''.La funzione restituisce una stringa vuota che il lemmatizer non accetta e lancia un 'KeyError'. Cosa si può fare in quel caso? –
Qualcuno sa quanto sia efficiente quando si elaborano interi documenti? – Ksofiac