Sto taggando il testo in spagnolo con il POS Tagger di Stanford (tramite NLTK in Python).Significato di Stanford Spagnolo Tag Tagger
Ecco il mio codice:
import nltk
from nltk.tag.stanford import POSTagger
spanish_postagger = POSTagger('models/spanish.tagger', 'stanford-postagger.jar')
spanish_postagger.tag('esta es una oracion de prueba'.split())
Il risultato è:
[(u'esta', u'pd000000'),
(u'es', u'vsip000'),
(u'una', u'di0000'),
(u'oracion', u'nc0s000'),
(u'de', u'sp000'),
(u'prueba', u'nc0s000')]
Voglio sapere dove posso trovato ciò significa esattamente pd000000, vsip000, di0000, nc0s000, sp000?
Grazie per la risposta. –
C'è un modo per ottenere il tag completo con Stanford NLP? In realtà sono più interessato alla persona, al numero e al genere del verbo. Sono stato in grado di farlo usando Freeling POS Tagging, ma non so come farlo con la Stanford NLP. – Kage
Kage, ho risposto alla tua domanda qui: http://stackoverflow.com/questions/29556109/spanish-pos-tagging-with-stanford-nlp-is-it-possible-to-get-the-person-number –