Sto usando il pos_tagger sulle ricette. Un problema che sto avendo è che pos_tagger restituisce che le parole nel tempo imperativo sono sostantivi, non dovrebbero essere verbi? Per esempio:NLTK Pensa che gli imperativi sono nomi
Con l'ingresso:
combine 1 1/2 cups floud, 3/4 cup sugar, salt and baking powder
L'output è:
[('combine', 'NN'), ('1', 'CD'), ('1/2', 'CD'), ('cups', 'NNS'), ('floud', 'VBD'), (',', ','), ('3/4', 'CD'), ('cup', 'NN'), ('sugar', 'NN'), (',', ','), ('salt', 'NN'), ('and', 'CC'), ('baking', 'VBG'), ('powder', 'NN')]
Ecco il codice che sto utilizzando per questo:
def part_of_speech(self,input_sentance):
text = nltk.word_tokenize(input_sentance)
return nltk.pos_tag(text)
Non dovrebbe 'combinare' essere taggato come una sorta di verbo? È questa la colpa del nltk? O sto facendo qualcosa di sbagliato?
Puoi mostrarci quale codice stai attualmente utilizzando per generare quanto sopra. –
yep ha appena aggiunto il codice – mdogg
Mentre io non so nulla di nltk, in una strana coincidenza, questa settimana l'annuale NFL Scouting Combine si terrà a Indianapolis, in cui "combine" è usato come sostantivo. – DSM