Se non è rigorosa per utilizzando solo NLTK, si può provare il nostro robusto e indipendente dal linguaggio POS etichettatura toolkit RDRPOSTagger.
(Licenza: GPLv2, linguaggio di programmazione: Python & Java)
RDRPOSTagger ottiene prestazioni veloci sia in processo di apprendimento e codifica. Inoltre, RDRPOSTagger raggiunge un'accuratezza molto competitiva rispetto ai risultati allo stato dell'arte.
Aggiornato il 18/11/2015: versione 1.2 con maggiore precisione di codifica, in particolare su linguaggi morfologicamente ricchi. Visualizza i risultati sperimentali inclusa la velocità della prestazione e la precisione di codifica in this paper.
RDRPOSTagger supporta modelli POS e morfologici di etichettatura pre-formati per bulgaro, ceco, olandese, inglese, francese, tedesco, hindi, italiano, portoghese, spagnolo, svedese, thailandese e vietnamita. RDRPOSTagger supporta anche i modelli di codifica POS Universal pre-formati per 40 lingue.
possibile duplicato di [NLTK Tagging parole spagnole che utilizzano un corpus] (http://stackoverflow.com/questions/14732465/nltk-tagging-spanish-words-using-a-corpus) – alvas