2015-03-15 7 views
5

Sto utilizzando Stanford CoreNLP e sono consapevole che non supporta il chunking delle frasi. Quello che sto cercando, dato un periodo di ingresso, per avere qualcosa di simile come output:Chunking Frasi NP, VP e PP in Java (CoreNLP)

[NP He ] [VP reckons ] [NP the current account deficit ] [VP will narrow ] [PP to ] [NP only # 1.8 billion ] [PP in ] [NP September ] . 

so anche OpenNLP supporta a quanto pare questa funzionalità, ma ho già scritto un bel po 'di codice utilizzando CoreNLP ed io non mi piacerebbe dover passare. Quindi, quello che sto cercando è una libreria esterna che possa fare questo per me o idee sull'implementazione di questa funzione nel modo più semplice (riferimenti a pubblicazioni, collegamenti, tutto è benvenuto), a partire dall'albero di analisi. Non ho bisogno che questo sia accurato come chunkers allo stato dell'arte, almeno per ora, quindi sto cercando di implementarlo velocemente e magari cambiarlo in futuro se necessario.

+0

ho capito che è stato un po 'di tempo da quando questa domanda ha avuto risposta, ma date un'occhiata a nltk. Fornisce semplici modi per bloccare e persino intaccare il testo. http://www.nltk.org/howto/chunk.html – AbtPst

risposta