2010-06-27 11 views
15

Sto costruendo un'applicazione NLP e sto usando Stanford Parser per la maggior parte del mio lavoro di analisi, ma mi piacerebbe iniziare a usare Python.NLTK ha uno strumento per l'analisi delle dipendenze?

Finora, NLTK sembra la soluzione migliore, ma non riesco a capire come analizzare le dipendenze grammaticali. Cioè questo è un esempio di Stanford Parser. Voglio essere in grado di produrre questo in NTLK utilizzando Python dalla frase originale "Sono il passaggio a Python.":

nsubj(switching-3, I-1) 
aux(switching-3, am-2) 
prep_to(switching-3, Python-5) 

Qualcuno mi può dare una spinta nella giusta direzione per analizzare le dipendenze grammaticali?

+0

Puoi stare con Python e continuare a usare Stanford Parser se usi Jython. Questo è ciò che faccio. – prash

risposta

13

NLTK include il supporto per l'utilizzo del MaltParser, vedere nltk.parse.malt.MaltParser.

Il modello inglese pre-esistente per MaltParser che è disponibile here analizza la rappresentazione di dipendenza di base di Stanford. Tuttavia, è comunque necessario chiamare il codice JavaNLP di Stanford per convertire le dipendenze di base nella rappresentazione CC descritta in precedenza nel proprio esempio di analisi.

+0

Quindi, non è possibile attenersi interamente a Python? – sholsapp

+2

Se si desidera ** CCprocessed **, no, non lo è. – dmcer

Problemi correlati