2012-08-07 18 views
9

Sto facendo un sondaggio su diverse librerie e sistemi per applicazioni NLP. Sto cercando quelli che ho perso. La lista che ho iniziato continua a crescere, quindi sono certo che ce ne sono di più là fuori. Ecco cosa ho trovato finora.Quali librerie offrono metodi NLP di base o avanzati?

Alcuni di questi sono Open Source e alcuni sono non. Ognuno ha dei compromessi. Penso che mi stia appoggiando alle librerie che mi danno più accesso alle funzioni di base della PNL (ad esempio, voglio vedere i tag POS reali per esempio).

Quindi cosa mi è mancato? Cosa stai usando o cosa preferisci? Grazie!

+0

Grazie unutbu per i collegamenti URL. Dovrei aggiungere altro dato che sono di utilità generale per tutti. –

+0

Ho sentito che c'era un ramo NLTK 3.0 su GitHub ma non c'è più ora. Qualche parola su questo? Ho usato NLTK 2 su molti progetti, ma con così tanto ritardo nel porting su Python 3.x non posso raccomandarlo per qualcosa di diverso dalla sperimentazione. –

+0

http://text-processing.com/ – alvas

risposta

4

Un po 'di più:

Inoltre, controllare questo articolo di Wikipedia: List of natural language processing toolkits

+0

Questo articolo di wikipedia era un gateway per ogni sorta di altra roba. Lo apprezzo molto. E Apache UIMA è un framework di grande impatto, soprattutto perché ci sono modi ben definiti per farlo funzionare con Hadoop. –

1

Un altro che è una miss vergognosa è LinguaSys quale il mio amico Meta Brown ha lavorato!

1

Apache UIMA è un altro che mi è mancato al primo passaggio ed è nell'articolo di Wikipedia. È dannatamente buono, avendo una certificazione OASIS e un miliardo di strumenti utili. Non so quanto sia difficile lavorare con. Sembra che sarò trascinato a calci e urlando alla programmazione Java. Tra questo e Stanford e LingPipe vedo molte grandi scelte là fuori nel mondo open source.

1

Se ti è piaciuto UIMA allora troverai molto utile ClearTK. È implementato su UIMA e ha wrapper per molte librerie NLP/ML (OpenNLP, Stanford NLP, Mallet, LibSVM, ecc.). Ha anche buoni esempi di classificazione di documenti, tagging POS, riconoscimento di entità nominate, ecc.

Problemi correlati