2012-03-24 6 views
9

Conosco i seguenti strumenti open source, ma non ho trovato alcun confronto su quanto siano validi. Utensili con pronto per usare l'espressione di estrazione:Quale strumento di estrazione delle frasi è lo stato dell'arte adesso?

  • KEA
  • MAUI (http://code.google.com/p/maui-indexer/)
  • Drago, Xtract (http: // drago .ischool.drexel.edu/xtract.asp)
  • Lingpipe (http://alias-i.com/lingpipe/demos/tutorial/interestingPhrases/read-me.html)
  • Mahout (https: // cwiki .apache.org/mahout/collocations.html)
  • Tutto il resto

Qualcuno ha mai visto un simile confronto?

+0

con "frase estrazione", vuol dire "frase splitting" o "frase tokenizzazione"? – Renaud

risposta

0

mi piace Mallet perché ha uno strumento a riga di comando che è veramente facile da usare

+0

Come estrarre le frasi con la mazza? cioè ci sono topic modelling = clustering, ma come sono a conoscenza non c'è l'estrazione della frase chiave dalla grande corpra – yura

+0

hai ragione, scusa, stavo pensando all'oggetto topic moedling –

4

MAUI sorpassa KEA sui miei esperimenti. Esiste un confronto sui metodi di estrazione automatica delle frasi chiave senza supervisione (carta Coling 2010). Ma non analizzano i metodi supervisionati, ho intenzione di farlo in un prossimo futuro.

Inoltre, ho anche esplorato un insieme più ricco di caratteristiche che ha migliorato le prestazioni di estrazione automatica frase chiave che è ancora lontano dall'essere perfetto. Potrei rilasciare la versione estesa di MAUI con quelle estensioni il prossimo anno.

Si prega di leggere i seguenti documenti o email me più particolari:

Supervised Topical Key Phrase Extraction of News Stories using Crowdsourcing, Light Filtering and Co-reference Normalization

Keyphrase Cloud Generation of Broadcast News

Problemi correlati