2009-06-09 9 views
14

Cerco un'implementazione Java del Generalized suffisso Albero (GST) con le seguenti caratteristiche:generalizzato suffisso Albero Java Attuazione

Dopo la creazione del GST da dire 1000 stringhe Vorrei scoprire quanti di queste 1000 stringhe contengono altre stringhe "s".

La ricerca deve essere tranquillo veloce, come ho bisogno di applicare la ricerca su circa 100'000 corde candidati di lunghezza media 10.

+0

Ciao, mi chiedevo se potessi dirmi quale soulution hai usato alla fine, ho lo stesso problema !!! – Julia

+0

guarda qui: http://stackoverflow.com/questions/9452701/ukkonens-suffix-tree-algorithm-in-plain-english/9513423#9513423 – YAMM

risposta

4

Prova The Semantic Discovery Toolkit. Ha un'implementazione su testo/src/java/org/sd/text/radixtree

+0

Er, sai di eventuali implementazioni (o anche tutorial!) per gli alberi Token Suffix? –

3

ho creato un albero di suffissi in Java che ti consente di aggiungere facilmente la tua funzionalità di ricerca e altri algoritmi di corrispondenza. Il mio post sul blog, Suffix Trees in Java, ha una panoramica e istruzioni per scaricare la versione più recente. La mia implementazione Java si basa sull'articolo Fast String Searching With Suffix Trees di Mark Nelson.

Aggiornamento 2016-06-18

+0

Il post del blog è informativo ma la fonte non è al momento disponibile (agosto 2014) poiché punta a https://svn.globalmentor.com/java/trunk/globalmentor-core/ protetto da password. – codeDr

+0

Sto facendo del mio meglio per convertire il nostro repository da Subversion a Git e renderlo nuovamente pubblico. Ciò dovrebbe accadere entro una settimana o due. Sentiti libero di chiamarmi se non è disponibile per allora. Saluti. –

+0

Il codice sorgente è ora disponibile tramite Git e su Maven Central. Ho aggiornato la risposta sopra con la nuova posizione. –