Sto cercando una libreria Java leggera che supporti Ricerche vicine più vicine per Hashing sensibile locale per dati quasi equamente distribuiti in un dataset ad alta dimensione (nel mio caso 32) con alcune centinaia di migliaia di punti dati.Librerie LSH in Java
È abbastanza buono da ottenere tutte le voci in un bucket per una query. Quali realmente ho bisogno potrebbe quindi essere elaborato in un modo diverso in considerazione di alcuni parametri del filtro che il mio problema include.
Ho già trovato likelike ma spero che ci sia qualcosa di un po 'più piccolo e senza bisogno di altri strumenti (come Apache Hadoop nel caso di un simile).
Hai trovato qualcosa? Stavo cercando lo stesso con distanza euclidea come la mia metrica per kNN. –
Non proprio. Ma penso che dovrò realizzare un'implementazione da solo. La domanda tuttavia è ancora come scegliere le buone funzioni di hash ... – s1lence
Puoi iniziare con la funzione di hash nell'implementazione di matlab su http://ttic.uchicago.edu/~gregory/download.html –