2013-04-04 21 views
5

Lettura Heroku help sull'attivazione della ricerca di testo completo in PostgreSQL Vedo che non supporta l'ebraico per impostazione predefinita. Qualcuno sa come aggiungere il supporto per il dizionario ebraico in PostgreSQL su Heroku?Dizionario ebraico per PostgreSQL su Heroku?

Grazie, Mike

+0

sei riuscito a ottenere la ricerca di testo completo in esecuzione su pg? – Gady

+0

L'ho fatto, usando pg_search gem https://github.com/Casecommons/pg_search L'avvertenza è che non sono riuscito a trovare alcun dizionario in ebraico, quindi ho finito col usare il dizionario non ebraico predefinito che non supporta tutti i tipi di cose belle che potresti aspettarti che il dizionario ebraico supporti, come risultati corrispondenti che iniziano con una lettera diversa. – MikeMarsian

+0

quindi hai fatto ricerche ebraiche senza il dizionario? – Gady

risposta

5

io lavoro su Heroku Postgres, e vorrei in ingresso su questo argomento da quelli in grado di vend esso.

Sto osservando questo, ma finora le acque sono state oscure su come l'ebraico è supportato in molti/tutti i progetti open source, compresi i progetti di ricerca full-text dedicati come Lucene o Xapian. Esistono toolchains in piena regola per gestirli, ma la loro integrazione con PostgreSQL non è ancora esistente per quanto ne so, ad es. hebstem, hspell and libhspell, HebMorph.

Se qualcuno sa di quale sia lo stato attuale di questo in Postgres, posso provare a farlo funzionare su Heroku in un momento della mia discrezione, a seconda dei dettagli precisi di quella implementazione che devo rivedere un po 'attentamente.

As-is I miei tentativi di individuare un dizionario ispell sono stati discutibili, così come l'efficacia dei dizionari di stile ispell per l'ebraico date le regole di derivazione molto diverse riportate.

relativi lavori:

Pensieri?

+1

fa la ricerca di base nel lavoro ebraico (senza un dizionario)? – Gady

+0

Puoi trovare il dizionario di Hunspell in ebraico qui: http://src.chromium.org/svn/trunk/deps/third_party/hunspell_dictionaries/ –