2009-05-05 16 views
6

potresti per favore suggerire i passi da seguire per le prestazioni lucene. soprattutto con dati di grandi dimensioni (circa 1 TB di file PDF da indicizzare)Prestazioni Lucene

risposta

8
  1. Scaling Lucene and Solr Leggi.
  2. definire le vostre esigenze da Lucene (per esempio: si sta l'indicizzazione dei PDF - Avete bisogno di memorizzare il testo completo, solo per rendere ricercabile, o non del tutto?)
  3. Fai un esperimento su piccola scala - Indice di un pochi documenti, vedere se il recupero è abbastanza buono.
  4. Cercare di indicizzare l'intera cosa (considerando i suggerimenti della carta per l'indicizzazione rapida e l'indicizzazione per la velocità di recupero) - Il recupero è sufficiente? Le prestazioni sono abbastanza buone?
  5. Iterare.
+0

Ciao grazie per la risposta. quanto è difficile convertire l'implementazione lucene in implementazione solr? –

+1

Non ho mai provato. Da quello che sto ascoltando, è molto facile iniziare a usare Solr. Forse dovresti provare Solr su piccola scala. Forse dovrei prendere il mio consiglio ... –