2009-06-23 8 views
5

Ho usato il nutch per un po ', fino a poco tempo fa che so di questo resort.Prestazioni e collo di bottiglia di Zend_Search_Lucene?

Come sono le sue prestazioni e qual è il limite di dimensioni del file che può supportare?

Inoltre, come eliminare o aggiornare un indice anziché reindicizzare ogni volta che c'è una modifica?

risposta

8

Zend_Search_Lucene è una pura implementazione PHP del formato Apache Lucene. Le versioni in formato di indice Lucene attualmente supportate (a partire da ZF 1.6) sono 1.4 - 2.3. Per ulteriori informazioni su Lucene, visita http://lucene.apache.org/java/docs/.

Per quanto riguarda i limiti di dimensione dell'indice, la dimensione dell'indice è limitata di 2 GB per le piattaforme a 32 bit e, per quanto ne so, non è limitata sulle piattaforme a 64 bit.

Le prestazioni sono in gran parte varianti in base alla modalità di creazione degli indici. Assicurati di controllare la sezione di manual that deals with performance.

Inoltre, Luke (uno strumento diagnostico per gli indici Lucene) è molto utile nell'ottimizzazione delle prestazioni e nella risoluzione dei problemi.

P.S. Per quanto riguarda l'aggiornamento, il formato del file dell'indice Lucene non supporta l'aggiornamento dei documenti. I documenti devono essere rimossi e aggiunti nuovamente all'indice per aggiornarli in modo efficace. Questo vale anche per l'implementazione Java.

+0

Grazie per il tuo commento. Ma il nutch può unire gli indici vecchi e nuovi in ​​un altro, perché Lucene no? BTW, sono file indice generati da nutch direttamente utilizzabili da Zend_Search_Lucene? – omg

+2

È possibile unire gli indici con Lucene e Zend_Search_Lucene. Puoi anche aggiornare _indexes_ se stessi, ad esempio aggiungendo un campo. MA, non è possibile aggiornare un documento in un indice. Penso che tu stia fraintendendo cosa sia Nutch. Nutch è un motore di ricerca che utilizza Lucene per i suoi indici e ricerche. Quindi sì, i suoi indici dovrebbero essere compatibili. – jason

+0

Wow, quindi penso di poter eseguire indicizzazione incrementale per Zend_Search_Lucene ora. Grazie. – omg

Problemi correlati