Ho circa 250kb di codice HTML statico che devo cercare. Ho pensato che avrei usato Zend Lucene per quello. La creazione di indici richiede pochi secondi e tutto è bello e buono, tranne se la ricerca di "circa" finisce con questo:Zend_Search_Lucene tenta di allocare 3503812093817007931 byte
Fatal error: Allowed memory size of 134217728 bytes exhausted (tried to allocate
3503812093817007931 bytes) in /var/www/u1938159/data/www/-----
/protected/vendors/Zend/Search/Lucene/Storage/File/Filesystem.php on line 163
Altre parole sembrano essere ok per esso. Inoltre, i file contengono alcuni testi stranieri. Quindi devo usare caso analizzatore insensibile
Zend_Search_Lucene_Analysis_Analyzer::setDefault(
new Zend_Search_Lucene_Analysis_Analyzer_Common_Utf8_CaseInsensitive()
);
Zend_Search_Lucene_Search_QueryParser::setDefaultEncoding('utf-8');
In questo caso ci vuole un'eternità per caricare e non funziona affatto schiantarsi con questo:
Error occured while file reading.
non Lucene hanno problemi gravi o fatto io rovina qualcosa da solo?
Quanti file html ci sono? – raina77ow