2012-02-22 13 views

risposta

17

Lucene committer Mike McCandless corre benchmarks su base regolare per rintracciare prestazioni miglioramenti e regressioni. Sono fatti con le esportazioni di Wikipedia, che potrebbero essere un po 'più piccole di quelle che state cercando.

Ma le prestazioni non dipendono tanto dalla dimensione dell'input, quanto dal numero di documenti e termini univoci. Se hai già alcuni dati simili a quello che devi indicizzare, ti consiglio di dare un'occhiata a Mike's test tool, adattarlo alle tue esigenze ed eseguirlo con il set di dati e l'hardware per cercare di scoprire che tipo di numeri di prestazioni puoi aspettarsi.

Problemi correlati