Esistono collegamenti/risorse per i benchmark delle prestazioni per Lucene/Solr su set di dati di grandi dimensioni. Set di dati al di sopra della gamma di 500GB ~ 5 TBDove posso trovare benchmark delle prestazioni per Apache Lucene/Solr
Grazie
Esistono collegamenti/risorse per i benchmark delle prestazioni per Lucene/Solr su set di dati di grandi dimensioni. Set di dati al di sopra della gamma di 500GB ~ 5 TBDove posso trovare benchmark delle prestazioni per Apache Lucene/Solr
Grazie
Lucene committer Mike McCandless corre benchmarks su base regolare per rintracciare prestazioni miglioramenti e regressioni. Sono fatti con le esportazioni di Wikipedia, che potrebbero essere un po 'più piccole di quelle che state cercando.
Ma le prestazioni non dipendono tanto dalla dimensione dell'input, quanto dal numero di documenti e termini univoci. Se hai già alcuni dati simili a quello che devi indicizzare, ti consiglio di dare un'occhiata a Mike's test tool, adattarlo alle tue esigenze ed eseguirlo con il set di dati e l'hardware per cercare di scoprire che tipo di numeri di prestazioni puoi aspettarsi.