Il bloom_filter_fp_chance e read_repair_chance controllano due cose diverse. Di solito li lasceresti impostati sui loro valori predefiniti, che dovrebbero funzionare bene per la maggior parte dei casi d'uso tipici.
bloom_filter_fp_chance controlla la precisione dei dati del filtro bloom per gli SST archiviati su disco. Il filtro bloom viene tenuto in memoria e quando si esegue una lettura, Cassandra controllerà i filtri bloom per vedere quali file SST potrebbero avere dati per la chiave che si sta leggendo. Un filtro di fioritura genera spesso falsi positivi e quando si legge effettivamente l'SSTable, risulta che la chiave non esiste nell'SSTable e la lettura è stata una perdita di tempo. Migliore è la precisione usata per il filtro bloom, meno i falsi positivi daranno (ma più memoria avrà bisogno).
Dalla documentazione:
0 Enables the unmodified, effectively the largest possible, Bloom filter
1.0 Disables the Bloom Filter
The recommended setting is 0.1. A higher value yields diminishing returns.
Quindi, un numero più alto dà una maggiore probabilità di un falso positivo (fp) durante la lettura del filtro fioritura.
read_repair_chance controlla la probabilità che una lettura di una chiave venga verificata rispetto alle altre repliche per quella chiave. Ciò è utile se il tuo sistema ha frequenti tempi di inattività dei nodi, con conseguente perdita di sincronizzazione dei dati. Se si eseguono molte letture, la riparazione di lettura riporta lentamente i dati in sincronia come si legge senza dover eseguire una riparazione completa sui nodi. Impostazioni più elevate causano più riparazioni in lettura di sfondo e consumano più risorse, ma sincronizzerebbero i dati più rapidamente come si legge.
Vedere la documentazione su queste impostazioni here.
fonte
2015-08-03 17:57:08
Grazie Jim! – Jagadeesh