Come capire bloom_filter_fp_chance e read_repair_chance in Cassandra

Bloom filtriCome capire bloom_filter_fp_chance e read_repair_chance in Cassandra

When data is requested, the Bloom filter checks if the row exists before doing disk I/O.

Leggi riparazione

Read Repair perform a digest query on all replicas for that key

La mia confusione è come impostare questo valore tra 0 a 1 ,. Cosa succede quando il valore varia?

Grazie in anticipo ,.

fonte

2015-08-03 Jagadeesh

Il bloom_filter_fp_chance e read_repair_chance controllano due cose diverse. Di solito li lasceresti impostati sui loro valori predefiniti, che dovrebbero funzionare bene per la maggior parte dei casi d'uso tipici.

bloom_filter_fp_chance controlla la precisione dei dati del filtro bloom per gli SST archiviati su disco. Il filtro bloom viene tenuto in memoria e quando si esegue una lettura, Cassandra controllerà i filtri bloom per vedere quali file SST potrebbero avere dati per la chiave che si sta leggendo. Un filtro di fioritura genera spesso falsi positivi e quando si legge effettivamente l'SSTable, risulta che la chiave non esiste nell'SSTable e la lettura è stata una perdita di tempo. Migliore è la precisione usata per il filtro bloom, meno i falsi positivi daranno (ma più memoria avrà bisogno).

Dalla documentazione:

0 Enables the unmodified, effectively the largest possible, Bloom filter 
1.0 Disables the Bloom Filter 
The recommended setting is 0.1. A higher value yields diminishing returns.

Quindi, un numero più alto dà una maggiore probabilità di un falso positivo (fp) durante la lettura del filtro fioritura.

read_repair_chance controlla la probabilità che una lettura di una chiave venga verificata rispetto alle altre repliche per quella chiave. Ciò è utile se il tuo sistema ha frequenti tempi di inattività dei nodi, con conseguente perdita di sincronizzazione dei dati. Se si eseguono molte letture, la riparazione di lettura riporta lentamente i dati in sincronia come si legge senza dover eseguire una riparazione completa sui nodi. Impostazioni più elevate causano più riparazioni in lettura di sfondo e consumano più risorse, ma sincronizzerebbero i dati più rapidamente come si legge.

Vedere la documentazione su queste impostazioni here.

fonte

2015-08-03 17:57:08

Grazie Jim! – Jagadeesh

Come capire bloom_filter_fp_chance e read_repair_chance in Cassandra

risposta

Problemi correlati