2012-11-09 17 views
6

Quindi c'è una discreta quantità di documentazione su come scalare una Cassandra, ma questa è una buona risorsa su come "Non in scala" Cassandra e rimuovere i nodi dal cluster? È semplice come spegnere un nodo, lasciare che il cluster si sincronizzi di nuovo e ripetere?Il modo migliore per compattare un cluster Cassandra

La ragione è per un sito che si aspetta elevati picchi di traffico, salendo dalle quotidiane poche migliaia di visitatori a centinaia di migliaia di persone in pochi giorni. Il sito sarà "accelerato" in anticipo, avviando più istanze del server Web, Cassandra, ecc. Dopo che il torrente di richieste si è interrotto, l'obiettivo è disattivare le istanze che non sono più utilizzate, piuttosto che pagare per i server che sono solo seduti.

risposta

6

Se si appena chiuso i nodi verso il basso e riequilibrare cluster, si rischia di perdere alcuni dati, che esistono solo sui nodi rimossi e non ha ancora replicato.

Il restringimento cluster sicuro può essere fatto facilmente con nodetool. In un primo momento, eseguire:

nodetool drain 

... sul nodo rimosso, di non accettare più le scritture e memtables a filo, quindi:

nodetool decommission 

per spostare i dati del nodo ad altri nodi, e quindi arrestare il nodo verso il basso, ed eseguire su qualche altro nodo:

nodetool removetoken 

... per rimuovere il nodo dal cluster completamente. La documentazione dettagliata può essere trovata qui: http://wiki.apache.org/cassandra/NodeTool

Dalla mia esperienza, consiglierei di rimuovere i nodi uno per uno, non in lotti. Ci vuole più tempo, ma molto più sicurezza in caso di interruzioni della rete o guasti hardware.

2

Quando si rimuove i nodi potrebbe essere necessario riequilibrare il cluster, spostando alcuni nodi a un nuovo token. In un downscale piallato, è necessario:

1 - ridurre al minimo il numero di mosse.

2 - se è necessario spostare un nodo, ridurre al minimo la quantità di dati trasferiti.

C'è un articolo sul bilanciamento cluster che possono essere utili: Balancing Your Cassandra Cluster

Inoltre, l'inizio del this video è di circa aggiungere il nodo e rimuovere operazioni di nodo e migliori strategie per ridurre al minimo l'impatto gruppo in ciascuna di queste operazioni.

Speriamo che questi 2 riferimenti vi darà informazioni sufficienti per pianificare il vostro downscaling.

Problemi correlati