Abbiamo tre istanze EC2, una in ciascuna zona di disponibilità (AZ) nella regione eu-west-1. Sono bilanciati dal carico usando ELB. Vorremmo monitorare quante istanze sono registrate al loadbalancer, usando CloudWatch. Il problema è: non capisco davvero la metrica HealthyHostCount
.Come si utilizza HealthyHostCount di ELB per il monitoraggio in CloudWatch?
Per una distribuzione, vorremmo essere in grado di annullare la registrazione di una singola istanza (estrarla dall'LB) senza essere notificata. Quindi l'allarme sarebbe: Notifica se c'è solo 1 istanza sana lasciata dietro il loadbalancer per 5 minuti.
Per quanto ho capito, HealthyHostCount
(HHC) è il numero di istanze sane registrate con un dato ELB, mediato su tutte le AZ. Se tutto è a posto, l'HHC dovrebbe essere 1 (indipendentemente da quale periodo di tempo) perché c'è 1 istanza in ogni AZ.
Un paio di giorni fa, qualcuno si era schierato senza ripetere la registrazione delle istanze, quindi c'era solo 1 istanza in bilico. Quando l'abbiamo notato, abbiamo creato un allarme che doveva notificarci quando l'HHC medio è diminuito sotto 0,6 dopo 5 minuti. (Se in ELB è registrata solo 1 istanza, l'HHC dovrebbe avere una media di 0,33 per qualsiasi periodo di tempo.) Tuttavia, l'allarme non è mai cambiato in "ALLARME".
Quando ho controllato l'HHC in CloudWatch, l'HHC erano numeri che non avevano senso (somma di 10.0 per un intervallo di 5 minuti è tutto ciò che ricordo ora).
È tutto un gran casino per me. Ogni volta che penso di capire la metrica, i grafici di Cloud Watch sono per me senza senso.
Qualcuno potrebbe spiegare come utilizzare HHC per ottenere un allarme quando è registrata solo 1 istanza? L'HHC medio è la strada da percorrere o dovrei usare un'altra metrica?
Grazie per la spiegazione dettagliata e sorprendente! –