abbiamo un cluster con circa 20 nodi. Questo cluster è condiviso tra molti utenti e lavori. Pertanto, è molto difficile per me osservare il mio lavoro in modo da ottenere alcune metriche come l'utilizzo della CPU, I/O, rete, memoria ecc ...Come ottenere le metriche di una scintilla di lavoro?
Come posso ottenere una metrica a livello di lavoro.
PS: il cluster ha già installato Ganglia ma non è sicuro di come avrei potuto farlo funzionare a livello di lavoro. Quello che vorrei fare è monitorare la risorsa utilizzata dal cluster per eseguire solo il mio lavoro.
Non so se si capisce correttamente. Vuoi ottenere diverse metriche del cluster direttamente dal tuo lavoro? O vuoi sapere quante risorse impiega il tuo lavoro? – maxteneff
@maxteneff, scusa se non sono stato chiaro sul mio post. Voglio sapere quante risorse ha utilizzato il mio lavoro. – diplomaticguru