Monitorare un cluster di nodi

Ho> 10 nodi in un cluster. Ho installato uno stack Hadoop sul cluster usando Cloudera (YARN, HBase, Hue, Hadoop FS, Spark, Flink). C'è un modo semplice per raccogliere statistiche globali di tutti i nodi (in termini di utilizzo della CPU, utilizzo della memoria e utilizzo della rete) e leggerlo con Python? Lo scopo di usare Python è che sono completamente libero di specificare i grafici e di assicurare uno stile di stampa uniforme nel mio rapporto. Quale software posso usare per realizzare questo? Non deve essere distribuito, basta una libreria facile.Monitorare un cluster di nodi

fonte

2016-07-17 www.data-blogger.com

sto usando librato.com, ha un processo molto semplice integrazione di leggere metriche e mostrare loro in un bel cruscotto, e anche un modulo python per pubblicare o recuperare dati. – Maviles

ho fatto un pacchetto di me stesso: http://github.com/kevin91nl/isa

Un tutorial può essere trovato su https://www.data-blogger.com/2016/07/18/monitoring-your-cluster-in-just-a-few-minutes/

Se qualcuno conosce una migliore alternativa, fatemelo sapere.

fonte

2016-07-18 12:43:29

Spero che i gangli soddisfino il requisito. Ma ancora dovrebbe essere configurato su tutti i nodi nel cluster. –

Vorrei suggerire di utilizzare ansible per questo scopo. Ecco un semplice playbook che raccoglie alcuni dati su host specificati nel inventory file e lo aggiunge un file locale:

- hosts: all 
    remote_user: your_user 
    tasks: 
    - name: collect load average 
    shell: cat /proc/loadavg 
    register: cluster_node_la 

    - name: write to local disk 
    lineinfile: dest=/tmp/cluster_stat create=yes line="{{ ansible_fqdn }}:{{ cluster_node_la.stdout_lines }}" 
    delegate_to: 127.0.0.1

è possibile eseguirlo come segue: ansible-playbook -i ansible-inventory stats-playbook.yml --forks=1

ansible_inventory è il file contenente un elenco dei tuoi host
stats-playbook.yml è il file stampato sopra

Ovviamente, a seconda di come archiviare i dati raccolti potrebbe essere implementato in modo diverso, ma penso che l'idea generale sia chiara. In ogni caso, ci sono molti modi per risolverlo in ansible.

Inoltre, ansible ha API python e puoi fare la maggior parte delle cose direttamente da python! Vale a dire, questo è il modo siamo in grado di raccogliere la configurazione del cluster:

import pprint 

import ansible.runner 
import ansible.inventory 

inventory_file = 'ansible_inventory' # see ansible inventory files 
inventory = ansible.inventory.Inventory(inventory_file) 

runner = ansible.runner.Runner(
    module_name='setup', 
    module_args='', 
    pattern='all', 
    inventory=inventory 
) 

cluster_facts = runner.run() 
pprint.pprint(cluster_facts)

fonte

2016-07-26 20:18:42 ffeast

Sembra fantastico! Grazie :-) –

Monitorare un cluster di nodi

risposta

Problemi correlati