2015-04-14 14 views
6

L'interfaccia utente Web Spark mostra alcune informazioni interessanti sulle risorse disponibili per il cluster nel suo complesso.Determina automaticamente il numero di core e la quantità di memoria disponibile per Spark

Spark Web UI

Sono specificamente interessati a valori di:

  • Lavoratori
  • Cores
  • memoria

Come posso interrogare questi pezzi di informazioni sulla cluster globale a livello di codice?

+0

C'è una [domanda simile qui] (http://stackoverflow.com/a/25775598/877069), ma sto chiedendo specificamente l'accesso programmatico a queste informazioni. –

risposta

7

Spark non espone questo tipo di informazioni, è tutto nascosto nel Master e trasferito a WebUI.

È tuttavia possibile utilizzare un piccolo hack, WebUI supporta JSON aggiungendo/json/a una pagina.

Così, andando a http://<master-host>:<master-port>/json/ restituirà solo le informazioni che stai cercando:

{ 
    url: "spark://<host>:<port>", 
    workers: [ ], 
    cores: 0, 
    coresused: 0, 
    memory: 0, 
    memoryused: 0, 
    activeapps: [ ], 
    completedapps: [ ], 
    activedrivers: [ ], 
    status: "ALIVE" 
} 
+0

Marius, è fantastico! Immagino che questa deve essere un'API instabile soggetta a cambiamenti arbitrari tra le versioni dei punti, ma lo farà per i miei scopi. –

+2

È ancora valido? Non scintilla fornire un accesso a livello di programmazione a questo tipo di informazioni nella versione più recente? – dirceusemighini

+0

Mi piacerebbe sapere anche questo - è ancora necessario o può essere fatto tramite un'API più ufficiale ora con Spark? – user3033652

Problemi correlati