2015-03-01 8 views
5

Sto elaborando un file di testo 500M (.gz) in amazon sc3 utilizzando spark e spark sql su amazon EMR (cluster a 6 nodi) . E il mio programma continua a stampare "INFO metrics.MetricsSaver: Salvato 10:24 record in /mnt/var/em/raw/i-d1bfb6dd_20150301_SparkSubmit_05013_raw.bin" per diverse ore.Nella scintilla, "INFO metrics.MetricsSaver: Salvato 10:24 record in ...."

Le mie domande sono:

  1. qual è il significato del registro?
  2. Come posso risolvere questo problema?

Grazie in anticipo.

+0

E 'la registrazione metriche, che accadrebbe in modo continuo. Di cosa sei preoccupato? non è un problema. –

+0

Voglio sapere cosa sta facendo in quel passo. Cosa viene salvato? – oldflag

+0

Come si spegne questo registratore? Ho disattivato con successo tutte le altre registrazioni, ma non questa. – hajons

risposta

4

Come ha detto Sean, sono solo metriche e non c'è nulla di cui preoccuparsi. Registrerà regolarmente messaggi del genere anche se non stai facendo nulla attivamente.

Per sopprimere questi messaggi, è possibile aggiornare la seguente riga in /home/hadoop/spark/conf/log4j.properties.

Modifica log4j.logger.amazon.emr.metrics=INFO a log4j.logger.amazon.emr.metrics=WARN.

0

Oltre alla risposta di Ryan, un altro modo per trasformare questa cosa fastidiosa off (nel codice, invece di config):

import org.apache.log4j.Logger 
import org.apache.log4j.Level 
Logger.getLogger("amazon.emr.metrics").setLevel(Level.OFF) 
Problemi correlati