2014-09-24 11 views
6

Dopo le mie MapReduce finiture di lavoro, ho un sacco di Counter informazioni:Documentazione Hadoop Counters?

File System Counters 
       FILE: Number of bytes read=4386096368 
       FILE: Number of bytes written=8805370803 
       FILE: Number of read operations=0 
       FILE: Number of large read operations=0 
       FILE: Number of write operations=0 
       HDFS: Number of bytes read=54583718086 
       HDFS: Number of bytes written=4382090874 
       HDFS: Number of read operations=1479 
       HDFS: Number of large read operations=0 
       HDFS: Number of write operations=2 
     Job Counters 
       Launched map tasks=369 
       Launched reduce tasks=1 
       Data-local map tasks=369 
       Total time spent by all maps in occupied slots (ms)=34288552 
       Total time spent by all reduces in occupied slots (ms)=232084 
       Total time spent by all map tasks (ms)=8572138 
       Total time spent by all reduce tasks (ms)=58021 
       Total vcore-seconds taken by all map tasks=8572138 
       Total vcore-seconds taken by all reduce tasks=58021 
       Total megabyte-seconds taken by all map tasks=35111477248 
       Total megabyte-seconds taken by all reduce tasks=237654016 
     Map-Reduce Framework 
       Map input records=14753874 
       Map output records=666776 
       Map output bytes=4383426830 
       Map output materialized bytes=4386098552 
       Input split bytes=47970 
       Combine input records=0 
       Combine output records=0 
       Reduce input groups=1 
       Reduce shuffle bytes=4386098552 
       Reduce input records=666776 
       Reduce output records=666776 
       Spilled Records=1333552 
       Shuffled Maps =369 
       Failed Shuffles=0 
       Merged Map outputs=369 
       GC time elapsed (ms)=1121584 
       CPU time spent (ms)=23707900 
       Physical memory (bytes) snapshot=152915259392 
       Virtual memory (bytes) snapshot=2370755190784 
       Total committed heap usage (bytes)=126644912128 
     Shuffle Errors 
       BAD_ID=0 
       CONNECTION=0 
       IO_ERROR=0 
       WRONG_LENGTH=0 
       WRONG_MAP=0 
       WRONG_REDUCE=0 
     File Input Format Counters 
       Bytes Read=49449743227 
     File Output Format Counters 
       Bytes Written=4382090874 

Dove posso trovare una spiegazione per ciò che ciascuno di questi campi significa? Alcuni di questi sono abbastanza ovvi (Number of bytes read), ma altri sono più ambigui (Total time spent by all maps in occupied slots vs Total time spent by all map tasks).

Ho trovato un list of all the default counters, ma non riesco a trovare una spiegazione o una descrizione di essi.

Sono abbastanza sorpreso che non riesco a trovare facilmente la documentazione su questa uscita. Qualcuno può fornire un link o una spiegazione?

+1

Vedere questo collegamento per alcune informazioni su questo: http://stackoverflow.com/questions/25482426/explanation-for-hadoop-mapreduce-console-output – AST

+0

La spiegazione di questi contatori è disponibile nel Capitolo 8 (Ridurre le funzionalità della mappa) of the Book Hadoop - The Definitive Guide 3rd Edition di Tom White Spero che questo aiuti. Raj – Raju

risposta

0

Il capitolo 8 dello Hadoop: The Definitive Guide (PDF completo in collegamento da Washington State University) fornisce i dettagli dei contatori, da fare con MapReduce. Questo inizia a pagina 225 e sono elencati nella Tabella 8-1. Un'edizione più aggiornata (4a) di questa risorsa è disponibile allo Safari Books Online (è necessario prima effettuare il login).