Nei contatori di job hadoop, qual è la differenza tra "Output output materialized bytes" rispetto a "output output byte"? Non vedo il primo quando disabilito la compressione dell'output delle mappe, quindi suppongo che siano i byte di output reali (compressi) mentre i secondi sono byte non compressi?"Uscita mappa byte materializzati" vs "byte di output mappa"
risposta
Penso che tu abbia ragione. da http://hadoop.apache.org/docs/r1.0.4/releasenotes.html:
MAPREDUCE-2365. Nuovi contatori per FileInputFormat (BYTES_READ) e FileOutputFormat (BYTES_WRITTEN). Nuovo contatore MAP_OUTPUT_MATERIALIZED_BYTES per MapOutputSize compresso. (Siddharth Seth)
(Modifiche Dal Hadoop 0.20.2)
.............................. .................................................. .................................................. .................
Ecco una citazione da White di Tom "Guida Hadoop Definitive", 3a edizione (tabella 8-2 a pagina 261):
"Map output materialised bytes" - Il numero di byte di output della mappa effettivamente scritto sul disco. Se la compressione dell'output della mappa è abilitata, ciò si riflette nel valore del contatore.
"Map output bytes" - Il numero di byte di output non compresso prodotto da tutte le mappe nel lavoro. Incrementato ogni volta che il metodo collect()
viene chiamato sulla mappa OutputCollector
.
- 1. Utilizzo di un array di byte come chiave Mappa
- 2. algoritmo di hash in C per mappa 16 byte valori a 2 byte valori
- 3. Mappa Hadoop/Riduci vs Mappa incorporata/Riduci
- 4. Differenza tra byte vs tipi di dati byte in C#
- 5. mappa multimappa vs set
- 6. jQuery mappa vs.
- 7. Guava MultiSet vs Mappa?
- 8. Futures - mappa vs flatmap
- 9. Requirejs: percorsi vs mappa
- 10. String VS Byte [], utilizzo memoria
- 11. Google Protobuf ByteString vs. Byte []
- 12. Confronto byte byte per byte, che è più veloce? binario vs bin_collate
- 13. mappa vs hash_map in C++
- 14. mappa Groovy errore di sintassi
- 15. MemoryStream vs una matrice di byte
- 16. Convertire ctype byte matrice di byte
- 17. Fill mappa di hash durante la creazione
- 18. Mappa in Mappa in Guava
- 19. Buffer.BlockCopy vs byte non sicuro * copia puntatore
- 20. Come convertire la Mappa in byte e salvarla nella memoria interna
- 21. Come inizializzare correttamente pigro Mappa della mappa della mappa?
- 22. collezioni java vs mappa nel framework collezioni
- 23. mappa vs unordered_map per pochi elementi
- 24. mappa vs lista; perché un comportamento diverso?
- 25. C: sovrascrivere un'altra funzione byte per byte
- 26. C# - Converti byte non sicuri * in byte []
- 27. Golang convertire tipo byte [N] a [] byte
- 28. x86, differenza tra BYTE e BYTE PTR
- 29. tarray <Byte> VS Tbyte VS PByteArray
- 30. Forza UTF-8 Byte Order Mark in Perl uscita
Nella pagina dei dettagli del lavoro non mi sembra di vedere "Output byte materializzati". Sto usando Hadoop 2.0.0-mr1-cdh4.2.1. Devo apportare qualche modifica alle impostazioni. –