Quindi il mio dati di input ha due campi/colonne: id1 & ID2, e il mio codice è il seguente:Scottatura: come conservare l'altro campo, dopo un groupBy ('campo) {. Dimensione}?
TextLine(args("input"))
.read
.mapTo('line->('id1,'id2)) {line: String =>
val fields = line.split("\t")
(fields(0),fields(1))
}
.groupBy('id2){.size}
.write(Tsv(args("output")))
I risultati di uscita in (ciò che io presumo) due campi: id2 * dimensioni. Sono un po 'bloccato a scoprire se è possibile mantenere il valore id1 che è stato anche raggruppato con id2 e aggiungerlo come un altro campo?
Si prega di vedere se ha senso, sento lo stesso dolore. http://stackoverflow.com/questions/25994879/scalding-flatten-fields-after-groupby – Sergey