JavaPairRDD<String, Float> counts = ones
.reduceByKey(new Function2<Float, Float, Float>() {
@Override
public Float call(Float i1, Float i2) {
return i1 + i2;
}
});
La mia uscita è l è come:Come ottenere ordina per valore nella scintilla java
id,value
100002,23.47
100003,42.78
200003,50.45
190001,30.23
vorrei l'uscita da ordinare per valore come:
200003,50.45
100003,42.78
190001,30.23
100002,23.47
Come fare Posso raggiungerlo?
Spark esegue operazioni su Chiavi. Se hai bisogno di ordinare su 'values' ed è bello essere una chiave (?), Quindi mappare l'RDD di conseguenza e usare [sortByKey] (https://spark.apache.org/docs/1.0.0/api/ java/org/apache/scintilla/api/java/JavaPairRDD.html # sortByKey% 28boolean% 29). –