5
chiedendo perché l'esempio StatefulNetworkWordCount.scala chiama l'updateStateByKey infame funzione di(), che dovrebbe prendere una funzione solo come parametro con invece:Spark in streaming viene chiamato updateStateByKey con parametri aggiuntivi
val stateDstream = wordDstream.updateStateByKey[Int](newUpdateFunc,
new HashPartitioner (ssc.sparkContext.defaultParallelism), true, initialRDD)
Perché la necessità (e come viene elaborato - questo non è nella firma di updateStateByKey()?) per passare un partizionatore, un booleano e un RDD?
grazie, Matt