I lotti in streaming scintilla sono i lotti di RDD .Suppose lotto di 3 RDDs.RDD partizionamento in streaming scintilla
scintilla anche la documentazione dice che un blocco viene creato ogni 200ms di ricevitore, e la partizione è assegnato al blocco.
In 1 secondo ho un lotto di 3 RDD, con 5 blocchi se si considera 200 ms.
Così come sarà un RDD ottenere partizionato tra i nodi dei lavoratori, è il singolo RDD che verrà partizionato o una partita completa.
Forse l'ho preso in modo sbagliato. Please guide me
Hey grazie @maasg – dexter
Grazie @maasg. Solo per confermare che, se abbiamo più ricevitori, abbiamo più DStreams e ogni DStream corrisponde a un RDD. Quindi, quando uniamo più Dstreams, otteniamo un singolo DStream. Questo DStream è costituito da più RDD o singoli RDD? –
@ DineshSachdev108 Bu definizione union() sarà "Restituisce un nuovo DSTREAM che contiene l'unione degli elementi nell'origine DSTREAM e otherDStream" questo significa che il risultato sarà un DSTREAM pure. E per definizione un "DStream è rappresentato come una sequenza di RDD Ciò significa che il risultato conterrà più RDD in base al numero di batch ricevuti dal ricevitore: – bigdatamann