2016-02-02 9 views

risposta

8

Sì, esiste esattamente un RDD per intervallo batch, prodotto ad ogni intervallo di batch indipendentemente dal numero di record (inclusi nell'RDD - potrebbero esserci zero record all'interno).

Se non c'era, e la creazione di RDD era condizionata sul numero di elementi, non si avrebbe lo streaming sincrono (micro-batching), ma piuttosto una forma di elaborazione asincrona.

Problemi correlati