Se si dispongono di dati come quelli:Auto cross-unirsi maiale viene ignorata
A = LOAD 'data' AS (a1:int,a2:int,a3:int);
DUMP A;
(1,2,3)
(4,2,1)
E poi un cross-join è fatto su una, A:
B = CROSS A, A;
DUMP B;
(1,2,3)
(4,2,1)
Perché secondo A ottimizzata fuori dalla query?
informazioni: versione 0.11 del maiale
== AGGIORNAMENTO ==
Se ordina un simile:
C = ORDER A BY a1;
D = CROSS A, C;
darà un corretto cross-join.
È a causa della natura del flusso di dati del framework? –
È a causa del tipo di lavori di riduzione della mappa che vengono generati in background: tuttavia, se si esegue il join, saranno necessari due input separati. – davek