Vorrei eseguire un'operazione DISTINCT su un sottoinsieme delle colonne. Il documentation dice che questo è possibile con un foreach nidificato:Come eseguire un DISTINCT in Pig Latin su un sottoinsieme di colonne?
Non è possibile utilizzare DISTINCT su un sottoinsieme di campi; per fare ciò, utilizzare FOREACH e un blocco nidificato per selezionare prima i campi e quindi applicare DISTINCT (vedere Esempio: Blocco nidificato).
È semplice da eseguire un'operazione DISTINCT su tutte le colonne:
A = LOAD 'data' AS (a1,a2,a3,a4);
A_unique = DISTINCT A;
Consente dire che sono interessati a condurre la distinta di tutti a1, a2, a3 e. Qualcuno può fornire un esempio che mostra come eseguire questa operazione con un foreach annidato come suggerito nella documentazione?
Ecco un esempio di ingresso e di uscita prevista:
A = LOAD 'data' AS(a1,a2,a3,a4);
DUMP A;
(1 2 3 4)
(1 2 3 4)
(1 2 3 5)
(1 2 4 4)
-- insert DISTINCT operation on a1,a2,a3 here:
-- ...
DUMP A_unique;
(1 2 3 4)
(1 2 4 4)
È possibile fornire un esempio di input e output previsti? – zero323
Buon suggerimento, ho aggiornato la domanda. – Freerobots