Ho bisogno di aiuto con questo script suino. Sto solo ottenendo un singolo record. Sto selezionando 2 colonne e facendo un conteggio (distinto) su un altro mentre uso anche una clausola where like per trovare una descrizione particolare (desc).selezionare il conteggio distinto utilizzando porco latino
Ecco il mio sql con maiale Sto cercando di codice.
/*
For example in sql:
select domain, count(distinct(segment)) as segment_cnt
from table
where desc='ABC123'
group by domain
order by segment_count desc;
*/
A = LOAD 'myoutputfile' USING PigStorage('\u0005')
AS (
domain:chararray,
segment:chararray,
desc:chararray
);
B = filter A by (desc=='ABC123');
C = foreach B generate domain, segment;
D = DISTINCT C;
E = group D all;
F = foreach E generate group, COUNT(D) as segment_cnt;
G = order F by segment_cnt DESC;
Penso che per essere perfetto dovrebbe essere unique_segments = DISTINCT C.segment; –