2012-08-01 14 views
6

ho i seguenti dati tavoloOracle SQL assegnare numeri consecutivi a un sottoinsieme basato su colonna valori

 
ID_1 ID_2 SEQ GROUP 
212648 601327 1 
212648 1805 2 
212648 500886 3 
212648 3405 4 
212648 501174 5 
212648 201245 6 
212648 500449 7 
212648 3804 8 
212648 501533 9 
212648 3989 10 
212648 500280 11 START 
212648 175  12 BETWEEN 
212648 500395 13 END 
212648 1817 14 
212648 500945 15 START 
212648 183  16 BETWEEN 
212648 500543 17 BETWEEN 
212648 181  18 BETWEEN 
212648 500009 19 END 
212648 5576 20 
212648 500960 21 
212648 5562 22 
212648 603659 23 

desidero aggiungere una colonna che verrà applicato un nome di gruppo per le righe tra 'START" e 'END' Ad esempio:.

 
ID_1 ID_2 SEQ GROUP GROUP_SEQ 
212648 601327 1  
212648 1805 2  
212648 500886 3  
212648 3405 4  
212648 501174 5  
212648 201245 6  
212648 500449 7  
212648 3804 8  
212648 501533 9  
212648 3989 10  
212648 500280 11 START 1 
212648 175  12 BETWEEN 1 
212648 500395 13 END  1 
212648 1817 14  
212648 500945 15 START 2 
212648 183  16 BETWEEN 2 
212648 500543 17 BETWEEN 2 
212648 181  18 BETWEEN 2 
212648 500009 19 END  2 
212648 5576 20  
212648 500960 21  
212648 5562 22  
212648 603659 23  

ho cercato nelle funzioni analitiche di Oracle (RANK(), FIRST, LAST(), ecc), ma non sono riuscito a trovare una soluzione Grazie in anticipo per qualsiasi. risposte

+1

Correggimi se ho torto ma non riesci a normalizzare il tavolo ed evitare questo? –

+0

I valori delle colonne SEQ e GROUP sono valori calcolati da sottoselezioni. Ho ridotto le dimensioni del tavolo per presentare il problema. A quale normalizzazione stavi pensando? – chipix

+0

Il secondo modulo normale indica che tutte le colonne non chiave dipendono funzionalmente dall'intera chiave primaria. –

risposta

5

In alto, questa query ha ottenuto il risultato. Probabilmente un modo più pulito se un po 'più di tempo è trascorso su di esso.

SELECT id_1, id_2, seq, the_group 

     ,CASE WHEN (start_count - end_count) > 0 OR (start_count = end_count AND the_group = 'END') 
      THEN start_count 
      ELSE NULL 
     END AS group_seq 

    FROM (SELECT id_1, id_2, seq, the_group 

       ,SUM(CASE WHEN the_group = 'START' THEN 1 ELSE 0 END) 
        OVER(PARTITION BY ID_1 ORDER BY id_1, SEQ) AS start_count 

       ,SUM(CASE WHEN the_group = 'END' THEN 1 ELSE 0 END) 
        OVER(PARTITION BY ID_1 ORDER BY id_1, SEQ) AS end_count 

      FROM myTable) 

    ORDER BY id_1, seq 
+0

La query precedente ha risolto il problema e non sembra avere problemi di prestazioni. Trucco molto bello. Grazie. – chipix

Problemi correlati