Split separati da virgola dati della colonna in colonne aggiuntive

ho separati da virgola i dati in una colonna:Split separati da virgola dati della colonna in colonne aggiuntive

Column 
------- 
a,b,c,d

voglio dividere il separati da virgola dati in più colonne per ottenere questo output:

Column1 Column2 Column3 Column4 
------- ------- ------- ------- 
a  b  c  d

Come può essere realizzato?

fonte

2011-12-21 Gallop

Se il numero di campi nel CSV è costante, allora si potrebbe fare qualcosa di simile:

select a[1], a[2], a[3], a[4] 
from (
    select regexp_split_to_array('a,b,c,d', ',') 
) as dt(a)

Ad esempio:

=> select a[1], a[2], a[3], a[4] from (select regexp_split_to_array('a,b,c,d', ',')) as dt(a); 
a | a | a | a 
---+---+---+--- 
a | b | c | d 
(1 row)

Se il numero di campi nel CSV non è costante quindi è possibile ottenere il numero massimo di campi con qualcosa del genere:

select max(array_length(regexp_split_to_array(csv, ','), 1)) 
from your_table

e quindi b uild l'appropriato elenco di colonne a[1], a[2], ..., a[M] per la tua query. Quindi, se il sopra ti ha dato un massimo di 6, devi usare questo:

select a[1], a[2], a[3], a[4], a[5], a[6] 
from (
    select regexp_split_to_array(csv, ',') 
    from your_table 
) as dt(a)

è possibile combinare queste due domande in una funzione se si voleva.

Per esempio, dare questi dati (che è un NULL in ultima fila):

=> select * from csvs; 
    csv  
------------- 
1,2,3 
1,2,3,4 
1,2,3,4,5,6 

(4 rows) 

=> select max(array_length(regexp_split_to_array(csv, ','), 1)) from csvs; 
max 
----- 
    6 
(1 row) 

=> select a[1], a[2], a[3], a[4], a[5], a[6] from (select regexp_split_to_array(csv, ',') from csvs) as dt(a); 
a | a | a | a | a | a 
---+---+---+---+---+--- 
1 | 2 | 3 | | | 
1 | 2 | 3 | 4 | | 
1 | 2 | 3 | 4 | 5 | 6 
    | | | | | 
(4 rows)

Dal momento che il delimitatore è una semplice stringa fissa, si potrebbe anche usare string_to_array invece di regexp_split_to_array:

select ... 
from (
    select string_to_array(csv, ',') 
    from csvs 
) as dt(a);

Grazie a Michael per il promemoria su questa funzione.

Si dovrebbe davvero ridisegnare lo schema del database per evitare la colonna CSV se possibile. Dovresti utilizzare invece una colonna di array o una tabella separata.

fonte

2011-12-21 05:31:33

Grazie devono controllare e ripristinare – Gallop

Considerare l'utilizzo di 'string_to_array' invece di' regexp_split_to_array'; dovrebbe essere più veloce poiché non ha il sovraccarico di elaborazione di espressioni regolari. – Michael

@ Michael Puoi aggiungere un'altra risposta, se lo desideri. Oppure potrei aggiungere 'string_to_array' come opzione al mio, non so come mi sia mancato. –

split_part() fa ciò che si desidera in un unico passaggio:

SELECT split_part(col, ',', 1) AS col1 
    , split_part(col, ',', 2) AS col2 
    , split_part(col, ',', 3) AS col3 
    , split_part(col, ',', 4) AS col4 
FROM tbl;

Aggiungi il maggior numero di linee come si dispone di elementi in col (il massimo possibile). Le colonne che superano gli elementi di dati saranno stringhe vuote ('').

fonte

2011-12-23 05:09:18

E sembrerebbe eseguire molto più velocemente rispetto alla versione regexp_split_to_array. –

@ JohnBarça: tutte le funzioni di espressione regolare sono relativamente costose. Potente, ma per un prezzo ... –

Legenda! Questo è di gran lunga l'approccio più veloce a questo tipo di problema. –

È possibile utilizzare la funzione di divisione.

SELECT 
    (select top 1 item from dbo.Split(FullName,',') where id=1) Column1, 
    (select top 1 item from dbo.Split(FullName,',') where id=2) Column2, 
    (select top 1 item from dbo.Split(FullName,',') where id=3) Column3, 
    (select top 1 item from dbo.Split(FullName,',') where id=4) Column4, 
    FROM MyTbl

fonte

2017-01-09 12:36:41 vicky

Split separati da virgola dati della colonna in colonne aggiuntive

risposta

Problemi correlati