2014-11-13 11 views
5

Sto usando la funzione json_extract_path_text per estrarre i valori da JSON. Con l'aumento dei dati delle righe, la query richiede molto tempo per essere eseguita e non riesce per un po 'di tempo.Come velocizzare le query di Redshift

C'è un modo per ridurre il tempo di esecuzione di query o migliorare la funzione josn_extract_path_text

+0

puoi aggiungere un esempio? in generale, tutte le manipolazioni del testo rendono le interrogazioni più lunghe, ma vedere la query può essere d'aiuto – alexanderlz

risposta

1

La soluzione è: memorizzare i dati in formato tabulare, invece di JSON. JSON non è una buona scelta per archiviare set di dati più grandi perché, memorizzando dati disparati in una singola colonna, JSON non fa leva sull'architettura del negozio di colonne di Amazon Redshift. In alternativa, puoi cambiare il tuo tipo di nodo in uno più grande.

-1

Redshift essendo un archivio colonnare, la memorizzazione di dati in formato JSON non velocizza le query su di esso. Funzionerebbe su un database NOSQL di modello di documento, ma non su RedShift. Per rendere le query RedShift efficienti, lo stile di distribuzione (anche per lo scenario in cui i dati non seguono un ordine spe- cifico o casuale) delle tabelle è importante, in base al numero di cluster che si hanno. Inoltre, la chiave di distribuzione sulla colonna chiave primaria (in un modello RDBMS altrimenti) e la chiave di ordinamento sullo stesso ti aiuteranno in Joins (utilizzerebbe il join di unione di ordinazioni invece del join di hash più lungo).

Per ulteriori dettagli, consultare la documentazione. RTFM è tuo amico qui.

Problemi correlati