Come creare un indice di Amazon Redshift

che sto cercando di creare indici in Amazzonia Redshift, ma ho ricevuto un erroreCome creare un indice di Amazon Redshift

create index on session_log(UserId);

UserId è un campo intero.

fonte

2015-08-19 user3600910

Se si tenta di creare un indice (con un nome) su un tavolo Redshift:

create index IX1 on "SomeTable"("UserId");

Riceverai l'errore

An error occurred when executing the SQL command: create index IX1 on "SomeTable"("UserId") ERROR: SQL command "create index IX1 on "SomeTable"("UserId")" not supported on Redshift tables.

Questo è perché, come altri data warehouses, Redshift utilizza columnar storage e, di conseguenza, molte delle tecniche di indicizzazione (come l'aggiunta di indici non in cluster) utilizzate in altri RDBMS non sono applicabili.

Dovete comunque la possibilità di fornire un unico sort key per tavolo, e si può anche influenzare le prestazioni con un distribution key per sharding i vostri dati, e la selezione appropriata compression encodings per ogni colonna per ridurre al minimo lo stoccaggio e I/O le spese generali.

Per esempio, nel tuo caso, si può scegliere di utilizzare UserId come chiave di ordinamento:

create table if not exists "SomeTable" 
(
    "UserId" int, 
    "Name" text 
) 
sortkey("UserId");

si potrebbe desiderare di leggere qualche primer like these

fonte

2015-08-19 06:53:23 StuartLC

rotto: "come questi" – Faiz

@Faiz Grazie - Ho aggiornato, anche se non posso davvero trovare un buon riferimento 'MindShift' su AWS per coloro che sono utilizzato per i database Sql più tradizionali. – StuartLC

È possibile Define Constraints ma sarà informativo solo, come dice Amazon, non vengono applicati da Amazon Redshift. Tuttavia, le chiavi primarie e le chiavi esterne vengono utilizzate come suggerimenti per la pianificazione e dovrebbero essere dichiarate se il processo ETL o altri processi nella propria applicazione ne rafforzano l'integrità.

Alcuni servizi come pipeline con modalità di inserimento (REPLACE_EXISTING) avranno bisogno di una chiave primaria definita nella tabella.

Per altre prestazioni, la risposta dello Stuart è corretta.

fonte

2016-01-06 02:09:02

Redshift permette di creare chiave primaria

create table user (
id int , 
phone_number int, 
primary key(id))

ma dato Redshift non fa applicare tale vincoli, chiave primaria accetta i valori duplicati.

articolo allegato su tale questione

http://www.sqlhaven.com/amazon-redshift-what-you-need-to-think-before-defining-primary-key/

fonte

2016-04-12 11:00:12 user3600910

Come creare un indice di Amazon Redshift

risposta

Problemi correlati