Attualmente sto lavorando su una casa dataware piccole/medie dimensioni. Stiamo adottando alcuni dei concetti proposti da Kimball, vale a dire lo schema a stelle con tabelle dei fatti e delle dimensioni. Lo strutturiamo in modo che i fatti si uniscano solo alle dimensioni (non di fatto in fatto o dimensione in dimensione - ma questa è la nostra scelta, non dicendo che è il modo in cui dovrebbe essere eseguita), quindi appiattiamo tutti i join di dimensione alla tabella dei fatti.
Utilizziamo SSIS per spostare i dati dal DB di produzione -> DB di origine -> DB di staging -> DB di report (probabilmente avremmo potuto utilizzare meno DB, ma è così che è caduto).
SSIS è davvero bello in quanto consente di strutturare i flussi di dati in modo molto logico. Utilizziamo una combinazione di componenti SSIS e stored proc, in cui una delle funzionalità di SSIS è la possibilità di fornire comandi SQL come una trasformazione tra un flusso di dati di origine/destinazione. Ciò significa che possiamo chiamare proc memorizzati su ogni riga, se vogliamo, che può essere utile (anche se un po 'più lento).
Stiamo anche utilizzando un Server 2008 cattura funzionalità chiamata Change Data nuovo SQL (CDC), che permette di controllare tutte le modifiche su una tabella (è possibile specificare le colonne che si desidera guardare a quei tavoli), quindi abbiamo utilizzalo sul DB di produzione per dire cosa è cambiato in modo da poter spostare solo quei record nel DB di origine per l'elaborazione.
@John: hai utilizzato il progetto Kimble "fatti e dimensioni schema a stella" per il tuo modello di data warehouse? –
Penso di sì. Non ho mai letto questo ragazzo "Kimble", anche se le persone invocano il suo nome nel data warehouse quasi quanto invocano "Knuth" negli algoritmi. Ma poi di nuovo, non ho mai finito il primo libro di Knuth e ho finito col vendere l'intero set. Il datamart su cui sto lavorando ora è più un fiocco di neve, poiché abbiamo alcune dimensioni che hanno dimensioni. La nostra situazione è analoga al fatto che sia i clienti che i venditori siano dimensioni, ed entrambi hanno una geografia. –
Mi scuso, volevo dire Kimball, non Kimble :) –