Il paradigma naturale in teoria per l'archiviazione di XBRL in un database sarebbe OLAP, perché XBRL riguarda i cubi di dati. OLAP su un database relazionale sarebbe chiamato ROLAP.
Questo non è un problema banale, perché i fatti presi da un gran numero di tassonomie possono formare un cubo molto grande e sparse (per depositata presso la SEC è 10k + dimensioni), e anche perché la creazione di uno schema di SQL richiede la conoscenza delle tassonomie prima di qualsiasi importare. Se emergono nuove tassonomie, è necessario ri-ETL tutto. Ciò non rende i database relazionali adatti come soluzione generale.
Se i documenti condividono la stessa tassonomia e la tassonomia è molto semplice (come in: non troppe dimensioni), è possibile elaborare una mappatura ad hoc per archiviare tutti i fatti in un'unica tabella con molti righe nel senso ROLAP (fatti per righe, aspetti per colonne). Alcuni produttori sono specializzati nell'archiviazione di fatti XBRL non dimensionali, nel qual caso le offerte SQL tradizionali (o "post-SQL" che scalano con righe) funzionano bene.
Alcuni fornitori creano una tabella per ciascun ipercubo XBRL nella tassonomia, con uno schema derivato dalla rete di definizione ma diverso per ciascun ipercubo. Ciò può portare a molte tabelle nel database e richiede molti join per le query che coinvolgono più hypercubes.
Alcuni altri fornitori fanno ipotesi sulla struttura XBRL sottostante o sul tipo di query che i loro utenti devono eseguire. Limitare l'ambito del problema consente di trovare architetture specifiche o schemi SQL che possono anche svolgere il lavoro per queste esigenze specifiche.
Per importare grandi quantità di documenti (ad esempio tutti i documenti SEC), noi (il mio datore di lavoro) abbiamo creato uno generic mapping in cima agli archivi dati NoSQL piuttosto che ai database relazionali. Un gran numero di fatti con un numero variabile di dimensioni si adattano a grandi raccolte di documenti semi-strutturati e le reti si adattano bene in un formato gerarchico.
fonte
2016-07-01 12:44:16
Io non credo che ci sia alcuna, ho cercato di fare la stessa cosa su due anni fa, tranne la destinazione era SQL Server. Che tipi di file hai? –
Invece di database SQL per database NoSql da prestazioni e scalabilità perpective –