2011-12-24 15 views
8

Come parte di un recente progetto di programmazione, ho compilato un database, il cui contenuto potrebbe essere utile a qualcun altro un giorno. Sto cercando il modo migliore per "aprire" i dati.Qual è il modo migliore per aprire i dati di origine (anziché il codice)?

Potrei (e probabilmente lo farò) caricare l'SQL su GitHub, ma mi chiedevo se qualcuno avesse trovato un modo di condivisione più "incentrato sui dati" - forse un sito web che rendesse facile per gli utenti sfogliare/interrogare/visualizzare/migliorare i set di dati, piuttosto che dar loro solo una grossa quantità di SQL.

Per chiarire, sto cercando un luogo in cui posso condividere i dati, piuttosto che un formato in cui condividerli - idealmente un equivalente di GitHub/Sourceforge.

I dati sono relativamente piccoli (poche migliaia di righe di SQL), quindi il volume non dovrebbe essere un ostacolo.

+1

Qual è l'oggetto dei dati? – Paul

+0

E quanto è grande il set di dati? Può un utente scaricarlo ragionevolmente rapidamente? –

risposta

2

Sono un grande fan di Amazon's S3 per cose come questa. E se il tuo set di dati è abbastanza interessante, potresti pubblicarlo con InfoChimps.

+0

Secondato: l'infrastruttura fornita da InfoChimps rende questo un percorso molto più semplice dell'autoproduzione. Se uno si auto-distribuisce, l'S3 offre una buona opzione di hosting. – Iterator

0

È possibile esportarlo in XML, che è probabilmente il formato di dati più compatibile, anche se è piuttosto dettagliato. Un'altra soluzione è OData, ma ciò implica l'hosting dei dati e la piattaforma che serve i dati che potrebbero non essere desiderabili.

1

Ho lavorato con molti dati di diverse società. Molto spesso questi dati sono stati in formato di dati delimitati da testo. Il più popolare, naturalmente, è separato da virgola o tab. Usare le virgole è spesso una buona scelta perché MySQL può anche esportare e importare CSV. Ecco un esempio:

id, first_name, last_name, address 
1, John, Smith, 11222 Stree Name 
1

Google Fusion Tables zecche alcune di queste scatole, anche se l'enfasi sembra essere sulla visualizzazione (non l'ho usato, quindi questo potrebbe essere sleale). Sono anche riluttante a impegnarmi troppo pesantemente con qualsiasi prodotto Google di secondo livello in questi giorni, dal momento che hanno l'abitudine di scomparire.

0

Sparkfun è un'altra possibilità, sembra essere principalmente mirata a fonti di dati in tempo reale ma offrono spazio di archiviazione gratuito e la piattaforma è open-source in modo da poter ospitare il proprio server.

Problemi correlati