Sto eseguendo un test statistico che utilizza 10.000 permutazioni come distribuzione nulla.Il modo migliore per gestire una grande lista di dizionari in Python
Ciascuna permutazione è un dizionario di 10.000 chiavi. Ogni chiave è un gene, ogni valore è un insieme di pazienti corrispondenti al gene. Questo dizionario è generato a livello di codice e può essere scritto e letto da un file.
Voglio essere in grado di iterare su queste permutazioni per eseguire il mio test statistico; tuttavia, mantenere questa grande lista in pila rallenta le mie prestazioni.
C'è un modo per mantenere questi dizionari nella memoria archiviata e fornire le permutazioni mentre eseguo l'iterazione su di essi?
Grazie!
Da dove provengono queste permutazioni? Provengono da un file di set di dati o sono generati in modo programmatico? –
@JuanLopes Sono generati a livello di codice, ma possono essere scritti o letti da un file. –
Come vengono memorizzati e accessibili quando li si genera? – SuperBiasedMan