Come memorizzare nella cache le letture?

Sto usando python/pysam per analizzare i dati di sequenziamento. Nel suo tutorial (pysam - An interface for reading and writing SAM files) per il comando compagno dice:Come memorizzare nella cache le letture?

'Questo metodo è troppo lento per l'elaborazione ad alto throughput. Se una lettura deve essere elaborata con il suo accoppiamento, funziona da un file ordinato di nome letto o, meglio, legge la cache. "

Come si "memorizza nella cache"?

fonte

2015-12-16 user2725109

Caching è un approccio tipico per accelerare le operazioni di lunga durata. Sacrifica la memoria per il bene della velocità computazionale.

Supponiamo che tu abbia una funzione che, dato un insieme di parametri, restituisce sempre lo stesso risultato. Sfortunatamente questa funzione è molto lenta e devi chiamarla una quantità considerevole di volte per rallentare il tuo programma.

Cosa si può fare, è memorizzare un numero limitato di {parametri: risultato} combinazioni e saltare la propria logica ogni volta che la funzione viene chiamata con gli stessi parametri.

È un trucco sporco ma piuttosto efficace soprattutto se la combinazione dei parametri è bassa rispetto alla velocità della funzione.

In Python 3 c'è uno decorator per questo scopo.
In Python 2 a library può essere d'aiuto ma è necessario un po 'più di lavoro.

fonte

2016-01-07 17:06:10 noxdafox

AlignmentFile prende come primo argomento:

filepath_or_object

Così, invece di fornire un nome di file, è possibile fornire un oggetto che supporta un'interfaccia simile a file, vale a dire i metodi seek, read , tell. Quando si implementa una classe per questo, è anche possibile implementare il caching sulle letture, che ovviamente devono dipendere dalla posizione corrente del cursore.

Se la dimensione del file è abbastanza piccolo in modo che si inserisce in memoria, è possibile leggere il file completo e operare su un oggetto io.BytesIO, non c'è bisogno di fare la propria classe:

data = io.BytesIO(open('datafile','rb').read()) 
your_object = AlignmentFile(data, <other args>)

Non sono sicuro che questo accelererò molto le cose, perché presumo che i moderni sistemi operativi (so che Linux lo farà) accedano ai file in cache. Quindi forse è sufficiente fare affidamento su questo.

fonte

2016-01-13 19:48:26 pixelbrei

Come memorizzare nella cache le letture?

risposta

Problemi correlati