Spark memorizza nella cache il set di dati di lavoro in memoria e quindi esegue calcoli a velocità di memoria. C'è un modo per controllare quanto tempo il set di lavoro risiede nella RAM?Memoria Apache nella memoria cache
Ho una grande quantità di dati a cui si accede attraverso il lavoro. Ci vuole tempo per caricare il lavoro inizialmente in RAM e quando arriva il prossimo lavoro, deve caricare nuovamente tutti i dati nella RAM che richiede molto tempo. C'è un modo per memorizzare i dati per sempre (o per un tempo specificato) nella RAM usando Spark?
Grazie Sujee. Ho lavorato a questa soluzione. – Atom