Ho un file di input con circa 20 milioni di righe. La dimensione del file è di circa 1,2 G. È comunque possibile tracciare i dati in R. Alcune colonne hanno categorie, la maggior parte sono numeri.Tracciare enormi file di dati in R?
Ho provato il mio script di stampa con un piccolo sottoinsieme del file di input su 800K linee, ma anche se ho circa 8G di RAM, non riesco a tracciare tutti i dati. C'è un modo semplice per farlo.
Che cosa speri di vedere in una trama con 20 milioni di punti dati? – Chase
Indipendentemente dalla capacità computazionale, dovrai ridurre i tuoi dati tramite istogrammi, diagrammi di densità 1D e 2D, grafici hexbin, ... –
... continuando sulla falsariga della risposta di @Paul Hiemstra qui sotto - se dai un po ' maggiori dettagli su (un sottoinsieme di) tuoi dati potresti ottenere una discussione interessante sulle possibilità di visualizzazione andando qui. Inoltre, 'ggplot' potrebbe essere più lento/più affamato di memoria rispetto ad altre possibilità, se vuoi davvero tracciare ogni punto. –