Sto usando princomp
in R per eseguire PCA. La mia matrice di dati è enorme (10K x 10K con ogni valore fino a 4 punti decimali). Sono necessarie ~ 3,5 ore e ~ 6,5 GB di memoria fisica su un processore Xeon 2,27 GHz.Qual è il modo più veloce per calcolare i primi due componenti principali in R?
Poiché desidero solo i primi due componenti, c'è un modo più veloce per farlo?
Aggiornamento:
Oltre alla velocità, C'è un modo efficiente della memoria per fare questo?
Sono necessarie ~ 2 ore e ~ 6.3 GB di memoria fisica per il calcolo dei primi due componenti utilizzando svd(,2,)
.
È possibile utilizzare l'algoritmo NIPALS. Cerca i pacchetti R per quello. –