La configurazione di snow
su un cluster di Windows è piuttosto difficile. Ciascuna macchina deve avere R e snow
installate, ma questa è la parte facile. Per avviare un cluster SOCK, è necessario un demone sshd in esecuzione su ciascuna delle macchine worker, ma è comunque possibile incontrare problemi, quindi non lo consiglierei a meno che tu non sia bravo nel debug e nell'amministrazione del sistema Windows.
Penso che l'opzione migliore su un cluster di Windows sia l'utilizzo di MPI. Non ho alcuna esperienza con MPI su Windows, ma ho sentito parlare di persone che hanno avuto successo con le distribuzioni MPICH e DeinoMPI MPI per Windows. Dopo aver installato MPI nel cluster, è necessario installare il pacchetto Rmpi
dal sorgente su ciascuna delle macchine worker. Dovresti quindi creare l'oggetto cluster usando la funzione makeMPIcluster
. È un sacco di lavoro, ma penso che sia più probabile che alla fine lavori piuttosto che provare ad usare un cluster SOCK a causa dei problemi con ssh/sshd su Windows.
Se si desidera eseguire un processo parallelo una o due volte su un cluster di Windows, è possibile provare a utilizzare la modalità manuale. Esso consente di creare un cluster CALZINO senza ssh:
workers <- c(rep("COMP01",32), rep("COMP02",32))
cl <- makeSOCKluster(workers, manual=TRUE)
La funzione makeSOCKcluster
richiederà di iniziare ogni uno degli operai, che visualizza il comando da utilizzare per ogni. È necessario aprire manualmente una finestra di comando sul computer specificato ed eseguire il comando specificato. Può essere estremamente noioso, in particolare con molti lavoratori, ma almeno non è complicato o complicato. Può anche essere molto utile per il debug in combinazione con l'opzione outfile=''
.
fonte
2013-07-09 14:48:11
Sì, è necessario installare R su ciascun nodo. –
@HongOoi e devo specificare la posizione di R o semplicemente quella predefinita? – Manolete