Dubito che tensore sia configurato correttamente sul mio gpu box, poiché è circa 100x più lento per iterazione per formare un modello di regressione lineare semplice (batch = 32, 1500 input, 150 output variabili) sulla mia fantastica macchina gpu che sul mio portatile.benchmark di velocità per l'installazione di tensorflow
Sto usando un Titan X, con una CPU moderna, ecc. Nvidia-smi dice che sono solo al 10% di utilizzo di gpu, ma mi aspetto che sia a causa del piccolo lotto. Non sto utilizzando un feed_dict per spostare i dati nel grafico di calcolo. Tutto sta arrivando tramite un tf.decode_csv e tf.train.shuffle_batch.
Qualcuno ha qualche consiglio su come testare facilmente se la mia installazione è corretta? Ci sono dei semplici benchmark di velocità? La differenza di velocità tra il mio portatile e la macchina gpu è così drammatica che mi aspetto che le cose non siano configurate correttamente.
Alcuni esempi non sono ottimizzati per GPU e possono ottenere 100x più lentamente quando GPU è attivato a causa di copie, ecco un https: //github.com/tensorflow/tensorflow/issues/838 –