2016-04-08 15 views
7

Durante l'allenamento di una rete, le istantanee scattate ogni N iterazioni si presentano in due forme insieme. Uno è il file .solverstate, che presumo sia esattamente come suona, memorizzando lo stato delle funzioni di perdita e dei gradienti, ecc. L'altro è il file .caffemodel che conosco memorizza i parametri addestrati.Istantanee Caffe: .solverstate vs .caffemodel

Il file .caffemodel è il file necessario se si desidera un modello pre-formato, quindi immagino che sia anche il file che si desidera se si intende testare la rete.

WWhat è il .solverstate buono per? In this tutorial sembra che si possa riavviare l'allenamento da esso, ma come si differenzia dall'utilizzo di .caffemodel? .solverstate include anche le stesse informazioni di .caffemodel? In altre parole, è .caffemodel solo un sottoinsieme di .solverstate?

risposta

4

Il file solverstate, come indica il nome, memorizza lo stato del risolutore e non tutte le informazioni relative ai risultati della classificazione. Il modello viene salvato come file caffemodel, che è possibile utilizzare per ottenere risultati di classificazione per i dati. Se si desidera ottimizzare la rete, è possibile utilizzare un file caffemodel pre-addestrato. Ciò farà risparmiare tempo poiché la rete non ha bisogno di imparare da zero. Ma, nel caso in cui il tuo attuale allenamento debba essere interrotto, a causa di un'interruzione di corrente o di un riavvio imprevisto, puoi riprendere il modulo di allenamento con la precedente istantanea del solverstate. La differenza tra l'utilizzo dei file solverstate e caffemodel è che il primo consente di completare l'allenamento in modo predeterminato mentre il secondo potrebbe richiedere modifiche in determinati parametri di allenamento, come il numero massimo di iterazioni.