2015-11-10 13 views

risposta

3

No, le attuali implementazioni sono realizzate per immagini 2D (funzioni come nn.conv2d). Supportano più canali (es. RGB) ed è possibile esprimere immagini 3D come immagini 2D multicanale (ogni z-slice è un canale), ma questo non è sempre l'ideale. Inoltre, per l'utilizzo di questo tipo di approcci occorrono notevoli quantità di dati di immagine che in genere sono difficili da reperire in ambito medico.

Aggiornamento: sia TensorFlow che Theano (successivamente Keras, Lasagne, ecc.) Ora supportano tutte le operazioni 3D come sopra indicato. È importante notare che le operazioni 3D sono molto più computazionalmente e richiedono molta memoria rispetto a un'operazione 2D simile.

+0

Come è diverso dal conv2D? Mi sembra che Conv3D sia batch + image che crea batch + featuremaps. in conv2d, abbiamo un'immagine con canali, che crea mappe di caratteristiche kxWxH. hai il numero x di immagini? allora verrà accumulato il numero x di featuremaps. AM Ho sbagliato? – Breeze

+0

Bene un conv2d è una matrice a 4 dimensioni (numero di immagini, conteggio dei canali, larghezza x, larghezza y) un funzionamento conv3d è una matrice a 5 dimensioni. – kmader

+1

Sì, è giusto, voglio solo se l'operazione è la stessa, ad essere sincero mi sono perso come viene eseguita l'operazione. quando parliamo di passo temporale, cosa significa? come facciamo i passi per la dimensione temporale? Conosco 5 fotogrammi, in una riga si chiama la dimensione temporale. (Conteggio immagini, Profondità, Conteggio canali, Larghezza x, Larghezza y), la cui profondità qui sarebbe 5. Denotando che ci sono 5 fotogrammi da dire, ad esempio 200x200x3. quindi, come ha senso il passo in questo senso? – Breeze

0

Se si desidera utilizzare CNN con immagini 3D, un'alternativa possibile è utilizzare questo Caffe PR. Dovrai convertire i tuoi dati nel formato HDF5.

10

TensorFlow ora supporta 3D convolution e 3D pooling nel ramo principale.

È possibile utilizzarli con tensore 5D come ingresso con forma: [batch_size, depth, height, width, channels].

+0

che dire della trasposizione 3D (deconvoluzione)? –

+1

Fortunatamente tu, c'è una [richiesta pull] (https://github.com/tensorflow/tensorflow/pull/3049) in corso che aggiungerebbe il supporto per questo. Vedi anche [questo problema] (https://github.com/tensorflow/tensorflow/issues/2467) –

+0

wow che è stato fortunato –

Problemi correlati