Reti neurali involutive e immagini 3D

Sono interessato ad applicare le CNN alle immagini 3D (cioè dati medici). TensorFlow incorpora già questa funzionalità?Reti neurali involutive e immagini 3D

fonte

2015-11-10 Monica Hernandez

No, le attuali implementazioni sono realizzate per immagini 2D (funzioni come nn.conv2d). Supportano più canali (es. RGB) ed è possibile esprimere immagini 3D come immagini 2D multicanale (ogni z-slice è un canale), ma questo non è sempre l'ideale. Inoltre, per l'utilizzo di questo tipo di approcci occorrono notevoli quantità di dati di immagine che in genere sono difficili da reperire in ambito medico.

Aggiornamento: sia TensorFlow che Theano (successivamente Keras, Lasagne, ecc.) Ora supportano tutte le operazioni 3D come sopra indicato. È importante notare che le operazioni 3D sono molto più computazionalmente e richiedono molta memoria rispetto a un'operazione 2D simile.

fonte

2015-11-14 17:57:48 kmader

Come è diverso dal conv2D? Mi sembra che Conv3D sia batch + image che crea batch + featuremaps. in conv2d, abbiamo un'immagine con canali, che crea mappe di caratteristiche kxWxH. hai il numero x di immagini? allora verrà accumulato il numero x di featuremaps. AM Ho sbagliato? – Breeze

Bene un conv2d è una matrice a 4 dimensioni (numero di immagini, conteggio dei canali, larghezza x, larghezza y) un funzionamento conv3d è una matrice a 5 dimensioni. – kmader

Sì, è giusto, voglio solo se l'operazione è la stessa, ad essere sincero mi sono perso come viene eseguita l'operazione. quando parliamo di passo temporale, cosa significa? come facciamo i passi per la dimensione temporale? Conosco 5 fotogrammi, in una riga si chiama la dimensione temporale. (Conteggio immagini, Profondità, Conteggio canali, Larghezza x, Larghezza y), la cui profondità qui sarebbe 5. Denotando che ci sono 5 fotogrammi da dire, ad esempio 200x200x3. quindi, come ha senso il passo in questo senso? – Breeze

Se si desidera utilizzare CNN con immagini 3D, un'alternativa possibile è utilizzare questo Caffe PR. Dovrai convertire i tuoi dati nel formato HDF5.

fonte

2016-02-26 20:40:32 RockridgeKid

TensorFlow ora supporta 3D convolution e 3D pooling nel ramo principale.

È possibile utilizzarli con tensore 5D come ingresso con forma: [batch_size, depth, height, width, channels].

fonte

2016-06-04 22:21:08

che dire della trasposizione 3D (deconvoluzione)? –

Fortunatamente tu, c'è una [richiesta pull] (https://github.com/tensorflow/tensorflow/pull/3049) in corso che aggiungerebbe il supporto per questo. Vedi anche [questo problema] (https://github.com/tensorflow/tensorflow/issues/2467) –

wow che è stato fortunato –

L'implementazione tensorflow per il 3D convoluzionale Neural Networks è stata fornita con i seguenti progetti open source:

Lip Reading - Cross Audio-Visual Recognition using 3D Convolutional Neural Networks

Using 3D Convolutional Neural Networks for Speaker Verification

fonte

2017-07-15 15:21:45

Reti neurali involutive e immagini 3D

risposta

Problemi correlati