Sono interessato ad applicare le CNN alle immagini 3D (cioè dati medici). TensorFlow incorpora già questa funzionalità?Reti neurali involutive e immagini 3D
risposta
No, le attuali implementazioni sono realizzate per immagini 2D (funzioni come nn.conv2d). Supportano più canali (es. RGB) ed è possibile esprimere immagini 3D come immagini 2D multicanale (ogni z-slice è un canale), ma questo non è sempre l'ideale. Inoltre, per l'utilizzo di questo tipo di approcci occorrono notevoli quantità di dati di immagine che in genere sono difficili da reperire in ambito medico.
Aggiornamento: sia TensorFlow che Theano (successivamente Keras, Lasagne, ecc.) Ora supportano tutte le operazioni 3D come sopra indicato. È importante notare che le operazioni 3D sono molto più computazionalmente e richiedono molta memoria rispetto a un'operazione 2D simile.
Se si desidera utilizzare CNN con immagini 3D, un'alternativa possibile è utilizzare questo Caffe PR. Dovrai convertire i tuoi dati nel formato HDF5.
TensorFlow ora supporta 3D convolution e 3D pooling nel ramo principale.
È possibile utilizzarli con tensore 5D come ingresso con forma: [batch_size, depth, height, width, channels]
.
che dire della trasposizione 3D (deconvoluzione)? –
Fortunatamente tu, c'è una [richiesta pull] (https://github.com/tensorflow/tensorflow/pull/3049) in corso che aggiungerebbe il supporto per questo. Vedi anche [questo problema] (https://github.com/tensorflow/tensorflow/issues/2467) –
wow che è stato fortunato –
L'implementazione tensorflow per il 3D convoluzionale Neural Networks è stata fornita con i seguenti progetti open source:
Lip Reading - Cross Audio-Visual Recognition using 3D Convolutional Neural Networks
Using 3D Convolutional Neural Networks for Speaker Verification
- 1. Progetto reti neurali?
- 2. RBF reti neurali C#
- 3. Reti neurali - valori di input
- 4. Programmazione reti neurali con Python?
- 5. Reti neurali coattuzionali - Canali multipli
- 6. Reti neurali in Haskell - consiglio
- 7. Estrazione di feature da reti neurali
- 8. Problemi nella comprensione delle reti neurali
- 9. Qualcuno può spiegare le reti neurali artificiali?
- 10. Reti neurali in MATLAB, pesi iniziali
- 11. Domande su Q-Learning usando Reti Neurali
- 12. TensorFlow - Classificazione del testo tramite reti neurali
- 13. Reti neurali e elaborazione di immagini per sparare ai caterpillars con laser
- 14. Le reti neurali per il rilevamento e-mail di spam
- 15. Come si ottengono/definiscono i filtri nelle reti neurali convoluzionali?
- 16. Il nodo bias è necessario in reti neurali molto grandi?
- 17. Mappe di saliency delle reti neurali (usando Keras)
- 18. Calcolo di matrice Jacobiana per reti neurali artificiali
- 19. CPU vs GPU per (conv) Calcolo delle reti neurali
- 20. Come utilizzare le reti neurali per risolvere soluzioni "soft"?
- 21. Esiste un formato comune per le reti neurali
- 22. Implementazione di una funzione di attivazione softmax per reti neurali
- 23. Aggiungi bias a strati di reti neurali Lasagne
- 24. Come utilizzare il layer di incorporamento per reti neurali ricorrenti (RNN) in Keras
- 25. Tessaract OCR utilizza le reti neurali come meccanismo di allenamento predefinito
- 26. Le reti neurali non riescono a capire le trasformate di Fourier?
- 27. In che modo il pre-allenamento migliora la classificazione nelle reti neurali?
- 28. Zend_Mail e = 0D = 0A = 3D = 3D = 3D = 3D = 3D
- 29. Reti neurali: esempio di open source minimo con dati esaurienti sull'allenamento?
- 30. ricostruzione 3D da immagini calibrate della fotocamera
Come è diverso dal conv2D? Mi sembra che Conv3D sia batch + image che crea batch + featuremaps. in conv2d, abbiamo un'immagine con canali, che crea mappe di caratteristiche kxWxH. hai il numero x di immagini? allora verrà accumulato il numero x di featuremaps. AM Ho sbagliato? – Breeze
Bene un conv2d è una matrice a 4 dimensioni (numero di immagini, conteggio dei canali, larghezza x, larghezza y) un funzionamento conv3d è una matrice a 5 dimensioni. – kmader
Sì, è giusto, voglio solo se l'operazione è la stessa, ad essere sincero mi sono perso come viene eseguita l'operazione. quando parliamo di passo temporale, cosa significa? come facciamo i passi per la dimensione temporale? Conosco 5 fotogrammi, in una riga si chiama la dimensione temporale. (Conteggio immagini, Profondità, Conteggio canali, Larghezza x, Larghezza y), la cui profondità qui sarebbe 5. Denotando che ci sono 5 fotogrammi da dire, ad esempio 200x200x3. quindi, come ha senso il passo in questo senso? – Breeze