Il numero di livelli/nodi dipende dall'attività di classificazione e da ciò che ci si aspetta da NN. Teoricamente, se si dispone di una funzione/decisione separabile linearmente (ad esempio, la funzione AND booleana), 1 layer (vale a dire solo il livello di input senza layer nascosto) sarà in grado di formare un iperpiano e sarebbe sufficiente. Se la tua funzione non è separabile linearmente (ad esempio, il XOR booleano), hai bisogno di livelli nascosti.
Con 1 livello nascosto, è possibile formare qualsiasi area convessa, eventualmente illimitata. È possibile rappresentare qualsiasi funzione continua limitata con una mappatura finita. Maggiori informazioni su questo here.
2 livelli nascosti, al contrario, sono in grado di rappresentare i limiti decisionali arbitrariamente complessi. L'unica limitazione è il numero di nodi. In una tipica rete a livelli 2 nascosti, il primo strato calcola le regioni e il secondo strato calcola un'operazione AND (una per ciascun ipercubo). Infine, lo strato di output calcola un'operazione OR.
Secondo Kolmogorov's Theorem, tutte le funzioni possono essere apprese da una rete a 2 livelli nascosti e non è mai necessario disporre di più di 2 livelli nascosti. Tuttavia, in pratica, lo strato 1-hidden fa quasi sempre il lavoro.
In sintesi, correggere B = 0 per le funzioni separabili linearmente e B = 1 per tutto il resto.
Per quanto riguarda C e il rapporto di B e C, dare un'occhiata The Number of Hidden Layers. Fornisce informazioni generali e menziona underfitting, sovralimentazione.
L'autore suggerisce uno dei seguenti come regola generale:
- dimensioni del livello di input < C < dimensioni del livello di uscita.
- C = 2/3 la dimensione del livello di input, più la dimensione del livello di output.
- C < due volte la dimensione del livello di input.
fonte
2012-03-05 12:07:03
Possibile duplicato di questo? http://stackoverflow.com/questions/9436209/how-to-choose-number-of-hidden-layers-and-nodes-in-neural-network – Tim
@Tim Non parla della "larghezza" del strato e i vantaggi/svantaggi di profondità/larghezza. –
In realtà, la risposta accettata copre quanti livelli nascosti (profondità) e quante unità nascoste (larghezza) – Tim