Sono relativamente nuovo all'apprendimento automatico e sto cercando di inserire l'induzione dell'albero decisionale nel grande schema delle cose. Gli alberi decisionali (ad esempio quelli costruiti con C4.5 o ID3) sono considerati parametrici o non parametrici? Direi che potrebbero essere effettivamente parametrici perché la decisione di dividere i punti per i valori reali può essere determinata da una certa distribuzione dei valori delle caratteristiche, ad esempio la media. Tuttavia, non condividono la caratteristica non parametrica di dover conservare tutti i dati di allenamento originali (come si farebbe con kNN).Gli alberi decisionali (ad esempio C4.5) hanno considerato l'apprendimento non parametrico?
6
A
risposta
9
Il termine "parametrico" si riferisce ai parametri che definiscono la distribuzione dei dati. Poiché gli alberi decisionali come C4.5 non fanno un'ipotesi riguardo alla distribuzione dei dati, non sono parametrici. La Gaussian Maximum Likelihood Classification (GMLC) è parametrica perché presuppone che i dati seguano una distribuzione gaussiana multivariata (le classi sono caratterizzate da mezzi e covarianze). Per quanto riguarda la tua ultima frase, il mantenimento dei dati di addestramento (ad esempio, l'apprendimento basato sull'istanza) non è comune a tutti i classificatori non parametrici. Ad esempio, le reti neurali artificiali (ANN) sono considerate non parametriche ma non conservano i dati di allenamento.
Problemi correlati
- 1. Feedback: visualizzazione per gli alberi decisionali Apache Spark
- 2. Alberi decisionali e motori di regole (Drools)
- 3. Alberi decisionali ponderati che utilizzano Entropy
- 4. convalida incrociata + alberi decisionali in sklearn
- 5. Qual è la classificazione di pluralità negli alberi decisionali?
- 6. R: tramando decisionali etichette foglie degli alberi testo tagliato
- 7. Come accedere alla ponderazione dei singoli alberi decisionali in xgboost?
- 8. Come funzionano gli alberi Suffix?
- 9. Visualizzazione della regressione di alberi decisionali di scikit-learn/sklearn multi-output in png o pdf
- 10. Gli alberi AVL sono malvagi?
- 11. Prolog, ricostruire gli alberi BST dall'elenco interno
- 12. Perché non 'ZonedTime' hanno un 'eq' o 'Ord' esempio
- 13. Posso usare std :: make_shared con le strutture che non hanno un costruttore parametrico?
- 14. Modello di progettazione per una IA basata su grandi alberi decisionali in C++
- 15. Gli aggregati C++ non hanno funzioni virtuali?
- 16. Gli intervalli, i segmenti, gli alberi fenwick sono gli stessi?
- 17. non accedere ad altre DBS per gli utilizzatori che hanno creato come "userAdminAnyDatabase" ruolo
- 18. Solo relayout bambini e non tutti gli alberi
- 19. Le macro non espandono gli alberi di token interpolati?
- 20. Gli XForm hanno un successore?
- 21. Tipo parametrico localmente astratto
- 22. Gli oggetti modello hanno interfacce?
- 23. Algoritmo Divide-And-Conquer per gli alberi
- 24. Perché gli alberi binari sono importanti?
- 25. Perché il C++ non supporta il polimorfismo parametrico?
- 26. Eclipse: "Esegui come" non visualizza gli elementi dell'elenco (ad esempio "Esegui come applicazione Android")
- 27. Come trovare la sottostringa comune più lunga usando gli alberi?
- 28. contatto esterno (ad esempio facebook) su android
- 29. Vantaggi degli alberi SVM over decion e dell'algoritmo AdaBoost
- 30. Comprendere l'algoritmo di Ukkonen per gli alberi di suffisso
E l'idea dello split point dei nodi decisionali per determinare i valori reali attraverso una distribuzione? – stackoverflowuser2010
Una distribuzione non è richiesta. È possibile ordinare tutte le istanze in base al valore dell'attributo continuo, quindi dividere tra i due valori che massimizzano il guadagno di informazioni. Nessuna ipotesi è stata presa in merito alla distribuzione dei dati (cioè, nessuna ipotesi che i dati siano normalmente o diversamente distribuiti). – bogatron
Ma diciamo che una particolare implementazione di un albero decisionale utilizza una distribuzione per eseguire la divisione. Quindi questo renderebbe questa implementazione parametrica, giusto? – stackoverflowuser2010