Che cosa è ingenuo di Naive Bayes?Che cosa è "ingenuo" in un classificatore Bayes ingenuo?
risposta
realtà c'è un ottimo esempio on Wikipedia:
In termini semplici, un naive Bayes classificatore presuppone che la presenza (o l'assenza) di una particolare caratteristica di una classe è correlato alla presenza (o l'assenza) di qualsiasi altra caratteristica, data la variabile di classe. Ad esempio, un frutto può essere considerato una mela se è rosso, rotondo e di circa 4 "di diametro Anche se queste caratteristiche dipendono l'una dall'altra o dall'esistenza delle altre caratteristiche, un classificatore ingenuo Bayes considera tutto queste proprietà di contribuire in modo indipendente per la probabilità che questo frutto è una mela.
in sostanza, si tratta di "naive", perché rende le ipotesi che possono o non possono rivelarsi corrette.
L'articolo di wikipedia lo spiega correttamente, ma non sono d'accordo sul fatto che "faccia supposizioni che potrebbero o meno rivelarsi corrette". Con la giusta quantità di dati di allenamento fa un buon lavoro di filtraggio dei parametri irrilevanti. La parte "ingenua" è che non considera la dipendenza tra i parametri .. e quindi potrebbe dover esaminare i dati ridondanti. – Chip
Se i dati sono composto da un vettore di caratteristiche X = {x1, x2, ... x10} e le etichette di classe Y = {y1, y2, .. y5}. Pertanto, un classificatore Bayes identifica l'etichetta di classe corretta come quella che massimizza quanto segue formula:
.210P (y/x) = P (X/Y) * P (y) = P (x1, x2, ... x10/y) * P (y)
Quindi per, è ancora non ingenuo. Tuttavia, è difficile calcolare P (x1, x2, ... x10/Y), quindi supponiamo che le caratteristiche siano indipendenti, questo è ciò che chiamiamo l'assunto Naive, quindi, alla fine, otteniamo la seguente formula
P (y/x) = P (x1/y) * P (x2/y) * P ... (x10/y) * P (y)
si chiama naive perché rende l'assunzione che tutti gli attributi sono indipendenti l'uno dall'altro. Questo assunto è il motivo per cui è chiamato ingenuo come in molte situazioni del mondo reale che non si adattano. Nonostante ciò, il classificatore funziona molto bene in molte situazioni del mondo reale e ha prestazioni paragonabili a reti neutre e SVM in alcuni casi (anche se non tutti).
Per la classificazione quando troviamo la distribuzione congiunta il problema è che rispecchia solo i dati di addestramento ed è anche molto difficile da calcolare. Quindi abbiamo bisogno di qualcosa che generalizzi in modo più utile.
Il modello naivegeneralizza fortemente che ogni attributoè distribuita indipendentemente da altri attributi.
Aiuta davvero a non preoccuparsi della dipendenza tra gli attributi in larga misura.
- 1. Questo ingenuo è uguale, codice hash OK?
- 2. Come memorizzare un datetime ingenuo in Django 1.4
- 3. Salva classificatore addestrato Naive Bayes in NLTK
- 4. Perché questo codice decomprime un UIImage molto meglio dell'approccio ingenuo?
- 5. Albero decisionale contro il classificatore Naive Bayes
- 6. Rilevamento di una classe sconosciuta in un classificatore bayes
- 7. Classificazione di un classificatore multinomial Naive Bayes con Python Esempio
- 8. non si può paragonare datetime.now ingenuo e consapevoli() <= challenge.datetime_end
- 9. Come si converte un datetime ingenuo in datetime in DST-aware in Python?
- 10. Is parsing di un json in modo ingenuo in una classe Python o struct secure?
- 11. chiedendosi se il classificatore di Bayes abbia il giusto approccio?
- 12. Qual è la complessità di questo ingenuo codice per calcolare le combinazioni?
- 13. Quali problemi si vedranno nell'usare il multiprocessing di Python in modo ingenuo?
- 14. pytz e astimezone() non possono essere applicati a un datetime ingenuo
- 15. Come addestrare un classificatore naive bayes con sequenza di tag pos come caratteristica?
- 16. R: Il classificatore di Naives Bayes basa la decisione solo sulle probabilità a priori
- 17. Implementare il classificatore bayesiano in Ruby?
- 18. scikits learn and nltk: prestazioni del classificatore Naive Bayes molto diverse
- 19. interpretare i risultati di Naive Bayes
- 20. Ricerca di un classificatore bayesiano open source in C# per un progetto di analisi del sentimento di Twitter
- 21. Classificatori di Clustering e Bayes Matlab
- 22. Che cosa è un callback in java
- 23. Classificatore debole
- 24. Che cosa è un dispatcher
- 25. Parametri di un classificatore Weka
- 26. Implementatore di parole chiave di classificazione Naive-Bayes in NLTK
- 27. NLTK/NLP che raggruppa un classificatore soggetto molti-a-molti/multi-etichetta
- 28. Che cosa è // in XSLT?
- 29. In JavaScript che cosa è un '' in un condizionale
- 30. Test del classificatore NLTK su un file specifico
Non devi essere imbarazzato Peddler, hai fatto una bella domanda. +1 – Yavar