2016-03-05 9 views
11

Sono un principiante nell'apprendimento automatico e nell'elaborazione del linguaggio naturale.Differenza tra parametri, caratteristiche e classe in Machine Learning

Sono sempre confuso tra quali sono questi tre termini?

Dalla mia comprensione:

classe: le varie categorie nostra produzione modello. Dato un nome di persona identificare se lui/lei è maschio o femmina?

Diciamo che sto usando il classificatore Naive Bayes.

Quali sarebbero le mie caratteristiche e parametri?

Inoltre, quali sono alcuni degli alias delle parole sopra che sono utilizzate in modo intercambiabile.

Grazie

risposta

12

Usiamo l'esempio di classificare il sesso di una persona. La tua comprensione della lezione è corretta! Data un'osservazione di input, il nostro classificatore Naive Bayes dovrebbe produrre una categoria. La classe è quella categoria.

: caratteristiche in un classificatore Naive Bayes o qualsiasi algoritmo di classificazione ML generale, sono i punti dati che scegliamo per definire il nostro input. Per l'esempio di una persona, non è possibile inserire tutti i punti dati su una persona; al contrario, selezioniamo alcune funzioni per definire una persona (ad esempio "Altezza", "Peso" e "Dimensione del piede"). In particolare, in un Naive Bayes Classifier, l'ipotesi chiave che facciamo è che queste funzionalità siano indipendenti (non si influenzano a vicenda): l'altezza di una persona non influisce sul peso non influenza la dimensione del piede. Questa assunzione può essere o non essere vera, ma per un Naive Bayes, assumiamo che sia vero. Nel caso particolare del tuo esempio in cui l'input è solo il nome, le caratteristiche potrebbero essere la frequenza di lettere, il numero di vocali, la lunghezza del nome o il suffisso/prefissi.

Parametri: I parametri in Naive Bayes sono le stime della vera distribuzione di qualsiasi cosa stiamo cercando di classificare. Ad esempio, potremmo dire che circa il 50% delle persone è di sesso maschile, e la distribuzione dell'altezza maschile è una distribuzione gaussiana con media 5 '7 "e deviazione standard 3". I parametri sarebbero la stima del 50%, la stima media di 5 '7 "e la stima di deviazione standard di 3".

Alias ​​: le funzionalità sono anche denominate attributi. Non sono a conoscenza di sostituzioni comuni per "parametri".

Spero sia stato utile!

+0

Grazie per la risposta sorprendente. Aveva una leggera idea della risposta, ma ha comunque confermato. Grazie. –

+1

Prego, felice che sia stato utile! – txizzle

6

@txizzle ha spiegato bene il caso di Naive Bayes. In un senso più generale:

Classe: La categoria di uscita dei dati. Puoi anche chiamare queste categorie. Le etichette dei tuoi dati rimandano a una delle classi (se si tratta di un problema di classificazione, ovviamente).

Caratteristiche: Le caratteristiche che definiscono il tuo problema. Questi sono anche chiamati attributi.

Parametri: Le variabili che l'algoritmo sta cercando di ottimizzare per creare un modello accurato.

Ad esempio, diciamo che stai cercando di decidere se ammettere uno studente a scuola GARD o meno in base a vari fattori come il suo GPA undergrad, i punteggi dei test, i punteggi su raccomandazioni, progetti ecc. In questo caso , i fattori sopra menzionati sono le tue caratteristiche/attributi, sia che lo studente sia ammesso o meno diventi le tue 2 classi, sia i numeri che decidono come queste caratteristiche si combinano per far diventare i tuoi risultati i tuoi parametri. Ciò che i parametri effettivamente rappresentano dipende dal tuo algoritmo. Per una rete neurale, sono i pesi sui collegamenti sinaptici. Allo stesso modo, per un problema di regressione, i parametri sono i coefficienti delle caratteristiche quando sono combinati.

1

prendere una semplice classificazione lineare problem

y = {0 se 5x-3> = 0 altrimenti 1}

qui y è di classe, x è caratteristica, 5,3 sono parametri.

Problemi correlati