2012-06-04 20 views
6

Che cosa intendiamo quando diciamo che stiamo valutando i cluster in WEKA? Il clustering è un approccio non supervisionato al raggruppamento degli oggetti. Cosa intendiamo quando diciamo che vogliamo valutare il risultato? Inoltre, oltre a questo, quando diciamo che stiamo valutando i cluster in cima ai dati di formazione, cosa significa?Che cos'è la valutazione di un cluster in WEKA?

Grazie Abhishek S

+1

Weka è praticamente inesistente quando si parla di clustering. Se sei interessato al clustering (che è un po 'più complicato della classificazione), cerca alternative. Alcune indicazioni sulla valutazione: coppia conteggio di f-measure, Adjusted Rand Index (ARI), indice di Fowlkes-Mallows, indice di Jaccard, misure BCubed ecc. - Non penso che Weka abbia qualcuno di questi. –

risposta

9

Come scritto sulla this pagina:

valutazione Il modo Weka valuta i raggruppamenti dipende dalla modalità cluster selezionato. Sono disponibili quattro diverse modalità cluster (come pulsanti nel pannello Modalità cluster):

  1. Use training set (impostazione predefinita). Dopo aver generato il clustering Weka classifica le istanze di addestramento in cluster in base alla rappresentazione del cluster e calcola la percentuale di istanze che cadono in ciascun cluster. Ad esempio, il clustering precedente prodotto da k-means mostra il 43% (6 istanze) nel cluster 0 e il 57% (8 istanze) nel cluster 1.
  2. In Supplied test set o Percentage split Weka può valutare i clustering su dati di test separati se il cluster la rappresentazione è probabilistica (es. per EM).
  3. Classes to clusters evaluation. In questa modalità, Weka ignora prima l'attributo class e genera il clustering. Quindi durante la fase di test assegna le classi ai cluster, in base al valore di maggioranza dell'attributo di classe all'interno di ciascun cluster. Quindi calcola l'errore di classificazione, basato su questo compito e mostra anche la matrice di confusione corrispondente. Un esempio di questo per k-means è mostrato sotto.
+0

Grazie per il riferimento e la risposta elaborativa. –

+0

Qualche idea su come funziona la valutazione delle classi di cluster per EM? Pesa le istanze per la loro probabilità di essere nel cluster quando determina il valore di maggioranza? – kylejmcintyre

+0

sicco puoi controllare questa domanda se possibile: http: //stackoverflow.com/questions/32404742/how-to-calculate-clustering-success-pre-assigment-true-classes-are-known – MonsterMMORPG

Problemi correlati