Come scritto sulla this pagina:
valutazione Il modo Weka valuta i raggruppamenti dipende dalla modalità cluster selezionato. Sono disponibili quattro diverse modalità cluster (come pulsanti nel pannello Modalità cluster):
Use training set
(impostazione predefinita). Dopo aver generato il clustering Weka classifica le istanze di addestramento in cluster in base alla rappresentazione del cluster e calcola la percentuale di istanze che cadono in ciascun cluster. Ad esempio, il clustering precedente prodotto da k-means mostra il 43% (6 istanze) nel cluster 0 e il 57% (8 istanze) nel cluster 1.
- In
Supplied test set
o Percentage split
Weka può valutare i clustering su dati di test separati se il cluster la rappresentazione è probabilistica (es. per EM).
Classes to clusters evaluation
. In questa modalità, Weka ignora prima l'attributo class e genera il clustering. Quindi durante la fase di test assegna le classi ai cluster, in base al valore di maggioranza dell'attributo di classe all'interno di ciascun cluster. Quindi calcola l'errore di classificazione, basato su questo compito e mostra anche la matrice di confusione corrispondente. Un esempio di questo per k-means è mostrato sotto.
Weka è praticamente inesistente quando si parla di clustering. Se sei interessato al clustering (che è un po 'più complicato della classificazione), cerca alternative. Alcune indicazioni sulla valutazione: coppia conteggio di f-measure, Adjusted Rand Index (ARI), indice di Fowlkes-Mallows, indice di Jaccard, misure BCubed ecc. - Non penso che Weka abbia qualcuno di questi. –