Ho un set di dati bidimensionale semplice che desidero raggruppare in modo agglomerato (non conoscendo il numero ottimale di cluster da utilizzare). L'unico modo in cui sono riuscito a raggruppare correttamente i miei dati è assegnando alla funzione un valore 'maxclust'.Clustering agglomerato in Matlab
Per semplicità, diciamo che questo è il mio set di dati:
X=[ 1,1;
1,2;
2,2;
2,1;
5,4;
5,5;
6,5;
6,4 ];
Naturalmente, vorrei questi dati per formare 2 gruppi. Capisco che se avessi saputo questo, ho potuto solo dire:
T = clusterdata(X,'maxclust',2);
e per trovare quali punti cadono in ogni cluster potrei dire:
cluster_1 = X(T==1, :);
e
cluster_2 = X(T==2, :);
ma senza sapendo che 2 cluster sarebbero ottimali per questo set di dati, come faccio a raggruppare questi dati?
Grazie
domanda simile: [Quali criteri di arresto per il clustering gerarchico agglomerato vengono utilizzati nella pratica?] (Http://stats.stackexchange.com/q/2597) – Amro
@Amro Collegamenti utili! –