Sembra che ci siano molte informazioni sulla creazione di cluster gerarchici o k-significa. Ma vorrei sapere se esiste una soluzione in R che creerebbe cluster K di dimensioni approssimativamente uguali. V'è un certo roba là fuori a fare questo in altre lingue, ma non sono stato in grado di trovare qualsiasi cosa, da una ricerca su internet che suggerisce come ottenere il risultato in R.In R, esiste un algoritmo per creare cluster approssimativamente uguali alle dimensioni
Un esempio potrebbe essere
set.seed(123)
df <- matrix(rnorm(100*5), nrow=100)
km <- kmeans(df, 10)
print(sapply(1:10, function(n) sum(km$cluster==n)))
che si traduce in
[1] 14 12 4 13 16 6 8 7 13 7
Vorrei idealmente vedere
[1] 10 10 10 10 10 10 10 10 10 10
Tutto quello che posso fare è fare riferimento a http://cran.r-project.org/web/views/Cluster.html per un elenco completo di pacchetti relativi ai cluster. Spero che qualcuno a conoscenza di quel problema abbia un suggerimento particolare per te. – flodel
Credo che il clustering di Ward produrrà cluster di dimensioni più uguali. Prova a giocare con 'hclust (d, method =" ward.D ")' o 'hclust (d, method =" ward.D2 ")' – JasonAizkalns
Grazie flodel e jaysunice. Jaysunice, lo esaminerò domani. – Graeme