È possibile ottenere gli stessi cluster kmea per ogni esecuzione per un determinato set di dati. Proprio come per un valore casuale, possiamo usare un seme fisso. È possibile fermare la casualità per il clustering?k-means: Stessi cluster per ogni esecuzione
risposta
Sì, chiamare set.seed(foo)
immediatamente prima di eseguire kmeans(....)
darà lo stesso avvio casuale e quindi lo stesso clustering ogni volta. foo
è un seme, ad esempio 42
o qualche altro valore numerico.
Sì. Utilizzare set.seed
per impostare un seme per il valore casuale prima di eseguire il clustering.
Usando l'esempio in kmeans
:
set.seed(1)
x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 2),
matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 2))
colnames(x) <- c("x", "y")
set.seed(2)
XX <- kmeans(x, 2)
set.seed(2)
YY <- kmeans(x, 2)
di prova per l'uguaglianza:
identical(XX, YY)
[1] TRUE
+1 per l'esempio –
Grazie mille per questo, un grande aiuto! Si prega di accettare OP. – slotishtype
- 1. ordinazione punti cluster utilizzando Kmeans e R
- 2. punti cluster dopo il clustering KMeans (scikit learn)
- 3. cv2.kmeans in Python
- 4. Kmeans R (statistiche) vs Kmeans (AMAP)
- 5. Kmeans restituiscono valore R
- 6. Esecuzione di TensorFlow su un cluster Slurm?
- 7. Dump StackTrace per ogni thread in esecuzione
- 8. Ruby: codice di esecuzione per ogni sottoclasse
- 9. problema Esecuzione Spark lavoro su cluster Yarn
- 10. Python KMeans parole di raggruppamento
- 11. Quartz Scheduler: attiva alcuni processi su ogni nodo del cluster e alcuni solo una volta per cluster
- 12. Come calcolare le distanze tra centroidi e matrice di dati (per algoritmo kmeans)
- 13. Registrare ogni esecuzione del metodo
- 14. Stessi numeri casuali ogni volta che eseguo il programma
- 15. Esecuzione di due stessi test con argomenti diversi
- 16. Partizione in classi: jenks vs kmeans
- 17. Scikit-learn: come eseguire KMeans su un array monodimensionale?
- 18. Cluster di cluster Networkx
- 19. Cancella console per ogni esecuzione di Testacular/Karma + Jasmine
- 20. Servizio di accessibilità disabilitato per ogni esecuzione di debug
- 21. valori enum stessi per più colonne
- 22. L'app riceve SIGABRT ad ogni seconda esecuzione
- 23. Esecuzione di un'attività ogni poche ore
- 24. Node.js per() ciclo di ritorno gli stessi valori ad ogni ciclo
- 25. pulsante in esecuzione ogni caricamento della pagina
- 26. C# codice di esecuzione ogni 30 giorni
- 27. specchi multipli Maven per gli stessi repository
- 28. doParallel, cluster vs core
- 29. Cluster Websphere MQ
- 30. Cosa devo fare per ottenere una ricerca indice cluster anziché la scansione indice cluster?
basta aggiungere alla risposta Andrie e Gavin, ho provato che anche quando abbiamo impostato l'argomento 'nstart' in i kmea() più grandi di 1, cioè con più iterazioni di seeding casuale, set.seed() otterrà risultati identici producibili. –