ho letto il giornale k-means++: The Advantages of Careful Seeding e non ho ben capito l'algoritmo a condizione che:K-means ++ algoritmo
"Sia D (x) denota la distanza più breve da un punto di dati x per il centro più vicino che abbiamo già prescelto.
1a. Scegliere un centro iniziale C1 uniformemente a caso da X.
1b. Scegliere il prossimo centro ci, selezionando ci = x '∈ x con probabilità (D (x')^2)/Sum_of (D (x)^2)
1 c. Ripeti il passaggio 1b fino a quando non abbiamo scelto un totale di k centri.
2-4. Procedere come con lo standard algoritmo k-means "
(meglio guardare l'algoritmo nel link qui sotto)
Soprattutto passaggio 1b. Che cosa si intende per" selezionando ci = x' ∈ X con probabilità (D (x ')^2)/Sumof (D (x)^2). "Significa selezionare l'elemento che ha la maggior proporzione? E come può eseguire tale calcolo può portare a selezionare i centroidi ottimali?
Non so perché questo ha ricevuto un -1. – icedwater