di recente sono venuto a studiare il clustering nel data mining e ho studiato il clustering sequenziale e il clustering gerarchico e k-means.domande sui metodi di cluster
Ho letto anche una dichiarazione che distingue k-means dalle altre due tecniche di clustering, dicendo che k-means non è molto bravo nel trattare attributi nominali, ma il testo non ha spiegato questo punto. l'unica differenza che posso vedere è che per K-means, sapremo in anticipo che avremo bisogno esattamente dei cluster K, mentre non sappiamo quanti cluster abbiamo bisogno per altri due metodi di clustering.
Quindi qualcuno potrebbe darmi qualche idea sul motivo per cui tale affermazione esiste, cioè k-means ha questo problema quando si tratta di esempi di attributi nominali e c'è un modo per superare questo?
Grazie in anticipo.
Si noti che solitamente si prende il valore di maggioranza della variabile discreta quando si calcolano i centroidi del cluster. – Amro