2011-10-05 12 views
12

Sto imparando l'algoritmo K-medoids quindi mi dispiace se faccio domande inappropriate. Come so, l'algoritmo K-medoids implementa un cluster K-means ma usa punti dati reali per essere centroide invece di mezzi calcolati matematicamente.Dove trovare un affidabile software/strumento open source K-medoid (Not k-means)?

Come ho cercato su Google online, ho trovato molti strumenti k-means come GenePattern, geWengh, ecc. Ma non quelli dei k-medoidi. Alcuni amici carini mi hanno mostrato che in Matlab ce n'è anche uno scritto da qualche utente. Tuttavia, temo che lo strumento personale implementato possa ancora avere alcuni bug o limitazioni. Quindi, mi chiedo se ci sono alcuni software/strumenti open source affidabili ampiamente usati che usano punti dati reali come centroidi per cluster. Devo trovare le informazioni sui centroidi effettivi, quindi non è sufficiente restituire i risultati del clustering. Preferisco quelli online, ma se non è così, posso installarlo sulla mia macchina locale. La ringrazio molto,

risposta

10
  1. A implmentation k-medoid in C è disponibile in C Clustering Library (source, Manual). (Si noti che Cluster 3.0 è un'estensione di questa libreria, e non può fornire k-medoids)

    Dal manuale:

    Nel Clustering libreria C, tre algoritmi di partizionamento sono disponibili: • k-means • k-mediane di clustering • k-medoids raggruppamento

  2. k-medoids in mlpy, Machine Learning library in Python

  3. k-medoids in Matlab

  4. k-medoids in Java

  5. k-medoids in C++

+1

Grazie per la risposta. Come so, k-mediani è diverso dai k-medoidi. Inoltre, lo strumento Cluster 3.0 non restituisce i centroidi come punti di dati originali. Se ho torto, per favore correggimi. A proposito di altri programmi e codici, sono carini. Tuttavia, dal momento che sono scritti da singole persone non da laboratori come GenePattern o Cluster3.0, sono un po 'preoccupato per la loro limitazione. Ad ogni modo, se non c'è altra soluzione, cercherò di usare il software di individui. – Cassie

+0

@Cassie, The C Clustering Library è un prequel di Cluster 3.0 e viene fornito dagli stessi autori nella stessa pagina. * k-medoids * (e k-median) è fornito lì. Inoltre, * mlpy * non è scritto da un individuo. – cyborg

+0

Il cluster della libreria R fornisce sia k-means che k-medoid. – Riccardo

2

Software:

  • ELKI include diverse varianti di k-means, tra cui K-medoids e PAM.
  • GNU R include nelle varianti del pacchetto "flexclust" di k-means e nel pacchetto "cluster".
  • Gap Una libreria embrional open source su clustering basato sulla distanza.

Fonte: http://en.wikipedia.org/wiki/K-medoids