Ho un algoritmo in esecuzione su un set di oggetti. Questo algoritmo produce un punteggio che determina le differenze tra gli elementi nel set.Valori di raggruppamento in base alla loro vicinanza in python (apprendimento macchina?)
L'output ordinato è qualcosa di simile:
[1,1,5,6,1,5,10,22,23,23,50,51,51,52,100,112,130,500,512,600,12000,12230]
Se si stabiliscono questi valori in giù su un foglio di calcolo si vede che essi costituiscono gruppi
[1,1,5,6,1,5] [10,22,23,23] [50,51, 51,52] [100,112,130] [500,512,600] [12000,12230]
C'è un modo per ottenere questi raggruppamenti in modo programmatico?
Forse un algoritmo di clustering che utilizza una libreria di apprendimento automatico? O sto pensando troppo a questo?
Ho guardato scikit ma i loro esempi sono troppo avanzate per il mio problema ...
una funzione kmeans2 aggiornata (in scipy.cluster.vq) emette ora sia centroide ed etichetta, ad esempio 'kclust, label = kmeans (m, 5)' – Sean
Ciao, Il codice non funziona. Errore in prima linea per ovvi motivi. Anche l'ultima riga produce un errore, 'cluster_indices' non definito. Puoi aiutarci per far funzionare questo codice? – gprakhar
@gprakhar Usa 'cluster_indices = kclust [0] [:, 0]'. – joost