Ho una grande quantità di lat/lon temporale.clustering per traiettorie
Sto cercando di trovare k-cluster di traiettorie da questi dati. Qual è l'approccio migliore per questo?
Grazie.
Edit:
Come devo generare le caratteristiche per i miei dati (lat/lon + tempo) al fine di utilizzare Kmeans/clustering gerarchico?
Edit:
Speriamo che questo renderà più chiaro
Ecco un esempio di come il mio sguardo di dati:
Trajectory 1: lat1,lon1 at time1 lat2,lon2 at time2 ... lat55,lon55 at time55
Trajectory 2: lat343,lon343 at time343 lat344,lon344 at time344 ... lat376,lon376 at time376
E così via (altro paio di traiettorie).
Quindi dire che ho 200 di queste traiettorie, voglio raggrupparle in 2 gruppi. Come dovrei avvicinarmi a questo?
Devo usare kmeans/HAC per questo o dovrei guardare un altro metodo?
Edit:
L'obiettivo di questo è quello di classificare le traiettorie in cluster k che rappresentano k diverse direzioni delle traiettorie.
Semplicemente, sto solo cercando di raggruppare le traiettorie in gruppi di direzioni diverse. Non sono preoccupato per le loro somiglianze .
così dicono alla fine voglio trovare qualcosa di simile:
Direction 1: Trajectory 4 Trajectory 5 Trajectory 7
Direction 2: Trajectory 44 Trajectory 2 Trajectory 27
...
Direction 10: Trajectory 17 Trajectory 8
Nota: Le forme delle traiettorie sono per lo più linee (non lineare linee), alcuni sono in loop.
Nota: lat/lon sono super locali in una regione, quindi è possibile utilizzare un'approssimazione di terra piatta.
Le istruzioni devono essere molto approssimative. Come faccio a calcolare la somiglianza tra le traiettorie per raggrupparle per raggiungere questo obiettivo?
Edit:
Ecco un esempio (al meglio delle mie capacità):
voglio separare le traiettorie nelle direzioni in quanto tali.
Non sto ottenendo il tuo punto qui esattamente .. è quello che stai chiedendo è l'estrazione di funzionalità? se è così, allora non ha nulla a che fare con il clustering. –
No, non chiedo informazioni sull'estrazione delle funzionalità. Sto chiedendo come raggruppare le traiettorie date lat/lon + time per ogni lat/lon. Dite che conosco il numero di cluster da 2, come faccio a raggruppare le traiettorie in 2 cluster? Non posso fare qualcosa di ingenuo come usare lat/lon e sottrarre l'inizio di lat/lon. – kietdlam
OK, non sono sicuro al 100% qui perché il caso non è chiaro per me (comunque è difficile descrivere un caso di DM entro un paio di righe). ma hai provato k-means per quelle tre dimensioni che hai menzionato (lat/lon + time). distanza euclidea ti aiuterebbe a elaborare i k-mezzi con 'centroidi' e tutto il resto .. Sono più vicino al tuo punto ora? –