Sono completamente perplesso su un problema e vorrei qualche consiglio. Raccolgo set casuali di 8 numeri dal set da 1 a 8 (ad esempio, 5,6,8,1,3,4,2,7) e proviamo a utilizzare questi numeri come sottoinsiemi di numeri sequenziali in base all'ordine Sembrano.Bucketing in R o SQL
Per l'esempio precedente, il primo segmento inizierà con un 5, quindi il 6 verrà aggiunto. Al raggiungimento dell'8 un nuovo secchio sarebbe stato avviato. Ogni volta che arriviamo a un numero che appartiene a un bucket esistente (ad esempio, quando raggiungiamo 2
, può essere aggiunto al bucket 1
), lo aggiungiamo lì. In questo esempio, dopo tutti gli 8 numeri arriveremo a:
5,6,7
8
1,2
3,4
Per un totale di 4 benne.
Non sono realmente interessato al contenuto dei bucket, voglio solo contare quanti bucket ci sono per un dato insieme casuale di 8 cifre. Ho in programma di eseguire il looping di un set di 1000 di queste sequenze a 8 cifre.
Non capisco la logica dietro questo. 7 non è apparso nella prima sequenza. Né 2 nel terzo. –
Quindi l'idea è che stiamo attraversando cifre per cifra, creando un nuovo bucket se un numero non è in sequenza quando un bucket precedente. Quindi 5 crea il primo, 6 va in esso. 8 Crea il secondo secchio. 1 crea il terzo. 3 crea il 4 °. Quindi 4,2 e 7 vengono aggiunti ai bucket già esistenti (perché sono in sequenza). Strano problema, sì, ma un po 'interessante. –
Così tipo di creazione di pile di solitari ... – MichaelChirico