Esistono diversi metodi statistici per la riduzione di un set di dati di grandi dimensioni in un dataset più piccolo e più facile da visualizzare. Non è chiaro dalla tua domanda quale statistica riassuntiva desideri. Ho appena pensato che tu voglia vedere come cambia il tasso di cambio in funzione del tempo, ma forse sei interessato a quanto spesso il tasso di cambio supera un certo valore, o qualche altra statistica che non sto considerando.
Sintetizzando un andamento nel tempo
Ecco un esempio utilizzando il metodo lowess in R (dalla documentazione sul scatter plot smoothing): controlli f
> library(graphics)
# print out the first 10 rows of the cars dataset
> cars[1:10,]
speed dist
1 4 2
2 4 10
3 7 4
4 7 22
5 8 16
6 9 10
7 10 18
8 10 26
9 10 34
10 11 17
# plot the original data
> plot(cars, main = "lowess(cars)")
# fit a loess-smoothed line to the points
> lines(lowess(cars), col = 2)
# plot a finger-grained loess-smoothed line to the points
> lines(lowess(cars, f=.2), col = 3)
Il parametro quanto strettamente la regressione adatta a i tuoi dati. Usa un po 'di attenzione con questo, perché desideri qualcosa che si adatti esattamente ai tuoi dati senza sovraffollamento.Piuttosto che velocità e distanza, puoi tracciare il tasso di cambio in funzione del tempo.
È anche semplice accedere ai risultati del livellamento. Ecco come fare:
> data = lowess(cars$speed, cars$dist)
> data
$x
[1] 4 4 7 7 8 9 10 10 10 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 16 16 17 17 17 18 18 18 18 19 19
[38] 19 20 20 20 20 20 22 23 24 24 24 24 25
$y
[1] 4.965459 4.965459 13.124495 13.124495 15.858633 18.579691 21.280313 21.280313 21.280313 24.129277 24.129277
[12] 27.119549 27.119549 27.119549 27.119549 30.027276 30.027276 30.027276 30.027276 32.962506 32.962506 32.962506
[23] 32.962506 36.757728 36.757728 36.757728 40.435075 40.435075 43.463492 43.463492 43.463492 46.885479 46.885479
[34] 46.885479 46.885479 50.793152 50.793152 50.793152 56.491224 56.491224 56.491224 56.491224 56.491224 67.585824
[45] 73.079695 78.643164 78.643164 78.643164 78.643164 84.328698
L'oggetto dati che torni contiene le voci denominate xey, che corrispondono ai valori X e Y passato alla funzione lowess. In questo caso, xey rappresentano la velocità e dist.
fonte
2010-04-02 21:35:21
puoi chiarire "rappresenta" - intendi solo visivamente o ai fini dell'esecuzione dei calcoli? – Carl
Il risultato finale sarebbe un set di dati di un tipo che potrebbe quindi essere elaborato e grafico – Karl
Suoni come un lavoro per R! – Joel