Ho alcuni dati di calcio annuali che vorrei testare per vedere se determinate metriche di squadra sono ripetibili nel prossimo anno. I miei dati sono in un data.frame e simile a questa:Scatterplot di correlazione dei dati anno su anno in R utilizzando ggplot2
y2003 y2004 y2005
Team 1 51.95455 51.00000 53.59091
Team 2 54.18182 56.31818 49.09091
Team 3 48.68182 46.86364 49.22727
Team 4 50.86364 47.68182 48.72727
Quello che voglio essere in grado di fare è dispersione questo con "Anno n" sulla xe "n Anno + 1" sulla l'asse y. Quindi per esempio 2003 vs 2004, 2004 vs 2005, 2005 vs 2006 ecc. Tutti sulla stessa trama.
Vorrei quindi essere in grado di tracciare una linea di miglior adattamento per vedere quanto sia forte la correlazione, se sia ripetibile o meno.
Qual è il modo migliore per farlo in R con ggplot2? Posso ottenere la trama iniziale con:
p=ggplot(df,aes(y2003,y2004))
p + geom_point()
Quindi devo semplicemente aggiungerli tutti manualmente? Esiste una funzione integrata per questo genere di cose? E se li aggiungo tutti uno per uno, come posso ottenere il miglior adattamento?