Quando si utilizza normalmente factor
per le variabili di codifica colore/dimensione in ggplot2 in R? Esempio:quando usare factor() quando si stampa con ggplot in R?
ggplot(mtcars) + geom_point(aes(x=mpg, y=drat, colour=gear))
versus:
ggplot(mtcars) + geom_point(aes(x=mpg, y=drat, colour=factor(gear)))
è la regola generale di utilizzare factor
quando la variabile viene utilizzato per determinare la forma/taglia/colore è discreto, e non continuo? O c'è un altro uso di factor
in questo contesto? Sembra che il primo comando possa essere eseguito come il secondo con la legenda corretta, anche senza factor
. Grazie.
Edit: ottengo questo quando uso il colour=gear
:
Sì, dipende da ciò che si desidera mostrare. Se sei incline a trasmettere un senso di gradazione, usi una variabile continua, ma se vuoi mostrare i gruppi, la scommessa più sicura è quella di convertire in fattore. –
Utilizzare 'factor' quando si hanno variabili codificate numericamente che rappresentano di fatto categorie. – Andrie