R definisce un operatore ~
(tilde) da utilizzare nelle formule. Le formule hanno tutti i tipi di usi, ma forse il più comune è per la regressione:
library(datasets)
lm(myFormula, data=iris)
help("~")
o help("formula")
vi insegnerà più.
@Spacedman ha coperto le nozioni di base. Discutiamo di come funziona.
Innanzitutto, essendo un operatore, si noti che è essenzialmente una scorciatoia ad una funzione (con due argomenti):
> `~`(lhs,rhs)
lhs ~ rhs
> lhs ~ rhs
lhs ~ rhs
Questo può essere utile sapere per uso in es apply
comandi di famiglia.
In secondo luogo, è possibile manipolare la formula come testo:
oldform <- as.character(myFormula) # Get components
myFormula <- as.formula(paste(oldform[2], "Sepal.Length", sep="~"))
In terzo luogo, si può manipolare come lista:
myFormula[[2]]
myFormula[[3]]
Infine, ci sono alcuni trucchi utili con formule (vedi help("formula")
per ulteriori informazioni):
myFormula <- Species ~ .
Ad esempio, la versione precedente è la stessa della versione originale, poiché il punto indica "tutte le variabili non ancora utilizzate". Questo guarda il data.frame che usi nella tua eventuale call del modello, vede quali variabili esistono nel data.frame ma non sono menzionate esplicitamente nella tua formula e sostituisce il punto con quelle variabili mancanti.
Cura di condividere il collegamento all'esercitazione? Sembra interessante. – cheeesus
@cheeesus ... Stavo esaminando il data mining di ebook in R con casi studio ... lì puoi trovare molti altri esempi così interessanti. – Ankita