Funkcja lm
możemy być użyta również do “nieliniowych” modeli. Warto zwrócić uwagę, że symbol +
był używany w niestandardowym kontekście.
Symbol | Przykład | Znaczenie |
---|---|---|
+ |
+X |
dodawanie zmiennej |
- |
-X |
usunięcie zmiennej |
: |
X:Y |
dodanie interakcji pomiędzy zmiennymi |
* |
X*Y |
dodanie obu zmiennych i interakcji pomiędzy zmiennymi |
| |
X|Y |
warunkowość: dodanie zmiennej \(X\) pod warunkiem \(Y\) |
^ |
(X + Y + Z)^3 |
dodanie wszystkich zmiennych i interakcji między nimi |
I |
I(X*Y) |
dosłownie jak jest: dodanie np. mnożenia dwóch zmiennych |
1 |
X-1 |
usunięcie stałej (współczynnika wolnego) z modelu |
log |
log(x) |
użycie logarytmu zmiennej (nie mylić z regresją logistyczną!) |
Przykład:
Y ~ X + Z + W + X:Z + X:W + Z:W + X:Z:W
Y ~ X * Z * W
Y ~ (X + Z + W)^3
reprezentują tą samą zmienną
\[Y_i=\beta_0 + \beta_1 X_i+\beta_2 Z_i +\beta_3 W_i+\beta_4X_iZ_i +\beta_5 X_iW_i+\beta_6 Z_iW_i+\beta_7X_iZ_iW_i+\varepsilon\]
Jeśli mamy regresję “wielomianową” \[ y = \beta_0 + \beta_1X+\beta_2X^2+\beta_3X^3 + \varepsilon ,\] możemy np. dla stopnia trzeciego wyrażyć ją następująco na dwa sposoby:
y ~ poly(x,3, raw=TRUE)
y ~ x + I(x^2) + I(x^3)
Uwaga: w przypadku modelu z funkcją eksponencjalną w razie problemów można z własności: \[y = e^{a+bx} \quad \Longleftrightarrow\ \quad log(y) = a + bx.\]
Ćwiczenie:
marketing
jak wcześniej. Niechy<-marketing$sales
x<-marketing$youtube
Sprawdź podsumowania modeli:
y ~ poly(x,3, raw=TRUE)
y ~ x + I(x^2) + I(x^3)
y ~ poly(x,3)
marketing
jak wcześniej. Niechy<-marketing$sales
x<-marketing$youtube
x2<-marketing$facebook
z<-x*x2
Sprawdź podsumowania modeli:
y ~ x:x2
y ~ x*x2
y ~ z