Kowariancja

Kowariancja
Polecane artykuły


Kowariancja jest to wielkość charakteryzująca wspólne zmiany dwóch zmiennych X i Y. Jest oczekiwana wartością iloczynu odchyleń wartości zmiennych X i Y od ich wartości oczekiwanych.
Zakładając, że X i Y to para zmiennych losowych o rozkładach normalnych i średnich \(\mu_{x}\) i \(\mu_{y}\) oraz standardowych odchyleniach \(\sigma_{x}\) i \(\sigma_{y}\). Kowariancję dwóch zmiennych X i Y liczymy ze wzoru\[cov (X, Y) = E{[X-E (X)][Y-E (Y)]}\] co można też przedstawić w postaci\[cov (X, Y) = E (XY)-E (X)E (Y)\]

Własności kowariancji

  1. Kowariancja to parametr mianowany, czyli miano jest iloczynem jednostek obu zmiennych.
  2. Może on przyjmować dodatnie oraz ujemne wartości\[-D (X) ⋅ D (Y) \le C (X, Y) \le D (X) ⋅ D (Y)\]
  3. Kiedy jedna zmienna jest funkcją liniową drugiej zmiennej to kowariancja osiąga skrajne wartości\[X = a_{x|y} + b_{x|y} Y \longleftrightarrow C (X, Y) = \pm D (X) ⋅ D (Y) oraz Y = a_{y|x} + b_{y|x} X \longleftrightarrow C (X, Y) = \pm D (X) ⋅ D (Y)\]
  4. Parametr równa się 0, jeśli zmienne X i Y są niezależnie stochastyczne.
  5. Jest on również symetryczny\[C (X, Y) = C (Y, X)\]
  6. Zachodzi równość między kowariancją zmiennej X oraz wariancją zmiennej X\[ C (X, X) = D^2 (X)\]
  7. Kowariancja liniowych funkcji zmiennych X i Y równa się\[C[(s+tX), (c+dY)] = t ⋅ d ⋅ C (X, Y)\]

(G. Lissowski, J. Haman, M. Jasiński 2011, s. 26-27)

Opisy wartości kowariancji

  • Dodatnia wartość kowariancji cov (X, Y) > 0 oznacza, że przy wzroście wartości X wartości Y na ogół także rosną, przy czym relacja ta ma charakter symetryczny względem zmiennych. Mówimy w takim przypadku, że zmienne X i Y są skorelowane dodatnio (pozytywnie).
  • Ujemna wartość kowariancji cov (X, Y) < 0 będzie zatem oznaczała, że przy wzroście X wartości Y na ogół maleją. W takim przypadku powiemy, że zmienne X i Y są skorelowane ujemnie (negatywnie).
  • Może również wystąpić sytuacja, że przy wzroście X poziom wartości Y, generalnie biorąc nie zmienia się. Wtedy cov (X, Y) = 0 i mówimy, że zmienne X i Y są nieskorelowane.

Łatwo wykazać, że dla zmiennych niezależnych kowariancja przyjmuje wartość 0, czyli zmienne niezależne są także nieskorelowane. Twierdzenie odwrotne do powyższego nie jest prawdziwe, czyli zmienne, dla których cov (X, Y) = 0, mogą być zależne.

Wady

Wadą kowariancji jako charakterystyki zależności jest to, że jej wartość zależy od jednostek pomiaru obu cech. W konsekwencji kowariancja nie może określać stopnia intensywności (siły) zależności. Służy do pomiaru korelacji między zmiennymi X i Y. Jeżeli podzielimy kowariancję przez standardowe odchylenia obu zmiennych, to otrzymamy miarę, która przyjmuje wartości z przedziału od -1 do 1, i informuje nas o sile liniowego związku między zmiennymi. Tą miarą jest właśnie współczynnik korelacji (w populacji).
Współczynnik korelacji w populacji:
\(\rho = \frac {cov (X, Y)} {\sigma x \sigma y}\)

Bibliografia

Autor: Anna Rycerska, Andrzej Juraszek