Kowariancja

Z Encyklopedia Zarządzania

Kowariancja jest to wielkość charakteryzująca wspólne zmiany dwóch zmiennych X i Y. Jest oczekiwana wartością iloczynu odchyleń wartości zmiennych X i Y od ich wartości oczekiwanych. Zakładając, że X i Y to para zmiennych losowych o rozkładach normalnych i średnich i oraz standardowych odchyleniach i . Kowariancję dwóch zmiennych X i Y liczymy ze wzoru:

co można też przedstawić w postaci:

Własności kowariancji

  1. Kowariancja to parametr mianowany, czyli miano jest iloczynem jednostek obu zmiennych.
  2. Może on przyjmować dodatnie oraz ujemne wartości:

  1. Kiedy jedna zmienna jest funkcją liniową drugiej zmiennej to kowariancja osiąga skrajne wartości:

  1. Parametr równa się 0, jeśli zmienne X i Y są niezależnie stochastyczne.
  2. Jest on również symetryczny:

  1. Zachodzi równość między kowariancją zmiennej X oraz wariancją zmiennej X:

  1. Kowariancja liniowych funkcji zmiennych X i Y równa się:

(G. Lissowski, J. Haman, M. Jasiński 2011, s. 26-27)

Opisy wartości kowariancji

  • Dodatnia wartość kowariancji cov (X, Y) > 0 oznacza, że przy wzroście wartości X wartości Y na ogół także rosną, przy czym relacja ta ma charakter symetryczny względem zmiennych. Mówimy w takim przypadku, że zmienne X i Y są skorelowane dodatnio (pozytywnie).
  • Ujemna wartość kowariancji cov (X, Y) < 0 będzie zatem oznaczała, że przy wzroście X wartości Y na ogół maleją. W takim przypadku powiemy, że zmienne X i Y są skorelowane ujemnie (negatywnie).
  • Może również wystąpić sytuacja, że przy wzroście X poziom wartości Y, generalnie biorąc nie zmienia się. Wtedy cov (X, Y) = 0 i mówimy, że zmienne X i Y są nieskorelowane.

Łatwo wykazać, że dla zmiennych niezależnych kowariancja przyjmuje wartość 0, czyli zmienne niezależne są także nieskorelowane. Twierdzenie odwrotne do powyższego nie jest prawdziwe, czyli zmienne, dla których cov (X, Y) = 0, mogą być zależne.

Wady

Wadą kowariancji jako charakterystyki zależności jest to, że jej wartość zależy od jednostek pomiaru obu cech. W konsekwencji kowariancja nie może określać stopnia intensywności (siły) zależności. Służy do pomiaru korelacji między zmiennymi X i Y. Jeżeli podzielimy kowariancję przez standardowe odchylenia obu zmiennych, to otrzymamy miarę, która przyjmuje wartości z przedziału od - 1 do 1, i informuje nas o sile liniowego związku między zmiennymi. Tą miarą jest właśnie współczynnik korelacji (w populacji).

Współczynnik korelacji w populacji:

Interpretacja kowariancji

Dodatnia kowariancja między dwiema zmiennymi wskazuje na to, że zmienne te mają tendencję do poruszania się w tym samym kierunku. Innymi słowy, gdy jedna zmienna rośnie, druga zmienna również rośnie, a gdy jedna zmienna maleje, druga zmienna również maleje. Na przykład, dodatnia kowariancja między dochodem a wydatkami oznacza, że osoby z wyższym dochodem mają tendencję do wydawania większej ilości pieniędzy.

Ujemna kowariancja między dwiema zmiennymi wskazuje na to, że zmienne te mają tendencję do poruszania się w przeciwnych kierunkach. Innymi słowy, gdy jedna zmienna rośnie, druga zmienna maleje, a gdy jedna zmienna maleje, druga zmienna rośnie. Na przykład, ujemna kowariancja między ceną produktu a ilością sprzedanych egzemplarzy oznacza, że gdy cena wzrasta, sprzedaż spada, a gdy cena maleje, sprzedaż rośnie.

Kowariancja równa zero między dwiema zmiennymi oznacza, że nie ma liniowej zależności między tymi zmiennymi. Innymi słowy, zmienne te nie poruszają się w żadnym określonym kierunku. Jednakże, brak kowariancji nie oznacza, że nie ma żadnej zależności między zmiennymi. Mogą istnieć inne rodzaje zależności, takie jak zależność nieliniowa.

Dlaczego kowariancja nie jest miarą siły zależności między zmiennymi?

Kowariancja nie jest miarą siły zależności między zmiennymi, ponieważ jej wartość zależy od jednostek pomiarowych zmiennych. Innymi słowy, jednostki pomiarowe wpływają na wielkość kowariancji, co utrudnia porównywanie kowariancji między różnymi zmiennymi. Dodatkowo, kowariancja nie uwzględnia kształtu rozkładu danych i może być wrażliwa na obserwacje odstające.

Interpretacja kowariancji jako miary zależności między zmiennymi ma kilka ograniczeń. Po pierwsze, kowariancja mierzy jedynie liniową zależność między zmiennymi, co oznacza, że nie uwzględnia innych rodzajów zależności, takich jak zależność nieliniowa. Po drugie, kowariancja jest wrażliwa na skale pomiarowe zmiennych, co utrudnia porównywanie kowariancji między różnymi zmiennymi. Ponadto, kowariancja nie uwzględnia kształtu rozkładu danych i może być zaburzona przez obserwacje odstające.

Zastosowania kowariancji

Kowariancja jest używana w wielu obszarach do analizy danych. Jest stosowana w statystyce, ekonomii, finansach, naukach społecznych i wielu innych dziedzinach. Dzięki kowariancji można badać zależności między zmiennymi i analizować wzorce zachowań.

W ekonomii kowariancja jest używana do analizy zależności między różnymi zmiennymi ekonomicznymi. Na przykład, kowariancja może być użyta do badania związku między dochodem a wydatkami, ceną a popytem, inflacją a bezrobociem itp. Dzięki temu analiza kowariancji pozwala ekonomistom lepiej zrozumieć strukturę gospodarki i przewidywać przyszłe zmiany.

W finansach kowariancja jest używana do analizy ryzyka i zależności między różnymi instrumentami finansowymi. Na przykład, kowariancja może być użyta do badania związku między dwoma akcjami w portfelu inwestycyjnym, między stopą zwrotu a zmiennością na rynku, między stopą procentową a wartością obligacji itp. Dzięki temu analiza kowariancji pozwala inwestorom ocenić ryzyko i zyskowność swoich inwestycji.

W naukach społecznych kowariancja jest używana do badania zależności między różnymi zmiennymi społecznymi. Na przykład, kowariancja może być użyta do badania związku między edukacją a dochodem, między poziomem zadowolenia a jakością życia, między poziomem przestępczości a społecznymi czynnikami ryzyka itp. Dzięki temu analiza kowariancji pozwala naukowcom lepiej zrozumieć społeczne i psychologiczne determinanty różnych zjawisk społecznych.

Stosowanie kowariancji w analizie danych ma wiele korzyści. Po pierwsze, kowariancja umożliwia badanie zależności między zmiennymi i odkrywanie wzorców zachowań. Po drugie, kowariancja może być używana do oceny ryzyka i zyskowności inwestycji. Ponadto, kowariancja może służyć jako podstawa do dalszych analiz statystycznych i modelowania.

Jednakże, stosowanie kowariancji ma także pewne ograniczenia. Po pierwsze, kowariancja mierzy jedynie liniową zależność między zmiennymi, co może nie uwzględniać innych rodzajów zależności. Po drugie, kowariancja jest wrażliwa na skale pomiarowe zmiennych, co utrudnia porównywanie kowariancji między różnymi zmiennymi. Ponadto, kowariancja nie uwzględnia kształtu rozkładu danych i może być zaburzona przez obserwacje odstające.

Alternatywne miary zależności

Oprócz kowariancji istnieją inne miary zależności, które mogą być używane w analizie danych. Jednym z takich przykładów jest współczynnik korelacji Pearsona, który mierzy siłę i kierunek liniowej zależności między zmiennymi. Inne przykłady to współczynnik rangowy Spearmana, miara zależności wzajemnej i wiele innych.

Współczynnik korelacji Pearsona jest miarą siły i kierunku liniowej zależności między zmiennymi. Przyjmuje wartości od - 1 do 1, gdzie wartość -1 oznacza doskonałą ujemną zależność, wartość 1 oznacza doskonałą dodatnią zależność, a wartość 0 oznacza brak zależności. Im bliżej wartość współczynnika korelacji Pearsona jest do 1 lub - 1, tym silniejsza jest zależność między zmiennymi.

Współczynnik rangowy Spearmana jest miarą zależności między zmiennymi, która nie wymaga liniowej zależności. Zamiast tego, opiera się na porządku danych. Może być używany do badania zależności między zmiennymi, które mają nieliniowy charakter. Przykłady zastosowania współczynnika rangowego Spearmana to badanie zależności między ocenami studentów a ich wynikami egzaminacyjnymi, między rankingiem przedsiębiorstw a ich zyskami, itp.

Miara zależności wzajemnej jest miarą, która bada ogólną zależność między zmiennymi, niezależnie od liniowości. Może być używana do analizy zależności między zmiennymi w kontekście sieci społecznych, analizy tekstu, analizy danych genetycznych i wielu innych dziedzin. Przykłady zastosowania miary zależności wzajemnej to badanie powiązań między użytkownikami mediów społecznościowych, analiza tematyczna tekstów, analiza genetyczna związku między genami a cechami fenotypowymi, itp.

Różnice między kowariancją a innymi miarami zależności wynikają z różnych założeń i właściwości tych miar. Na przykład, kowariancja mierzy tylko liniową zależność między zmiennymi, podczas gdy inne miary, takie jak współczynnik korelacji Pearsona, mogą uwzględniać także zależność nieliniową. Ponadto, kowariancja jest wrażliwa na skale pomiarowe zmiennych, podczas gdy inne miary mogą być bardziej skalowalne i elastyczne. Wreszcie, różnice wynikają również z interpretacji i zastosowań tych miar w praktyce analizy danych.


Kowariancjaartykuły polecane
WariancjaŚredniaEstymator obciążonyWspółczynnik korelacji rang SpearmanaWartość oczekiwanaDominantaKurtozaMetody statystyczneEstymacja

Bibliografia


Autor: Anna Rycerska, Andrzej Juraszek