Współczynnik korelacji rang Spearmana

Z Encyklopedia Zarządzania
Wersja do druku nie jest już wspierana i może powodować błędy w wyświetlaniu. Zaktualizuj swoje zakładki i zamiast funkcji strony do druku użyj domyślnej funkcji drukowania w swojej przeglądarce.

Współczynnik korelacji rang Spearmana (Spearman rank correlation coefficient) jest jedną z nieparametrycznych miar monotonicznej zależności statystyczne między zmiennymi losowymi. Współczynnik ten jest wykorzystywany do opisu siły korelacji dwóch cech, wtedy gdy są one mierzalne, badana zbiorowość jest nieliczna oraz mają charakter jakościowy i istnieje możliwość ich uporządkowania. Miarę tę stosuję się również do badania zależności między cechami ilościowymi w przypadku niewielkiej liczby obserwacji.

Zastosowanie i ograniczenia

Współczynnik korelacji rang Spearmana opiera się na założeniu, że istnieje monotoniczna zależność statystyczna między zmiennymi losowymi. Oznacza to, że w miarę wzrostu jednej zmiennej, druga zmienna również rośnie lub maleje. Jednak nie jest wymagane, aby ta zależność była liniowa. Dlatego współczynnik korelacji rang Spearmana jest bardziej elastyczną miarą niż współczynnik korelacji Pearsona, który zakłada liniową zależność.

Współczynnik korelacji rang Spearmana może być stosowany zarówno dla zmiennych ilościowych, jak i jakościowych. W przypadku zmiennych jakościowych, na przykład kategorii lub grup, współczynnik ten umożliwia ocenę zależności między tymi zmiennymi. Przykładowo, możemy zastosować współczynnik korelacji rang Spearmana do oceny zależności między preferencjami konsumenckimi a markami produktów.

Wynik współczynnika korelacji rang Spearmana dla zmiennych jakościowych może być interpretowany jako miara siły związku między badanymi zmiennymi. Im bliżej wartości 1 lub -1 znajduje się współczynnik, tym silniejsza jest zależność między zmiennymi. Interpretacja wyników może być również oparta na testach statystycznych, które pozwalają określić, czy wartości współczynnika są istotne.

Współczynnik korelacji rang Spearmana jest szczególnie przydatny w przypadku niewielkiej liczby obserwacji. W przeciwieństwie do innych miar korelacji, współczynnik ten nie wymaga spełnienia założeń dotyczących normalności rozkładu i nie jest wrażliwy na wartości odstające. Dlatego można go stosować nawet w przypadku małej próby lub danych skategoryzowanych.

Pomimo tych zalet, współczynnik korelacji rang Spearmana ma również pewne ograniczenia. Przede wszystkim, może być trudniejszy do interpretacji niż klasyczny współczynnik korelacji Pearsona. Ponadto, dla bardzo małej liczby obserwacji może być mniej precyzyjny i bardziej podatny na błędy statystyczne.

Przykłady zastosowania współczynnika korelacji rang Spearmana obejmują analizę preferencji klientów, ocenę jakości produktów, badanie zależności między zmiennymi w naukach społecznych oraz ocenę efektywności technik zarządzania. W każdym z tych przypadków, współczynnik korelacji rang Spearmana umożliwia ustalenie, czy zmienna A ma wpływ na zmienną B i jak silny jest ten wpływ.

Obliczenia

Współczynnik korelacji rang Spearmana wyprowadza się ze wzoru na współczynnik korelacji liniowej Bravaisa-Pearsona:

Z tego wzoru możemy wyprowadzić wzór na współczynnik korelacji rang Spearmana:

półczynnik korelacji rang Spearmana wyprowadza się ze wzoru na współczynnik korelacji liniowej Bravaisa-Pearsona:

Etapy

Etapy obliczeń rang Spearmana:

  1. Uporządkowanie zmiennych (malejąco, rosnąco)
  2. Nadanie zmiennym numerów kolejnych liczb naturalnych (rangowanie), odpowiadające ich miejscu w uporządkowaniu (tzn 1,2,.......).

Interpretacja

W przypadku wystąpienia jednakowych wartości realizacji zmiennych, należy przyporządkować im średnią arytmetyczną obliczoną z ich kolejnych numerów.

Współczynnik korelacji rang przyjmuje wartości liczbowe z przedziału [-1;1]. Jednakowe rangi wartości zmiennych badanych świadczą o istnieniu dodatniej między nimi korelacji (X= Y =1), tzn Y rośnie zawsze wtedy gdy X i na odwrót. Numeracja przeciwstawna sugeruje istnienie korelacji ujemnej. Dodatni znak współczynnika świadczy o istnieniu współzależności dodatniej, ujemny świadczy o korelacji ujemnej. Im bardziej współczynnik korelacji jest bliższy jedności, tym zależność korelacyjna jest silniejsza. W przypadku gdy rs= 0 świadczy o braku związku korelacyjnego między badanymi zmiennymi.

Zastosowanie współczynnika korelacji rang Spearmana

Współczynnik korelacji rang Spearmana jest jednym z najważniejszych narzędzi analizy statystycznej, które znajduje zastosowanie w wielu dziedzinach. Jego wszechstronność pozwala na skuteczną analizę danych, które są niskiej jakości, a także na badanie zależności między zmiennymi, niezależnie od ich rozkładu.

Analiza danych niskiej jakości

W przypadku danych niskiej jakości, czyli takich, które zawierają braki, błędy pomiarowe lub nie spełniają założeń statystycznych, współczynnik korelacji rang Spearmana może być bardzo przydatny. Na przykład, jeśli prowadzimy badania ankietowe, gdzie respondenci mogą nieodpowiedzieć na niektóre pytania, możemy użyć tego współczynnika do identyfikacji zależności między zmiennymi, pomijając brakujące wartości.

Interpretacja wyników współczynnika korelacji rang Spearmana jest dość prosta. Wartości tego współczynnika mieszczą się w zakresie od -1 do 1, gdzie -1 oznacza silną ujemną zależność, 0 brak zależności, a 1 silną dodatnią zależność. Im bliżej wartość współczynnika jest -1 lub 1, tym silniejsza jest zależność między zmiennymi.

Zależność a przyczynowość

Ważne jest zrozumienie, że współczynnik korelacji rang Spearmana mierzy jedynie zależność między zmiennymi, a nie przyczynowość. Zależność oznacza, że zmienne poruszają się w podobny sposób, ale niekoniecznie jedna zmienna jest przyczyną drugiej. Przyczynowość natomiast oznacza, że jedna zmienna wpływa bezpośrednio na drugą.

Współczynnik korelacji rang Spearmana jest często stosowany w badaniach naukowych, gdzie nie możemy kontrolować wszystkich czynników wpływających na zmienne. Na przykład, jeśli chcemy zbadać związek między poziomem edukacji a zarobkami, możemy użyć tego współczynnika do oceny siły zależności między tymi zmiennymi.

Zastosowanie w analizie wyników egzaminów

Współczynnik korelacji rang Spearmana może być przydatny w analizie wyników egzaminów. Możemy go użyć do oceny związku między wynikami różnych uczniów w różnych przedmiotach. Dzięki temu możemy zidentyfikować, czy istnieje jakaś ogólna tendencja, czy też wyniki w poszczególnych przedmiotach są niezależne od siebie.

Interpretacja wyników współczynnika korelacji rang Spearmana w analizie wyników egzaminów jest podobna do ogólnej interpretacji. Im bliżej wartość współczynnika jest 1, tym silniejsza jest zależność między wynikami uczniów w różnych przedmiotach.

Odporność na obserwacje odstające i brak normalności rozkładu zmiennych

Jedną z głównych zalet współczynnika korelacji rang Spearmana jest jego odporność na obserwacje odstające oraz brak normalności rozkładu zmiennych. Oznacza to, że możemy go stosować nawet w przypadku, gdy nasze dane nie spełniają założeń dotyczących rozkładu.

Przykładem zastosowania współczynnika korelacji rang Spearmana w przypadku danych medycznych może być badanie związku między wiekiem pacjentów a skutecznością leczenia. W takim przypadku, gdy dane mogą mieć nieliniowy rozkład, współczynnik korelacji rang Spearmana może być bardziej odpowiedni niż klasyczny współczynnik korelacji Pearsona.

Analiza danych medycznych

W analizie danych medycznych współczynnik korelacji rang Spearmana znajduje szerokie zastosowanie. Może być używany do badania zależności między różnymi czynnikami a zdrowiem pacjentów. Na przykład, możemy użyć tego współczynnika do oceny związku między paleniem papierosów a ryzykiem zachorowania na raka płuc.

Interpretacja wyników współczynnika korelacji rang Spearmana w analizie danych medycznych jest podobna do ogólnej interpretacji. Im bliżej wartość współczynnika jest 1, tym silniejsza jest zależność między zmiennymi medycznymi.

Przykład

Wyniki egzaminu z prawa i statystyki 10 studentów kierunku Ekonomia prezentuje poniższa tabelka. Za pomocą współczynnika korelacji rang Spearmana ustala kierunek i siłę korelacji pomiędzy wynikami z obu egzaminów.

Student A B C D E F G H I J
Liczba punktów z prawa 2 8 18 9 12 15 7 5 14 16
Liczba punktów ze statystyki 80 60 85 30 57 72 81 98 65 47

Pierwszym krokiem jest wyznaczenie rang według cechy X (prawo) i cechy Y (statystyka).

Student C J F I E D B G H A ogółem
Rangi według X (prawo) 1 2 3 4 5 6 7 8 9 10 -
Rangi według Y (statystyka) 2 9 5 6 8 10 7 3 1 4 -
Różnica rang -1 -7 -2 -2 -3 -4 0 5 8 6 -
Kwadrat różnicy rang 1 49 4 4 9 16 0 25 64 36 208

Istnieje słaba ujemna zależność pomiędzy wynikami egzaminu z prawa i ze statystyki.

Porównanie współczynnika korelacji rang Spearmana z innymi miarami korelacji

Testy statystyczne w ocenie istotności korelacji

Testy statystyczne są nieodłącznym narzędziem w ocenie istotności korelacji pomiędzy zmiennymi. W przypadku współczynnika korelacji rang Spearmana, można skorzystać z testu rangowego Wilcoxona lub testu permutacyjnego. Przykładowe zastosowania tych testów obejmują analizę zależności między rankingiem produktów a ocenami konsumentów lub badanie związku między rankingiem wyników badań a różnymi zmiennymi niezależnymi.

Interpretacja wyników testów statystycznych pozwala na określenie, czy zależność między zmiennymi jest istotna statystycznie. Jeśli wartość p-wartości jest niższa od ustalonego poziomu istotności (na przykład 0,05), to można stwierdzić, że istnieje istotna korelacja między zmiennymi. W przypadku współczynnika korelacji rang Spearmana, testy statystyczne pozwalają ocenić, czy różnice w rankingach są istotne.

Współczynnik korelacji liniowej Bravaisa-Pearsona

Współczynnik korelacji liniowej Bravaisa-Pearsona jest inną popularną miarą korelacji. Porównując go z współczynnikiem korelacji rang Spearmana, warto zauważyć, że pierwszy z nich mierzy związek liniowy między zmiennymi, podczas gdy drugi opiera się na porównywaniu rang zmiennych. Współczynnik korelacji rang Spearmana jest bardziej odporny na wartości odstające i nieliniowe związki między zmiennymi.

Przykłady zastosowania współczynnika korelacji liniowej Bravaisa-Pearsona obejmują analizę zależności między wiekiem a dochodem, między temperaturą a zużyciem energii lub między czasem nauki a wynikami egzaminacyjnymi. W przypadku zmiennych o normalnym rozkładzie i liniowej zależności, współczynnik korelacji liniowej Bravaisa-Pearsona może być bardziej odpowiedni.

Zalety i ograniczenia współczynnika korelacji rang Spearmana

Odporność na obserwacje odstające i brakujące dane

Współczynnik korelacji rang Spearmana jest wskaźnikiem używanym do mierzenia siły i kierunku związku między dwiema zmiennymi. Jedną z głównych zalet tego współczynnika jest jego odporność na obserwacje odstające. Oznacza to, że pojedyncze skrajne obserwacje nie mają znaczącego wpływu na wynik korelacji, co czyni go bardziej niezawodnym narzędziem do analizy danych.

Współczynnik korelacji rang Spearmana jest również odporny na brakujące dane. W przypadku, gdy niektóre obserwacje nie są dostępne dla jednej lub obu zmiennych, współczynnik ten nadal może być obliczony na podstawie dostępnych danych. Jest to szczególnie przydatne w przypadku analizy danych, w których brakuje pewnych obserwacji.

Jednak istnieją również pewne ograniczenia współczynnika korelacji rang Spearmana. Przede wszystkim, zakłada on liniową zależność między zmiennymi. Oznacza to, że jeśli zależność między zmiennymi jest nieliniowa, współczynnik korelacji rang Spearmana może nie być w stanie jej uwzględnić. W takich przypadkach konieczne może być użycie innych narzędzi statystycznych do analizy danych.

Zastosowanie dla danych porządkowych i ilościowych

Współczynnik korelacji rang Spearmana może być stosowany zarówno do danych porządkowych, jak i ilościowych. Jest to kolejna zaleta tego wskaźnika, ponieważ umożliwia porównywanie zależności między zmiennymi o różnych typach danych.

W przypadku danych porządkowych, współczynnik korelacji rang Spearmana oblicza się na podstawie rang tych danych. Pozwala to na określenie, czy występuje jakikolwiek porządek lub tendencja w zależności między tymi danymi. Jeśli wartość współczynnika jest bliska 1 lub -1, oznacza to silny związek między danymi porządkowymi.

W przypadku danych ilościowych, współczynnik korelacji rang Spearmana można obliczyć na podstawie wartości tych danych. W ten sposób można określić, czy występuje liniowa zależność między tymi danymi. Jednak w przypadku danych ilościowych, lepszym wyborem może być użycie współczynnika korelacji Pearsona, który uwzględnia również kształt rozkładu danych.

Analiza danych panelowych i przekrojowych

Współczynnik korelacji rang Spearmana może być również stosowany do analizy danych panelowych i przekrojowych. Dane panelowe to dane, które są zbierane dla tych samych jednostek obserwacyjnych w różnych okresach czasu, podczas gdy dane przekrojowe to dane zbierane dla różnych jednostek obserwacyjnych w tym samym okresie czasu.

Przy analizie danych panelowych, współczynnik korelacji rang Spearmana można wykorzystać do oceny zależności między zmiennymi dla tych samych jednostek obserwacyjnych w różnych okresach czasu. Może to pomóc w identyfikacji trendów i wzorców w danych panelowych.

Przy analizie danych przekrojowych, współczynnik korelacji rang Spearmana może być używany do porównywania zależności między zmiennymi dla różnych jednostek obserwacyjnych w tym samym okresie czasu. Może to pomóc w identyfikacji podobieństw i różnic między różnymi grupami obserwacji.

Badanie nieliniowej zależności

Współczynnik korelacji rang Spearmana jest szczególnie przydatny do badania nieliniowej zależności między zmiennymi. W przypadku, gdy zależność między zmiennymi nie jest liniowa, współczynnik ten może wskazać na istnienie innej formy związku między danymi.

Przykładowo, jeśli współczynnik korelacji rang Spearmana jest bliski 0, oznacza to brak liniowej zależności między zmiennymi. Jednak może istnieć nieliniowa zależność między tymi zmiennymi, którą można odkryć przy użyciu innych metod analizy danych.

Interpretacja wyników współczynnika korelacji rang Spearmana w przypadku nieliniowej zależności wymaga jednak ostrożności. Konieczne jest dokładniejsze zbadanie danych i zastosowanie innych technik statystycznych w celu określenia charakteru tej zależności.

Porównywanie różnych grup obserwacji

Współczynnik korelacji rang Spearmana można również wykorzystać do porównywania zależności między różnymi grupami obserwacji. Na przykład, można go zastosować do porównania zależności między mężczyznami a kobietami, różnymi grupami wiekowymi lub różnymi grupami zawodowymi.

Przykładowo, jeśli wartość współczynnika korelacji rang Spearmana jest wyższa w jednej grupie niż w drugiej, oznacza to silniejszy związek między zmiennymi w tej grupie. Może to wskazywać na różnice w zależnościach między grupami obserwacji.

Interpretacja wyników porównywania różnych grup obserwacji przy użyciu współczynnika korelacji rang Spearmana może dostarczyć cennych informacji na temat różnic między tymi grupami. Jednak należy pamiętać, że wyniki te mogą być pod wpływem innych czynników, takich jak rozmiar próby czy charakterystyki grup.

Ogólnie rzecz biorąc, współczynnik korelacji rang Spearmana jest wskaźnikiem o wielu zaletach i zastosowaniach. Jest odporny na obserwacje odstające i brakujące dane, może być stosowany do danych porządkowych i ilościowych, a także do analizy danych panelowych i przekrojowych. Może być również stosowany do badania nieliniowej zależności i porównywania różnych grup obserwacji. Jednak należy pamiętać o jego ograniczeniach i konieczności uwzględnienia innych narzędzi statystycznych w celu pełniejszej analizy danych.

Inne miary korelacji dla danych porządkowych

Tau Kendalla

Tau Kendalla jest jednym z najważniejszych współczynników korelacji dla danych porządkowych. Jest miarą opisującą stopień zgodności pomiędzy dwiema zmiennymi, które mają charakter porządkowy. W odróżnieniu od innych miar korelacji, takich jak Pearsona czy Spearmana, Tau Kendalla uwzględnia jedynie względne porządki wartości, a nie ich rzeczywiste różnice.

Współczynnik Tau Kendalla przyjmuje wartości od -1 do 1, gdzie -1 oznacza pełną niezgodność porządkową, 0 oznacza brak korelacji, a 1 oznacza pełną zgodność porządkową. Im bliżej wartość współczynnika Tau Kendalla jest do 1, tym silniejsza jest korelacja pomiędzy zmiennymi.

W praktyce, Tau Kendalla znajduje zastosowanie w wielu dziedzinach, takich jak nauki społeczne, ekonomia, psychologia czy medycyna. Jest szczególnie użyteczny w przypadkach, gdy dane nie spełniają założeń dotyczących innych miar korelacji, na przykład gdy dane zawierają duże ilości tie (powtarzających się wartości) lub występują nieliniowe zależności.

Tau Kendalla i współczynnik korelacji rang Spearmana są obydwoma miarami korelacji dla danych porządkowych, jednak różnią się w pewnych aspektach.

Pierwszą różnicą jest to, jak obliczane są te współczynniki. W przypadku Tau Kendalla, kalkuluje się liczbę konfliktów (inversion) pomiędzy porządkami dwóch zmiennych, podczas gdy Spearman oblicza sumę kwadratów różnic rang dla każdej pary obserwacji.

Kolejną różnicą jest to, jak obie miary interpretują tie (powtarzające się wartości). Spearman traktuje tie jako wartości niezmienne, podczas gdy Tau Kendall traktuje je jako brak informacji i pomija je podczas obliczania współczynnika korelacji.

Ponadto, Tau Kendalla jest bardziej odporny na skrajne wartości niż Spearman. Jest bardziej elastyczny, jeśli chodzi o rozkład danych i nie jest tak wrażliwy na obserwacje odstające.

W praktyce, wybór miary korelacji zależy od specyfiki danych i celu badania. Jeśli dane zawierają duże ilości tie lub występują nieliniowe zależności, Tau Kendalla może być bardziej odpowiednią miarą korelacji.


Współczynnik korelacji rang Spearmanaartykuły polecane
Metody statystyczneKwartylKorelacjaPercentylWariancjaŚredniaDominantaEstymator obciążonyAnaliza regresji

Bibliografia

  • Aczel A. (2018), Statystyka w zarządzaniu, Wydawnictwo Naukowe PWN, Warszawa
  • Ostasiewicz S., Rusnak Z., Siedlecka U. (2006), Statystyka. Elementy Teorii i Zadania, Wydawnictwo Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław
  • Sobczyk M. (2007), Statystyka, Wydawnictwo Naukowe PWN, Warszawa
  • Starzyńska W. (2006), Statystyka praktyczna, Wydawnictwo Naukowe PWN, Warszawa
  • Woźniak M. (2002), Statystyka ogólna, Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków
  • Zeliaś A., Pawełek B., Wanat S. (2002), Metody statystyczne. Zadania i sprawdziany, Polskie Wydawnictwo Ekonomiczne, Warszawa


Autor: Łukasz Michta