Mediana wzór

Z Encyklopedia Zarządzania
Wersja do druku nie jest już wspierana i może powodować błędy w wyświetlaniu. Zaktualizuj swoje zakładki i zamiast funkcji strony do druku użyj domyślnej funkcji drukowania w swojej przeglądarce.

Mediana, wartość środkowa, wartość przeciętna, drugi kwartyl, piąty decyl lub też pięćdziesiąty centyl - wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana to punkt w pewnym zbiorze danych liczbowych w którym poniżej oraz powyżej mieści się jednakowa liczba punktów danych. Deborah J. Rumsey podaje świetny przykład, aby pomóc zrozumieć znaczenie mediany. Porównał on medianę do pasów zieleni znajdujących się na drogach szybkiego ruchu oraz na autostradzie. Pas ten mieści się na samym środku jezdni, a po obu stronach, znajduje się dokładnie taka sama ilość pasów ruchu (Rumsey Deborah J. 2016, s. 69).

Mediana i średnia to dwie różne metody odwzorowywania środka zbiorowości, jednakże niekiedy ich wynik może być jednakowy.

Kwartyl drugi Q2 (mediana, wartość środkowa), to kwantyl, który dzieli uporządkowaną niemalejąco zbiorowość na dwie części w ten sposób, że połowa jednostek zbiorowości ma wartości zmiennej równe lub większe od mediany, stąd też mediana bywa nazywana wartością środkową.

Posiadając dane szczegółowe, najpierw należy uporządkować je od wartości najmniejszej do wartości największej, w następnej kolejności trzeba ponumerować dane od 1 do n. Następnie należy określić liczbę obserwacji n, gdy liczba obserwacji jest nieparzysta, to medianę obliczamy następującym wzorem: (n+1)/2, wówczas medianą jest wartość środkowa. Jeżeli liczebność zbiorowości jest liczba parzystą, przyjmuje się, że mediana jest średnią arytmetyczną dwóch środkowych (n/2 oraz n/2+1) wartości zmiennej (Pułaska-Turyna B. 2011, s. 58). Kwartyl pierwszy i trzeci z szeregu szczegółowego wyznacza się w sposób analogiczny jak medianę. Zbiorowość dzieli się na dwie rozłączne części: pierwszą, której jednostki przyjmują wartości nie większe od mediany i drugą, złożoną z pozostałych jednostek. Dla każdej z tych części można wyznaczyć ponownie medianę. Dla pierwszej części wartość mediany będzie odpowiadała kwartylowi pierwszemu (Q1), a dla drugiej - kwartylowi trzeciemu (Q3).

Wyznaczenie mediany z szeregu rozdzielczego punktowego sprowadza się do wskazania jednostki środkowej i odczytania wariantu zmiennej odpowiadającej tej jednostce. Określenie środkowej jednostki ułatwia kumulacja liczebności, która polega na kolejnym, narastającym sumowaniu liczebności dotyczących poszczególnych wariantów badanej zmiennej. Jeżeli kumulacji podlegają częstości względne, a nie liczebności absolutne, to otrzymany zbiór danych określa się mianem dystrybuanty empirycznej. Graficznym obrazem kształtowania się liczebności skumulowanej jest histogram liczebności skumulowanej lub diagram liczebności skumulowanej.

TL;DR

Mediana to wartość środkowa w zbiorze danych, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Może być obliczana dla zbiorów uporządkowanych oraz rozdzielczych punktowych. Jej wartość zależy od liczby obserwacji - dla nieparzystej liczby jest to środkowa wartość, a dla parzystej jest to średnia arytmetyczna dwóch środkowych wartości. Przykłady obliczania mediany dla różnych zbiorów danych przedstawione w artykule.

Wzór

Zbiór danych {x1, x2,...,xn}

Jeżeli n jest liczbą:

Parzystą, to medianą jest liczba:

me=[xn/2+xn/2+1]/2

Nieparzystą, to medianą jest liczba:

me=[xn+1]/2

Przykłady

Przykład I

Lista mieszkańców pewnego osiedla prezentuje się następująco:

  1. Paweł A. - 18 lat
  2. Marcin S. - 4 lata
  3. Franciszek J. - 16 lat
  4. Tadeusz J. - 18 lat
  5. Irena J. - 9 lat

Aby móc ustalić medianę, należy uporządkować jednostki statystyczne od najmłodszej do najstarszej, czyli według zmiennej jakim jest "wiek".

  1. Marcin S. - 4 lata
  2. Irena J. - 9 lat
  3. Franciszek J. - 16 lat
  4. Paweł A. - 18 lat
  5. Tadeusz J. - 18 lat

Zbiorowość liczy 5 osób, "środkową" jest trzecia (po uporządkowaniu) jednostka statystyczna, czyli 16-letni Franciszek J. Mediana wieku wynosi zatem 16 lat (Lissowski G., Haman J., Jasiński M. 2011, s. 84-85).

Przykład II

Nasz zbiór danych liczy 6 osób. Macierz danych statystycznych po uporządkowaniu od najmniejszego do największego według wieku, prezentuje się następująco:

  1. Marcin S. - 4 lata
  2. Irena J. - 9 lat
  3. Franciszek J. - 16 lat
  4. Paweł A. - 18 lat
  5. Tadeusz J. - 18 lat
  6. Pani Xymena - 79 lat

Są dwie osoby "środkowe": Franciszek J. (16 lat) oraz Paweł A. lub też Tadeusz J.(18 lat). Zgodnie z definicją mediany warunek spełniany jest przez więcej niż jedną liczbę, a więc za medianę można przyjąć wszystkie liczby rzeczywiste z przedziału <16,18> (Lissowski G., Haman J., Jasiński M. 2011, s. 85).

Zobacz także


Mediana wzórartykuły polecane
KwartylMetody statystyczneEstymacjaPoziom istotnościPercentylKwantylTest Shapiro-WilkaTest zgodności chi-kwadratWariancja

Bibliografia

  • Lissowski G., Haman J., Jasiński M. (2011), Podstawy statystyki dla socjologów, Wydawnictwo Naukowe SCHOLAR, Warszawa
  • Pułaska-Turyna B. (2011), Statystyka dla ekonomistów, Difin, Warszawa
  • Rumsey D. (2016), Statystyka dla bystrzaków, Helion, Gliwice
  • Wierzbiński J. (2008), Statystyka opisowa, Wydawnictwo Naukowe Wydziału Zarządzania Uniwersytetu Warszawskiego, Warszawa
  • Zieliński R. (2010), O średniej arytmetycznej i medianie, Matematyka stosowana, nr 11
  • Zimny A. (2010), Statystyka opisowa Państwowa Wyższa Szkoła Zawodowa w Koninie, Konin
  • Żyżyński J. (2017), Statystyka opisowa i matematyczna dla zarządzania, Wydawnictwo Naukowe Wydziału Zarządzania Uniwersytetu Warszawskiego, Warszawa


Autor: Hang Claudia Ngo Thanh