Kwantyl

Kwantyl
Polecane artykuły

Kwantyl jest miarą statystyczną, należącą do grupy miar średnich pozycyjnych. Kwantylem rzędu β, oznaczanym jako Qβ jest taka wartość zmiennej X, która dzieli zbiór danych na dwie części, wśród których \(β \cdot N \) jednostek ma wartość niższą niż wartość kwantyla, a \( (1- β)\cdot N \) jednostek ma wartość równą lub wyższą od wartości kwantyla. Oznacza to, że jeżeli realizacja badanej cechy w rozkładzie szczegółowym lub rozdzielczym (który jest uporządkowany niemalejąco) zajmuje miejsce \(β \cdot N \):

\[ Q_β=x_β \cdot N \]
\[β∈(0,1)\]

to można ją nazwać kwantylem rzędu β[1]. Najogólniej mówiąc kwantyle reprezentują wartość cechy zbiorowości będącej przedmiotem badania i rozdzielają ja na równe lub proporcjonalne części o określonej liczbie jednostek. Do wyznaczania kwantyli wykorzystuje się szeregi uporządkowane [2].

Rodzaje kwantyli

Wśród kwantyli wyróżniamy przede wszystkim: kwartyle, decyle i centyle.
Kwartyle dzielą daną zbiorowość ze względu na ilość jednostek na dwie części, w wyniku czego powstają trzy kwartyle. Należy pamiętać, iż [3]:

  • w przypadku pierwszego kwartyla (dolnego), oznaczanego często jako Q1, 25% jednostek ma wartość poniżej wartości kwartyla, a 75% jednostek ma wartość wyższą.
  • w przypadku drugiego kwartyla (mediana), Q2, zachodzi równy podział, w którym 50% jednostek ma wartości niższe niż wartość kwartyla i 50% ma wartości wyższe.
  • kwartyl trzeci (górny), Q3, jest odwrotnością kwartyla pierwszego, zatem 75% wartości cechy znajduje się poniżej wartości kwartyla, a pozostałe 25% znajduje się powyżej jego wartości.

W zależności od wykorzystywanych szeregów sposób obliczania kwartyli różni się od siebie. Oblicza się je w następujący sposób:
Mediana:

  • w szeregu prostym nieparzystym:
\[ k=\frac{N+1}{2}\]
\[M_e= x_k\]

dla którego:
N – liczba jednostek danej zbiorowości,
Xk – wartość określonej cechy zmiennej

  • w szeregu parzystym – w jego przypadku mediana jest średnią arytmetyczną z dwóch sąsiednich wartości środkowych:
\[ k=\frac{N}{2} \]
\[ M_e=\frac{x_k+ x_{k+1}}{2} \]
  • w szeregu rozdzielczym jednostopniowym – mediana wyznaczana jest poprzez wskazanie w kolumnie szeregu parzystego cechy będącej równej \(cum\frac{N}{2} \), a w szeregu nieparzystym \( cum \frac{N+1}{2} \).
  • w szeregu rozdzielczym przedziałowym – medianę wyznacza się poprzez wybranie przedziału w którym się ona znajduje, a później wykorzystanie poniższego wzoru interpolacyjnego do oszacowania jej wartości:
\[ M_e=Q_2=x_0+\frac{c_0}{n_0}\cdot(\frac{N}{2}-cum_{n-1}) \]

dla którego:
x0 – najniższa wartość z przedziału, w którym znajduje się mediana,
c0– rozpiętość przedziału, w którym znajduje się mediana,
n0– liczba jednostek znajdujących się w przedziale mediany,
N – liczba jednostek w całej zbiorowości,
cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje mediana.
Kwartyl pierwszy:

  • w szeregu prostym (wyliczającym) nieparzystym
\[ k=\frac{N+1}{4}\]
\[ Q_1=x_k \]

gdzie:
N – liczba jednostek danej zbiorowości,
Xk – wartość określonej cechy zmiennej

  • w szeregu prostym parzystym
\[ k=\frac{N}{4} \]
\[ Q_1=\frac{x_k+ x_{k+1}}{2} \]
  • w szeregu rozdzielczym jednostopniowym – Q1 wyznacza się poprzez wybranie w szeregu parzystym cechy zmiennej równej \( cum\frac{N}{4} \), a w szeregu nieparzystym \( cum\frac{N+1}{4} \)
  • w szeregu rozdzielczym wielostopniowym Q1 wyznacza się poprzez wybór przedziału, w którym znajduje się kwartyl, a następie wykorzystanie wzoru interpolacyjnego, do oszacowania jego wartości\[Q_1=x_0+\frac{c_0}{n_0}\cdot(\frac{N}{4}-cum_{n-1}) \]

dla którego:
x0 – najniższa wartość z przedziału, w którym znajduje się Q1,
c0– rozpiętość przedziału, w którym znajduje się Q1,
n0– liczba jednostek znajdujących się w przedziale Q1,
N – liczba jednostek w całej zbiorowości.
cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje Q1.
Kwartyl trzeci:

  • dla szeregu prostego nieparzystego\[ k=\frac{3(N+1)}{4} \]
\[ Q_3=x_k \]

gdzie:
N – liczba jednostek danej zbiorowości,
Xk – wartość określonej cechy zmiennej.

  • dla szeregu prostego parzystego\[ k=\frac{3N}{4} \]
\[ Q_3=\frac{x_k+ x_{k+1}}{2} \]
  • dla szeregu rozdzielczego jednostopniowego – Q3 wyznacza się poprzez wybranie w szeregu parzystym cechy zmiennej równej \(cum\frac{3N}{4} \), a w szeregu nieparzystym \( cum\frac{3(N+1)}{4} \)
  • w szeregu rozdzielczym wielostopniowym – Q3 wyznacza się poprzez wybór przedziału, w którym znajduje się kwartyl, a następie wykorzystanie wzoru interpolacyjnego do oszacowania jego wartości\[Q_3=x_0+\frac{c_0}{n_0}\cdot(\frac{3N}{4}-cum_{n-1}) \]

dla którego:
x0 – najniższa wartość z przedziału, w którym znajduje się Q3,
c0 – rozpiętość przedziału, w którym znajduje się Q3,
n0 – liczba jednostek znajdujących się w przedziale Q3,
N – liczba jednostek w całej zbiorowości,
cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje Q3[4].
Decyle rozdzielają daną zbiorowość pod względem liczby jej jednostek na 10 równych części. Wśród nich dla przykładu decyl trzeci oznacza, że 0,3 jednostek ma wartość niższą niż decyl, a 0,7 jednostek ma wartość wyższą.
Centyle (percentyle) rozdzielają jednostki danej zbiorowości równo na 100 części. Centyl 50 odpowiada medianie. Dla przykładu centyl 39 oznacza, że 0,39 jednostek zbiorowości posiada wartość niższą niż centyl, a 0,61 jednostek zbiorowości posiada wartość wyższą[5].

Przypisy

  1. J. Czempas (2007), s. 13
  2. M. Sobczyk (2007) s. 43 - 45
  3. M. Sobczyk (2007), s. 43 – 45
  4. A. Zimny (2010) s. 25 - 28
  5. M. Sobczyk (2007), s. 43 - 45

Bibliografia

  • Bielecka A., (2017), Statystyka dla menedżerów Teoria i praktyka, Wydawnictwo Nieoczywiste, Piaseczno
  • Bobowski Z., (2004), Wybrane metody statystyki opisowej i wnioskowania statystycznego, WWSZiP, Wałbrzych
  • Borowska M., (2016), Statystyka, Materiały pomocnicze dla studentów do nauki statystyki, Wydawnictwo Diecezjalne i Drukarnia w Sandomierzu, Stalowa Wola
  • Czempas J., (2000), Elementy Statytsyki Podstawowe mierniki i metody, Wyższa Szkoła Biznesu w Dąbrowie górniczej, Dąbrowa Górnicza
  • Ostasiewicz W., (2011) Badania Statystyczne, Oficyna a Wolter Kluwer business, Warszawa
  • Rumsey Deborah J., (2016), Statystyka dla bystrzaków, Wydawnictwo HELION, Gliwice
  • Sobczyk. M., (2007), Statystyka, PWN, Warszawa
  • Zimny A.,(2010), Statystyka opisowa, PWSZ w Koninie,

Autor: Karolina Gancarczyk