Kwantyl: Różnice pomiędzy wersjami
mNie podano opisu zmian |
m (cleanup bibliografii i rotten links) |
||
Linia 14: | Linia 14: | ||
}} | }} | ||
'''Kwantyl''' jest miarą statystyczną, należącą do grupy miar średnich pozycyjnych. Kwantylem rzędu β, oznaczanym jako Q<sub>β</sub> jest taka [[wartość]] zmiennej X, która dzieli zbiór danych na dwie części, wśród których <math>{\beta} \cdot N </math> jednostek ma wartość niższą niż wartość kwantyla, a <math> (1 - {\beta} ) \cdot N </math> jednostek ma wartość równą lub wyższą od wartości kwantyla. Oznacza to, że jeżeli realizacja badanej cechy w rozkładzie szczegółowym lub rozdzielczym (który jest uporządkowany niemalejąco) zajmuje miejsce <math>{\beta} \cdot N </math>: | '''Kwantyl''' jest miarą statystyczną, należącą do grupy miar średnich pozycyjnych. Kwantylem rzędu β, oznaczanym jako Q<sub>β</sub> jest taka [[wartość]] zmiennej X, która dzieli zbiór danych na dwie części, wśród których <math>{\beta} \cdot N </math> jednostek ma wartość niższą niż wartość kwantyla, a <math> (1 - {\beta} ) \cdot N </math> jednostek ma wartość równą lub wyższą od wartości kwantyla. Oznacza to, że jeżeli realizacja badanej cechy w rozkładzie szczegółowym lub rozdzielczym (który jest uporządkowany niemalejąco) zajmuje miejsce <math>{\beta} \cdot N </math>: | ||
:: <math> Q_{\beta}=x_{\beta} \cdot N </math> <br /> | :: <math> Q_{\beta}=x_{\beta} \cdot N </math> <br /> | ||
:: <math>{\beta} \isin (0,1)</math> <br /> | :: <math>{\beta} \isin (0,1)</math> <br /> | ||
to można ją nazwać kwantylem rzędu β<ref> J. Czempas (2007), s. 13 </ref>. Najogólniej mówiąc kwantyle reprezentują wartość cechy zbiorowości będącej przedmiotem badania i rozdzielają ja na równe lub proporcjonalne części o określonej liczbie jednostek. Do wyznaczania kwantyli wykorzystuje się szeregi uporządkowane <ref> M. Sobczyk (2007) s. 43 - 45 </ref>. | to można ją nazwać kwantylem rzędu β<ref> J. Czempas (2007), s. 13 </ref>. Najogólniej mówiąc kwantyle reprezentują wartość cechy zbiorowości będącej przedmiotem badania i rozdzielają ja na równe lub proporcjonalne części o określonej liczbie jednostek. Do wyznaczania kwantyli wykorzystuje się szeregi uporządkowane <ref> M. Sobczyk (2007) s. 43 - 45 </ref>. | ||
Linia 21: | Linia 21: | ||
Kwantyl to miara statystyczna, która dzieli zbiór danych na dwie części. Wyróżniamy kwartyle, decyle i centyle. Kwartyle dzielą zbiór na trzy części, decyle na dziesięć, a centyle na sto. Mediana jest przykładem kwartyla drugiego, a centyl 50 odpowiada medianie. | Kwantyl to miara statystyczna, która dzieli zbiór danych na dwie części. Wyróżniamy kwartyle, decyle i centyle. Kwartyle dzielą zbiór na trzy części, decyle na dziesięć, a centyle na sto. Mediana jest przykładem kwartyla drugiego, a centyl 50 odpowiada medianie. | ||
==Rodzaje kwantyli== | ==Rodzaje kwantyli== | ||
Wśród kwantyli wyróżniamy przede wszystkim: '''kwartyle, decyle i centyle.''' <br /> | Wśród kwantyli wyróżniamy przede wszystkim: '''kwartyle, decyle i centyle.''' <br /> | ||
'''Kwartyle''' | '''Kwartyle''' | ||
dzielą daną zbiorowość ze względu na ilość jednostek na dwie części, w wyniku czego powstają trzy kwartyle. Należy pamiętać, iż <ref> M. Sobczyk (2007), s. 43 – 45 </ref>: | dzielą daną zbiorowość ze względu na ilość jednostek na dwie części, w wyniku czego powstają trzy kwartyle. Należy pamiętać, iż <ref> M. Sobczyk (2007), s. 43 – 45 </ref>: | ||
* w przypadku pierwszego kwartyla (dolnego), oznaczanego często jako Q<sub>1</sub>, 25% jednostek ma wartość poniżej wartości kwartyla, a 75% jednostek ma wartość wyższą. | * w przypadku pierwszego kwartyla (dolnego), oznaczanego często jako Q<sub>1</sub>, 25% jednostek ma wartość poniżej wartości kwartyla, a 75% jednostek ma wartość wyższą. | ||
* w przypadku drugiego kwartyla ([[mediana]]), Q<sub>2</sub>, zachodzi równy podział, w którym 50% jednostek ma wartości niższe niż wartość kwartyla i 50% ma wartości wyższe. | * w przypadku drugiego kwartyla ([[mediana]]), Q<sub>2</sub>, zachodzi równy podział, w którym 50% jednostek ma wartości niższe niż wartość kwartyla i 50% ma wartości wyższe. | ||
* kwartyl trzeci (górny), Q<sub>3</sub>, jest odwrotnością kwartyla pierwszego, zatem 75% wartości cechy znajduje się poniżej wartości kwartyla, a pozostałe 25% znajduje się powyżej jego wartości. | * kwartyl trzeci (górny), Q<sub>3</sub>, jest odwrotnością kwartyla pierwszego, zatem 75% wartości cechy znajduje się poniżej wartości kwartyla, a pozostałe 25% znajduje się powyżej jego wartości. | ||
<google>t</google> | <google>t</google> | ||
W zależności od wykorzystywanych szeregów sposób obliczania kwartyli różni się od siebie. Oblicza się je w następujący sposób:<br /> | W zależności od wykorzystywanych szeregów sposób obliczania kwartyli różni się od siebie. Oblicza się je w następujący sposób:<br /> | ||
'''Mediana:''' | '''Mediana:''' | ||
* w szeregu prostym nieparzystym: <br /> | * w szeregu prostym nieparzystym: <br /> | ||
:: <math> k=\frac{N+1}{2}</math><br /> | :: <math> k=\frac{N+1}{2}</math><br /> | ||
Linia 38: | Linia 38: | ||
''X<sub>k</sub>'' – wartość określonej cechy zmiennej <br /> | ''X<sub>k</sub>'' – wartość określonej cechy zmiennej <br /> | ||
* w szeregu parzystym – w jego przypadku mediana jest średnią arytmetyczną z dwóch sąsiednich wartości środkowych:<br /> | * w szeregu parzystym – w jego przypadku mediana jest średnią arytmetyczną z dwóch sąsiednich wartości środkowych:<br /> | ||
:: <math> k=\frac{N}{2} </math> <br /> | :: <math> k=\frac{N}{2} </math> <br /> | ||
:: <math> M_e=\frac{x_k+ x_{k+1}}{2} </math> <br /> | :: <math> M_e=\frac{x_k+ x_{k+1}}{2} </math> <br /> | ||
* w szeregu rozdzielczym jednostopniowym – mediana wyznaczana jest poprzez wskazanie w kolumnie szeregu parzystego cechy będącej równej <math>cum\frac{N}{2} </math>, a w szeregu nieparzystym <math> cum \frac{N+1}{2} </math>. <br /> | * w szeregu rozdzielczym jednostopniowym – mediana wyznaczana jest poprzez wskazanie w kolumnie szeregu parzystego cechy będącej równej <math>cum\frac{N}{2} </math>, a w szeregu nieparzystym <math> cum \frac{N+1}{2} </math>. <br /> | ||
Linia 48: | Linia 48: | ||
n<sub>0</sub>– liczba jednostek znajdujących się w przedziale mediany,<br /> | n<sub>0</sub>– liczba jednostek znajdujących się w przedziale mediany,<br /> | ||
N – liczba jednostek w całej zbiorowości,<br /> | N – liczba jednostek w całej zbiorowości,<br /> | ||
cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje mediana.<br /> | cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje mediana.<br /> | ||
'''Kwartyl pierwszy:''' | '''Kwartyl pierwszy:''' | ||
* w szeregu prostym (wyliczającym) nieparzystym | * w szeregu prostym (wyliczającym) nieparzystym | ||
:: <math> k=\frac{N+1}{4}</math> | :: <math> k=\frac{N+1}{4}</math> | ||
:: <math> Q_1=x_k </math> | :: <math> Q_1=x_k </math> | ||
gdzie: <br /> | gdzie: <br /> | ||
N – liczba jednostek danej zbiorowości,<br /> | N – liczba jednostek danej zbiorowości,<br /> | ||
X<sub>k</sub> – wartość określonej cechy zmiennej<br /> | X<sub>k</sub> – wartość określonej cechy zmiennej<br /> | ||
* w szeregu prostym parzystym | * w szeregu prostym parzystym | ||
:: <math> k=\frac{N}{4} </math> | :: <math> k=\frac{N}{4} </math> | ||
:: <math> Q_1=\frac{x_k+ x_{k+1}}{2} </math> | :: <math> Q_1=\frac{x_k+ x_{k+1}}{2} </math> | ||
* w szeregu rozdzielczym jednostopniowym – Q<sub>1</sub> wyznacza się poprzez wybranie w szeregu parzystym cechy zmiennej równej <math> cum\frac{N}{4} </math>, a w szeregu nieparzystym <math> cum\frac{N+1}{4} </math> | * w szeregu rozdzielczym jednostopniowym – Q<sub>1</sub> wyznacza się poprzez wybranie w szeregu parzystym cechy zmiennej równej <math> cum\frac{N}{4} </math>, a w szeregu nieparzystym <math> cum\frac{N+1}{4} </math> | ||
* w szeregu rozdzielczym wielostopniowym Q<sub>1</sub> wyznacza się poprzez wybór przedziału, w którym znajduje się kwartyl, a następie wykorzystanie wzoru interpolacyjnego, do oszacowania jego wartości: | * w szeregu rozdzielczym wielostopniowym Q<sub>1</sub> wyznacza się poprzez wybór przedziału, w którym znajduje się kwartyl, a następie wykorzystanie wzoru interpolacyjnego, do oszacowania jego wartości: | ||
<math>Q_1=x_0+\frac{c_0}{n_0}\cdot(\frac{N}{4}-cum_{n-1}) </math> | <math>Q_1=x_0+\frac{c_0}{n_0}\cdot(\frac{N}{4}-cum_{n-1}) </math> | ||
Linia 68: | Linia 68: | ||
N – liczba jednostek w całej zbiorowości.<br /> | N – liczba jednostek w całej zbiorowości.<br /> | ||
cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje Q<sub>1</sub>.<br /> | cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje Q<sub>1</sub>.<br /> | ||
'''Kwartyl trzeci:''' | '''Kwartyl trzeci:''' | ||
* dla szeregu prostego nieparzystego: | * dla szeregu prostego nieparzystego: | ||
<math> k=\frac{3(N+1)}{4} </math> | <math> k=\frac{3(N+1)}{4} </math> | ||
:: <math> Q_3=x_k </math> <br /> | :: <math> Q_3=x_k </math> <br /> | ||
gdzie: <br /> | gdzie: <br /> | ||
N – liczba jednostek danej zbiorowości, <br /> | N – liczba jednostek danej zbiorowości, <br /> | ||
X<sub>k</sub> – wartość określonej cechy zmiennej. | X<sub>k</sub> – wartość określonej cechy zmiennej. | ||
* dla szeregu prostego parzystego: | * dla szeregu prostego parzystego: | ||
<math> k=\frac{3N}{4} </math> | <math> k=\frac{3N}{4} </math> | ||
:: <math> Q_3=\frac{x_k+ x_{k+1}}{2} </math> | :: <math> Q_3=\frac{x_k+ x_{k+1}}{2} </math> | ||
* dla szeregu rozdzielczego jednostopniowego – Q<sub>3</sub> wyznacza się poprzez wybranie w szeregu parzystym cechy zmiennej równej <math>cum\frac{3N}{4} </math>, a w szeregu nieparzystym <math> cum\frac{3(N+1)}{4} </math> | * dla szeregu rozdzielczego jednostopniowego – Q<sub>3</sub> wyznacza się poprzez wybranie w szeregu parzystym cechy zmiennej równej <math>cum\frac{3N}{4} </math>, a w szeregu nieparzystym <math> cum\frac{3(N+1)}{4} </math> | ||
* w szeregu rozdzielczym wielostopniowym – Q<sub>3</sub> wyznacza się poprzez wybór przedziału, w którym znajduje się kwartyl, a następie wykorzystanie wzoru interpolacyjnego do oszacowania jego wartości: | * w szeregu rozdzielczym wielostopniowym – Q<sub>3</sub> wyznacza się poprzez wybór przedziału, w którym znajduje się kwartyl, a następie wykorzystanie wzoru interpolacyjnego do oszacowania jego wartości: | ||
<math>Q_3=x_0+\frac{c_0}{n_0}\cdot(\frac{3N}{4}-cum_{n-1}) </math> | <math>Q_3=x_0+\frac{c_0}{n_0}\cdot(\frac{3N}{4}-cum_{n-1}) </math> | ||
dla którego: <br /> | dla którego: <br /> | ||
Linia 92: | Linia 92: | ||
(percentyle) rozdzielają jednostki danej zbiorowości równo na 100 części. Centyl 50 odpowiada medianie. Dla przykładu centyl 39 oznacza, że 0,39 jednostek zbiorowości posiada wartość niższą niż centyl, a 0,61 jednostek zbiorowości posiada wartość wyższą<ref> M. Sobczyk (2007), s. 43 - 45 </ref>. | (percentyle) rozdzielają jednostki danej zbiorowości równo na 100 części. Centyl 50 odpowiada medianie. Dla przykładu centyl 39 oznacza, że 0,39 jednostek zbiorowości posiada wartość niższą niż centyl, a 0,61 jednostek zbiorowości posiada wartość wyższą<ref> M. Sobczyk (2007), s. 43 - 45 </ref>. | ||
== Przypisy == | ==Przypisy== | ||
<references/> | <references /> | ||
== Bibliografia == | ==Bibliografia== | ||
* Bielecka A., (2017), '' | <noautolinks> | ||
* Bobowski Z., (2004), '' | * Bielecka A., (2017), ''Statystyka dla menedżerów Teoria i praktyka'', Wydawnictwo Nieoczywiste, Piaseczno | ||
* Borowska M., (2016), ''Statystyka'', | * Bobowski Z., (2004), ''Wybrane metody statystyki opisowej i wnioskowania statystycznego'', WWSZiP, Wałbrzych | ||
* Borowska M., (2016), ''Statystyka'', Materiały pomocnicze dla studentów do nauki statystyki, Wydawnictwo Diecezjalne i Drukarnia w Sandomierzu, Stalowa Wola | |||
* Czempas J., (2000), ''Elementy Statytsyki Podstawowe mierniki i metody'', Wyższa Szkoła Biznesu w Dąbrowie górniczej, Dąbrowa Górnicza | * Czempas J., (2000), ''Elementy Statytsyki Podstawowe mierniki i metody'', Wyższa Szkoła Biznesu w Dąbrowie górniczej, Dąbrowa Górnicza | ||
* Ostasiewicz W., (2011) ''[https://books.google.pl/books?id=l1RSAwAAQBAJ&pg=PA95&dq=kwantyle&hl=pl&sa=X&ved=0ahUKEwjSjbzEqdnoAhXtlosKHSWTDPAQ6AEIMTAB#v=onepage&q&f=false Badania Statystyczne]'', Oficyna a Wolter Kluwer business, Warszawa | * Ostasiewicz W., (2011) ''[https://books.google.pl/books?id=l1RSAwAAQBAJ&pg=PA95&dq=kwantyle&hl=pl&sa=X&ved=0ahUKEwjSjbzEqdnoAhXtlosKHSWTDPAQ6AEIMTAB#v=onepage&q&f=false Badania Statystyczne]'', Oficyna a Wolter Kluwer business, Warszawa | ||
* Rumsey Deborah J., (2016), ''Statystyka dla bystrzaków'', Wydawnictwo HELION, Gliwice | * Rumsey Deborah J., (2016), ''Statystyka dla bystrzaków'', Wydawnictwo HELION, Gliwice | ||
* Sobczyk. M., (2007), ''Statystyka'', PWN, Warszawa | * Sobczyk. M., (2007), ''Statystyka'', PWN, Warszawa | ||
* Zimny A.,(2010), ''[https://depot.ceon.pl/bitstream/handle/123456789/12550/statystyka_opisowa.pdf?sequence=1 Statystyka opisowa]'', PWSZ w Koninie | * Zimny A.,(2010), ''[https://depot.ceon.pl/bitstream/handle/123456789/12550/statystyka_opisowa.pdf?sequence=1 Statystyka opisowa]'', PWSZ w Koninie | ||
</noautolinks> | |||
[[Kategoria:Statystyka i Ekonometria]] | [[Kategoria:Statystyka i Ekonometria]] |
Wersja z 18:04, 28 paź 2023
Kwantyl |
---|
Polecane artykuły |
Kwantyl jest miarą statystyczną, należącą do grupy miar średnich pozycyjnych. Kwantylem rzędu β, oznaczanym jako Qβ jest taka wartość zmiennej X, która dzieli zbiór danych na dwie części, wśród których jednostek ma wartość niższą niż wartość kwantyla, a jednostek ma wartość równą lub wyższą od wartości kwantyla. Oznacza to, że jeżeli realizacja badanej cechy w rozkładzie szczegółowym lub rozdzielczym (który jest uporządkowany niemalejąco) zajmuje miejsce :
to można ją nazwać kwantylem rzędu β[1]. Najogólniej mówiąc kwantyle reprezentują wartość cechy zbiorowości będącej przedmiotem badania i rozdzielają ja na równe lub proporcjonalne części o określonej liczbie jednostek. Do wyznaczania kwantyli wykorzystuje się szeregi uporządkowane [2].
TL;DR
Kwantyl to miara statystyczna, która dzieli zbiór danych na dwie części. Wyróżniamy kwartyle, decyle i centyle. Kwartyle dzielą zbiór na trzy części, decyle na dziesięć, a centyle na sto. Mediana jest przykładem kwartyla drugiego, a centyl 50 odpowiada medianie.
Rodzaje kwantyli
Wśród kwantyli wyróżniamy przede wszystkim: kwartyle, decyle i centyle.
Kwartyle
dzielą daną zbiorowość ze względu na ilość jednostek na dwie części, w wyniku czego powstają trzy kwartyle. Należy pamiętać, iż [3]:
- w przypadku pierwszego kwartyla (dolnego), oznaczanego często jako Q1, 25% jednostek ma wartość poniżej wartości kwartyla, a 75% jednostek ma wartość wyższą.
- w przypadku drugiego kwartyla (mediana), Q2, zachodzi równy podział, w którym 50% jednostek ma wartości niższe niż wartość kwartyla i 50% ma wartości wyższe.
- kwartyl trzeci (górny), Q3, jest odwrotnością kwartyla pierwszego, zatem 75% wartości cechy znajduje się poniżej wartości kwartyla, a pozostałe 25% znajduje się powyżej jego wartości.
W zależności od wykorzystywanych szeregów sposób obliczania kwartyli różni się od siebie. Oblicza się je w następujący sposób:
Mediana:
- w szeregu prostym nieparzystym:
dla którego:
N – liczba jednostek danej zbiorowości,
Xk – wartość określonej cechy zmiennej
- w szeregu parzystym – w jego przypadku mediana jest średnią arytmetyczną z dwóch sąsiednich wartości środkowych:
- w szeregu rozdzielczym jednostopniowym – mediana wyznaczana jest poprzez wskazanie w kolumnie szeregu parzystego cechy będącej równej , a w szeregu nieparzystym .
- w szeregu rozdzielczym przedziałowym – medianę wyznacza się poprzez wybranie przedziału w którym się ona znajduje, a później wykorzystanie poniższego wzoru interpolacyjnego do oszacowania jej wartości:
dla którego:
x0 – najniższa wartość z przedziału, w którym znajduje się mediana,
c0– rozpiętość przedziału, w którym znajduje się mediana,
n0– liczba jednostek znajdujących się w przedziale mediany,
N – liczba jednostek w całej zbiorowości,
cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje mediana.
Kwartyl pierwszy:
- w szeregu prostym (wyliczającym) nieparzystym
gdzie:
N – liczba jednostek danej zbiorowości,
Xk – wartość określonej cechy zmiennej
- w szeregu prostym parzystym
- w szeregu rozdzielczym jednostopniowym – Q1 wyznacza się poprzez wybranie w szeregu parzystym cechy zmiennej równej , a w szeregu nieparzystym
- w szeregu rozdzielczym wielostopniowym Q1 wyznacza się poprzez wybór przedziału, w którym znajduje się kwartyl, a następie wykorzystanie wzoru interpolacyjnego, do oszacowania jego wartości:
dla którego:
x0 – najniższa wartość z przedziału, w którym znajduje się Q1,
c0– rozpiętość przedziału, w którym znajduje się Q1,
n0– liczba jednostek znajdujących się w przedziale Q1,
N – liczba jednostek w całej zbiorowości.
cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje Q1.
Kwartyl trzeci:
- dla szeregu prostego nieparzystego:
gdzie:
N – liczba jednostek danej zbiorowości,
Xk – wartość określonej cechy zmiennej.
- dla szeregu prostego parzystego:
- dla szeregu rozdzielczego jednostopniowego – Q3 wyznacza się poprzez wybranie w szeregu parzystym cechy zmiennej równej , a w szeregu nieparzystym
- w szeregu rozdzielczym wielostopniowym – Q3 wyznacza się poprzez wybór przedziału, w którym znajduje się kwartyl, a następie wykorzystanie wzoru interpolacyjnego do oszacowania jego wartości:
dla którego:
x0 – najniższa wartość z przedziału, w którym znajduje się Q3,
c0 – rozpiętość przedziału, w którym znajduje się Q3,
n0 – liczba jednostek znajdujących się w przedziale Q3,
N – liczba jednostek w całej zbiorowości,
cum-1 – skumulowana liczebność przedziału występującego przed przedziałem, w którym występuje Q3[4].
Decyle
rozdzielają daną zbiorowość pod względem liczby jej jednostek na 10 równych części. Wśród nich dla przykładu decyl trzeci oznacza, że 0,3 jednostek ma wartość niższą niż decyl, a 0,7 jednostek ma wartość wyższą.
Centyle
(percentyle) rozdzielają jednostki danej zbiorowości równo na 100 części. Centyl 50 odpowiada medianie. Dla przykładu centyl 39 oznacza, że 0,39 jednostek zbiorowości posiada wartość niższą niż centyl, a 0,61 jednostek zbiorowości posiada wartość wyższą[5].
Przypisy
Bibliografia
- Bielecka A., (2017), Statystyka dla menedżerów Teoria i praktyka, Wydawnictwo Nieoczywiste, Piaseczno
- Bobowski Z., (2004), Wybrane metody statystyki opisowej i wnioskowania statystycznego, WWSZiP, Wałbrzych
- Borowska M., (2016), Statystyka, Materiały pomocnicze dla studentów do nauki statystyki, Wydawnictwo Diecezjalne i Drukarnia w Sandomierzu, Stalowa Wola
- Czempas J., (2000), Elementy Statytsyki Podstawowe mierniki i metody, Wyższa Szkoła Biznesu w Dąbrowie górniczej, Dąbrowa Górnicza
- Ostasiewicz W., (2011) Badania Statystyczne, Oficyna a Wolter Kluwer business, Warszawa
- Rumsey Deborah J., (2016), Statystyka dla bystrzaków, Wydawnictwo HELION, Gliwice
- Sobczyk. M., (2007), Statystyka, PWN, Warszawa
- Zimny A.,(2010), Statystyka opisowa, PWSZ w Koninie
Autor: Karolina Gancarczyk