Mediana wzór: Różnice pomiędzy wersjami
m (Infobox update) |
m (cleanup bibliografii i rotten links) |
||
(Nie pokazano 16 wersji utworzonych przez 3 użytkowników) | |||
Linia 1: | Linia 1: | ||
'''Mediana''', [[wartość]] środkowa, wartość przeciętna, drugi [[kwartyl]], piąty decyl lub też pięćdziesiąty centyl - wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana to punkt w pewnym zbiorze danych liczbowych w którym poniżej oraz powyżej mieści się jednakowa liczba punktów danych. Deborah J. Rumsey podaje świetny przykład, aby pomóc zrozumieć znaczenie mediany. Porównał on medianę do pasów zieleni znajdujących się na drogach szybkiego ruchu oraz na autostradzie. Pas ten mieści się na samym środku jezdni, a po obu stronach, znajduje się dokładnie taka sama ilość pasów ruchu (Rumsey Deborah J. 2016, s. 69). | |||
Mediana i średnia to dwie różne metody odwzorowywania środka zbiorowości, jednakże niekiedy ich [[wynik]] może być jednakowy. | |||
Mediana i średnia to dwie różne metody odwzorowywania środka zbiorowości, jednakże niekiedy ich wynik może być jednakowy. | |||
Kwartyl drugi Q<sub>2</sub> (mediana, wartość środkowa), to kwantyl, który dzieli uporządkowaną niemalejąco zbiorowość na dwie części w ten sposób, że połowa jednostek zbiorowości ma wartości zmiennej równe lub większe od mediany, stąd też mediana bywa nazywana wartością środkową. | Kwartyl drugi Q<sub>2</sub> (mediana, wartość środkowa), to kwantyl, który dzieli uporządkowaną niemalejąco zbiorowość na dwie części w ten sposób, że połowa jednostek zbiorowości ma wartości zmiennej równe lub większe od mediany, stąd też mediana bywa nazywana wartością środkową. | ||
Posiadając dane szczegółowe, najpierw należy uporządkować je od wartości najmniejszej do wartości największej, w następnej kolejności trzeba ponumerować dane od 1 do n. Następnie należy określić liczbę obserwacji <sub>n</sub>, gdy liczba obserwacji jest nieparzysta, to medianę obliczamy następującym wzorem: (n+1)/2, wówczas medianą jest wartość środkowa. Jeżeli liczebność zbiorowości jest liczba parzystą, przyjmuje się, że mediana jest średnią arytmetyczną dwóch środkowych (n/2 oraz n/2+1) wartości zmiennej (Pułaska-Turyna B. 2011, s. 58). | Posiadając [[dane]] szczegółowe, najpierw należy uporządkować je od wartości najmniejszej do wartości największej, w następnej kolejności trzeba ponumerować dane od 1 do n. Następnie należy określić liczbę obserwacji <sub>n</sub>, gdy liczba obserwacji jest nieparzysta, to medianę obliczamy następującym wzorem: (n+1)/2, wówczas medianą jest wartość środkowa. Jeżeli liczebność zbiorowości jest liczba parzystą, przyjmuje się, że mediana jest średnią arytmetyczną dwóch środkowych (n/2 oraz n/2+1) wartości zmiennej (Pułaska-Turyna B. 2011, s. 58). | ||
Kwartyl pierwszy i trzeci z szeregu szczegółowego wyznacza się w sposób analogiczny jak medianę. Zbiorowość dzieli się na dwie rozłączne części: pierwszą, której jednostki przyjmują wartości nie większe od mediany i drugą, złożoną z pozostałych jednostek. Dla każdej z tych części można wyznaczyć ponownie medianę. | Kwartyl pierwszy i trzeci z szeregu szczegółowego wyznacza się w sposób analogiczny jak medianę. Zbiorowość dzieli się na dwie rozłączne części: pierwszą, której jednostki przyjmują wartości nie większe od mediany i drugą, złożoną z pozostałych jednostek. Dla każdej z tych części można wyznaczyć ponownie medianę. | ||
Dla pierwszej części wartość mediany będzie odpowiadała kwartylowi pierwszemu (Q<sub>1</sub>), a dla drugiej - kwartylowi trzeciemu (Q<sub>3</sub>). | Dla pierwszej części wartość mediany będzie odpowiadała kwartylowi pierwszemu (Q<sub>1</sub>), a dla drugiej - kwartylowi trzeciemu (Q<sub>3</sub>). | ||
Wyznaczenie mediany z szeregu rozdzielczego punktowego sprowadza się do wskazania jednostki środkowej i odczytania wariantu [[Zmienna|zmiennej]] odpowiadającej tej jednostce. Określenie środkowej jednostki ułatwia kumulacja liczebności, która polega na kolejnym, narastającym sumowaniu liczebności dotyczących poszczególnych wariantów badanej zmiennej. Jeżeli kumulacji podlegają częstości względne, a nie liczebności absolutne, to otrzymany zbiór danych określa się mianem dystrybuanty empirycznej. Graficznym obrazem kształtowania się liczebności skumulowanej jest [[histogram]] liczebności skumulowanej lub diagram liczebności skumulowanej. | Wyznaczenie mediany z szeregu rozdzielczego punktowego sprowadza się do wskazania jednostki środkowej i odczytania wariantu [[Zmienna|zmiennej]] odpowiadającej tej jednostce. Określenie środkowej jednostki ułatwia kumulacja liczebności, która polega na kolejnym, narastającym sumowaniu liczebności dotyczących poszczególnych wariantów badanej zmiennej. Jeżeli kumulacji podlegają częstości względne, a nie liczebności absolutne, to otrzymany zbiór danych określa się mianem dystrybuanty empirycznej. Graficznym obrazem kształtowania się liczebności skumulowanej jest [[histogram]] liczebności skumulowanej lub diagram liczebności skumulowanej. | ||
<google>n</google> | |||
==TL;DR== | |||
Mediana to wartość środkowa w zbiorze danych, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Może być obliczana dla zbiorów uporządkowanych oraz rozdzielczych punktowych. Jej wartość zależy od liczby obserwacji - dla nieparzystej liczby jest to środkowa wartość, a dla parzystej jest to średnia arytmetyczna dwóch środkowych wartości. Przykłady obliczania mediany dla różnych zbiorów danych przedstawione w artykule. | |||
==Wzór== | ==Wzór== | ||
Zbiór danych {''x''<sub>1</sub>, ''x''<sub>2</sub>,...,''x''<sub>''n''</sub>} | Zbiór danych {''x''<sub>1</sub>, ''x''<sub>2</sub>,...,''x''<sub>''n''</sub>} | ||
Linia 37: | Linia 23: | ||
Parzystą, to medianą jest liczba: | Parzystą, to medianą jest liczba: | ||
m<sub>e</sub>=[ | m<sub>e</sub>=[x<sub>n/<small>2</small></sub>+x<sub>n/<sub><small>2</small></sub>+1</sub>]/2 | ||
Nieparzystą, to medianą jest liczba: | Nieparzystą, to medianą jest liczba: | ||
m<sub>e</sub>=[ | m<sub>e</sub>=[x<sub><sub>n</sub></sub><sub><sub>+1</sub></sub>]/2 | ||
==Przykłady== | ==Przykłady== | ||
Linia 47: | Linia 33: | ||
Lista mieszkańców pewnego osiedla prezentuje się następująco: | Lista mieszkańców pewnego osiedla prezentuje się następująco: | ||
# Paweł A.- 18 lat | # Paweł A. - 18 lat | ||
# Marcin S.- 4 lata | # Marcin S. - 4 lata | ||
# Franciszek J.- 16 lat | # Franciszek J. - 16 lat | ||
# Tadeusz J.- 18 lat | # Tadeusz J. - 18 lat | ||
# Irena J.- 9 lat | # Irena J. - 9 lat | ||
Aby móc ustalić medianę, należy uporządkować jednostki statystyczne od najmłodszej do najstarszej, czyli według zmiennej jakim jest "wiek". | Aby móc ustalić medianę, należy uporządkować jednostki statystyczne od najmłodszej do najstarszej, czyli według zmiennej jakim jest "wiek". | ||
# Marcin S.- 4 lata | # Marcin S. - 4 lata | ||
# Irena J.- 9 lat | # Irena J. - 9 lat | ||
# Franciszek J.- 16 lat | # Franciszek J. - 16 lat | ||
# Paweł A.- 18 lat | # Paweł A. - 18 lat | ||
# Tadeusz J.- 18 lat | # Tadeusz J. - 18 lat | ||
Zbiorowość liczy 5 osób, "środkową" jest trzecia (po uporządkowaniu) jednostka statystyczna, czyli 16-letni Franciszek J. Mediana wieku wynosi zatem 16 lat (Lissowski G., Haman J., Jasiński M. 2011, s. 84-85). | Zbiorowość liczy 5 osób, "środkową" jest trzecia (po uporządkowaniu) jednostka statystyczna, czyli 16-letni Franciszek J. Mediana wieku wynosi zatem 16 lat (Lissowski G., Haman J., Jasiński M. 2011, s. 84-85). | ||
Linia 65: | Linia 51: | ||
Nasz zbiór danych liczy 6 osób. Macierz danych statystycznych po uporządkowaniu od najmniejszego do największego według wieku, prezentuje się następująco: | Nasz zbiór danych liczy 6 osób. Macierz danych statystycznych po uporządkowaniu od najmniejszego do największego według wieku, prezentuje się następująco: | ||
# Marcin S.- 4 lata | # Marcin S. - 4 lata | ||
# Irena J.- 9 lat | # Irena J. - 9 lat | ||
# Franciszek J.- 16 lat | # Franciszek J. - 16 lat | ||
# Paweł A.- 18 lat | # Paweł A. - 18 lat | ||
# Tadeusz J.- 18 lat | # Tadeusz J. - 18 lat | ||
# Pani Xymena- 79 lat | # Pani Xymena - 79 lat | ||
Są dwie osoby "środkowe": Franciszek J. (16 lat) oraz Paweł A. lub też Tadeusz J.(18 lat). Zgodnie z definicją mediany warunek spełniany jest przez więcej niż jedną liczbę, a więc za medianę można przyjąć wszystkie liczby rzeczywiste z przedziału <16,18> (Lissowski G., Haman J., Jasiński M. 2011, s. 85). | Są dwie osoby "środkowe": Franciszek J. (16 lat) oraz Paweł A. lub też Tadeusz J.(18 lat). Zgodnie z definicją mediany warunek spełniany jest przez więcej niż jedną liczbę, a więc za medianę można przyjąć wszystkie liczby rzeczywiste z przedziału <16,18> (Lissowski G., Haman J., Jasiński M. 2011, s. 85). | ||
==Zobacz także== | ==Zobacz także== | ||
* | * https://home.agh.edu.pl/~adan/wyklady/SADw1.pdf | ||
* https://web2.ue.katowice.pl/trzesiok/wzory_stat.pdf | |||
* | |||
* https://chem.pg.edu.pl/documents/175289/4236053/Statystyka_podstawy.pdf | * https://chem.pg.edu.pl/documents/175289/4236053/Statystyka_podstawy.pdf | ||
{{infobox5|list1={{i5link|a=[[Kwartyl]]}} — {{i5link|a=[[Metody statystyczne]]}} — {{i5link|a=[[Estymacja]]}} — {{i5link|a=[[Poziom istotności]]}} — {{i5link|a=[[Percentyl]]}} — {{i5link|a=[[Kwantyl]]}} — {{i5link|a=[[Test Shapiro-Wilka]]}} — {{i5link|a=[[Test zgodności chi-kwadrat]]}} — {{i5link|a=[[Wariancja]]}} }} | |||
==Bibliografia== | ==Bibliografia== | ||
* Lissowski G., Haman J., Jasiński M. (2011) ''Podstawy statystyki dla socjologów'', Wydawnictwo Naukowe SCHOLAR, Warszawa | <noautolinks> | ||
* Pułaska-Turyna B. (2011), ''Statystyka dla ekonomistów | * Lissowski G., Haman J., Jasiński M. (2011), ''Podstawy statystyki dla socjologów'', Wydawnictwo Naukowe SCHOLAR, Warszawa | ||
* Rumsey | * Pułaska-Turyna B. (2011), ''Statystyka dla ekonomistów'', Difin, Warszawa | ||
* Wierzbiński J. (2008) | * Rumsey D. (2016), ''Statystyka dla bystrzaków'', Helion, Gliwice | ||
* Zieliński R. (2010), | * Wierzbiński J. (2008), ''Statystyka opisowa'', Wydawnictwo Naukowe Wydziału Zarządzania Uniwersytetu Warszawskiego, Warszawa | ||
* Zimny A. (2010) [https://depot.ceon.pl/bitstream/handle/123456789/12550/statystyka_opisowa.pdf?sequence=1 Statystyka opisowa] | * Zieliński R. (2010), ''O średniej arytmetycznej i medianie'', Matematyka stosowana, nr 11 | ||
*Żyżyński J. (2017), Statystyka opisowa i matematyczna dla zarządzania, Wydawnictwo Naukowe Wydziału Zarządzania Uniwersytetu Warszawskiego, Warszawa | * Zimny A. (2010), ''[https://depot.ceon.pl/bitstream/handle/123456789/12550/statystyka_opisowa.pdf?sequence=1 Statystyka opisowa]'' Państwowa Wyższa Szkoła Zawodowa w Koninie, Konin | ||
* Żyżyński J. (2017), ''Statystyka opisowa i matematyczna dla zarządzania'', Wydawnictwo Naukowe Wydziału Zarządzania Uniwersytetu Warszawskiego, Warszawa | |||
</noautolinks> | |||
{{a|Hang Claudia Ngo Thanh}} | {{a|Hang Claudia Ngo Thanh}} | ||
[[Kategoria: | [[Kategoria:Miary statystyczne]] | ||
{{#metamaster:description|Mediana to wartość środkowa w szeregu danych. Różni się od średniej, ale czasem wyniki są identyczne. Dowiedz się więcej o obliczaniu mediany i kwartyli.}} |
Aktualna wersja na dzień 21:36, 9 gru 2023
Mediana, wartość środkowa, wartość przeciętna, drugi kwartyl, piąty decyl lub też pięćdziesiąty centyl - wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Mediana to punkt w pewnym zbiorze danych liczbowych w którym poniżej oraz powyżej mieści się jednakowa liczba punktów danych. Deborah J. Rumsey podaje świetny przykład, aby pomóc zrozumieć znaczenie mediany. Porównał on medianę do pasów zieleni znajdujących się na drogach szybkiego ruchu oraz na autostradzie. Pas ten mieści się na samym środku jezdni, a po obu stronach, znajduje się dokładnie taka sama ilość pasów ruchu (Rumsey Deborah J. 2016, s. 69).
Mediana i średnia to dwie różne metody odwzorowywania środka zbiorowości, jednakże niekiedy ich wynik może być jednakowy.
Kwartyl drugi Q2 (mediana, wartość środkowa), to kwantyl, który dzieli uporządkowaną niemalejąco zbiorowość na dwie części w ten sposób, że połowa jednostek zbiorowości ma wartości zmiennej równe lub większe od mediany, stąd też mediana bywa nazywana wartością środkową.
Posiadając dane szczegółowe, najpierw należy uporządkować je od wartości najmniejszej do wartości największej, w następnej kolejności trzeba ponumerować dane od 1 do n. Następnie należy określić liczbę obserwacji n, gdy liczba obserwacji jest nieparzysta, to medianę obliczamy następującym wzorem: (n+1)/2, wówczas medianą jest wartość środkowa. Jeżeli liczebność zbiorowości jest liczba parzystą, przyjmuje się, że mediana jest średnią arytmetyczną dwóch środkowych (n/2 oraz n/2+1) wartości zmiennej (Pułaska-Turyna B. 2011, s. 58). Kwartyl pierwszy i trzeci z szeregu szczegółowego wyznacza się w sposób analogiczny jak medianę. Zbiorowość dzieli się na dwie rozłączne części: pierwszą, której jednostki przyjmują wartości nie większe od mediany i drugą, złożoną z pozostałych jednostek. Dla każdej z tych części można wyznaczyć ponownie medianę. Dla pierwszej części wartość mediany będzie odpowiadała kwartylowi pierwszemu (Q1), a dla drugiej - kwartylowi trzeciemu (Q3).
Wyznaczenie mediany z szeregu rozdzielczego punktowego sprowadza się do wskazania jednostki środkowej i odczytania wariantu zmiennej odpowiadającej tej jednostce. Określenie środkowej jednostki ułatwia kumulacja liczebności, która polega na kolejnym, narastającym sumowaniu liczebności dotyczących poszczególnych wariantów badanej zmiennej. Jeżeli kumulacji podlegają częstości względne, a nie liczebności absolutne, to otrzymany zbiór danych określa się mianem dystrybuanty empirycznej. Graficznym obrazem kształtowania się liczebności skumulowanej jest histogram liczebności skumulowanej lub diagram liczebności skumulowanej.
TL;DR
Mediana to wartość środkowa w zbiorze danych, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. Może być obliczana dla zbiorów uporządkowanych oraz rozdzielczych punktowych. Jej wartość zależy od liczby obserwacji - dla nieparzystej liczby jest to środkowa wartość, a dla parzystej jest to średnia arytmetyczna dwóch środkowych wartości. Przykłady obliczania mediany dla różnych zbiorów danych przedstawione w artykule.
Wzór
Zbiór danych {x1, x2,...,xn}
Jeżeli n jest liczbą:
Parzystą, to medianą jest liczba:
me=[xn/2+xn/2+1]/2
Nieparzystą, to medianą jest liczba:
me=[xn+1]/2
Przykłady
Przykład I
Lista mieszkańców pewnego osiedla prezentuje się następująco:
- Paweł A. - 18 lat
- Marcin S. - 4 lata
- Franciszek J. - 16 lat
- Tadeusz J. - 18 lat
- Irena J. - 9 lat
Aby móc ustalić medianę, należy uporządkować jednostki statystyczne od najmłodszej do najstarszej, czyli według zmiennej jakim jest "wiek".
- Marcin S. - 4 lata
- Irena J. - 9 lat
- Franciszek J. - 16 lat
- Paweł A. - 18 lat
- Tadeusz J. - 18 lat
Zbiorowość liczy 5 osób, "środkową" jest trzecia (po uporządkowaniu) jednostka statystyczna, czyli 16-letni Franciszek J. Mediana wieku wynosi zatem 16 lat (Lissowski G., Haman J., Jasiński M. 2011, s. 84-85).
Przykład II
Nasz zbiór danych liczy 6 osób. Macierz danych statystycznych po uporządkowaniu od najmniejszego do największego według wieku, prezentuje się następująco:
- Marcin S. - 4 lata
- Irena J. - 9 lat
- Franciszek J. - 16 lat
- Paweł A. - 18 lat
- Tadeusz J. - 18 lat
- Pani Xymena - 79 lat
Są dwie osoby "środkowe": Franciszek J. (16 lat) oraz Paweł A. lub też Tadeusz J.(18 lat). Zgodnie z definicją mediany warunek spełniany jest przez więcej niż jedną liczbę, a więc za medianę można przyjąć wszystkie liczby rzeczywiste z przedziału <16,18> (Lissowski G., Haman J., Jasiński M. 2011, s. 85).
Zobacz także
- https://home.agh.edu.pl/~adan/wyklady/SADw1.pdf
- https://web2.ue.katowice.pl/trzesiok/wzory_stat.pdf
- https://chem.pg.edu.pl/documents/175289/4236053/Statystyka_podstawy.pdf
Mediana wzór — artykuły polecane |
Kwartyl — Metody statystyczne — Estymacja — Poziom istotności — Percentyl — Kwantyl — Test Shapiro-Wilka — Test zgodności chi-kwadrat — Wariancja |
Bibliografia
- Lissowski G., Haman J., Jasiński M. (2011), Podstawy statystyki dla socjologów, Wydawnictwo Naukowe SCHOLAR, Warszawa
- Pułaska-Turyna B. (2011), Statystyka dla ekonomistów, Difin, Warszawa
- Rumsey D. (2016), Statystyka dla bystrzaków, Helion, Gliwice
- Wierzbiński J. (2008), Statystyka opisowa, Wydawnictwo Naukowe Wydziału Zarządzania Uniwersytetu Warszawskiego, Warszawa
- Zieliński R. (2010), O średniej arytmetycznej i medianie, Matematyka stosowana, nr 11
- Zimny A. (2010), Statystyka opisowa Państwowa Wyższa Szkoła Zawodowa w Koninie, Konin
- Żyżyński J. (2017), Statystyka opisowa i matematyczna dla zarządzania, Wydawnictwo Naukowe Wydziału Zarządzania Uniwersytetu Warszawskiego, Warszawa
Autor: Hang Claudia Ngo Thanh