Percentyl

Percentyl nazywany jest również centylem - to jedna z miar przeciętnych inaczej mówiąc położenia. Miary przeciętne charakteryzują zbiorowość statystyczną niezależnie od różnic występujących pomiędzy poszczególnymi jednostkami, które wchodzą w jej skład. Dokonują charakterystyki podobieństw zbiorowości pod względem wyróżnionej cechy zmiennej. Percentyl mierzy skupienie jednostek w znaczeniu procentowym, dzieląc zbiorowość na 100 równych części. Dzięki tej mierze można dla każdego numeru obserwacji uporządkowanej zbiorowości określić procent zbiorowości znajdującej się powyżej lub poniżej tej obserwacji. Biorąc pod uwagę przykładowo dwudziesty piąty percentyl, interpretuje się, że 25% obserwacji ma wartość mniejszą lub równą wartości percentyla dwudziestego piątego a 75% ma wartość większą lub równą tej wartości (A. Zimny 2010 s. 22).

Wyróżniamy też inne miary położenia. Najbardziej powszechna i najczęściej liczona to średnia arytmetyczna. Wartość która pojawia się najczęściej nazywamy modą lub dominantą, wartość środkowa zwana medianą, którą można określić jako wartość, poniżej której znajduje się 50% obserwacji i powyżej której znajduje się dalsze 50% obserwacji. Zatem percentyl pięćdziesiąty jest równy medianie. Ponadto percentyl 25 to inaczej kwartyl pierwszy (dolny) a percentyl 75 to kwartyl trzeci (górny) (A. Zimny 2010 s. 25).

Do wyznaczenia percentyli stosowane są takie same wzory jak dla mediany, chociaż wyrażają one inne części całości ( Aczel A. 2000, s. 29).

Percentyl=x_{0}+{h_{0} \over n_{0}}({numer~percentyla-N \over 100}-F_{-1})

,

gdzie:

x₀ - dolna granica przedziału, w którym znajduje się dany percentyl

h₀ - rozpiętość przedziału klasowego danego percentyla

n₀ - częstość przedziału danego percentyla

N - liczba obserwacji lub danych

F_-1 - częstość skumulowana przedziału poprzedzającego przedział zawierający percentyl.

Numer percentyla określa się za pomocą wzoru:

Numer~percentyla~pierwszego={N \over 100},~drugiego={2N \over 100},~itd.

.

Wartości percentyli znajdują zastosowanie w określaniu miar rozproszenia,które pozwalają wyznaczyć wartości charakteryzujące rozrzut danych. Bazują one na odległościach między punktami. Zaliczamy do nich:

rozstęp, czyli różnice między wartością najmniejszą i największą danej cechy;
odchylenie standardowe oraz wariancję która mierzy stopień rozproszenia pomiarów wokół średniej arytmetycznej;
współczynnik zmienności, który pozwala na ocenę stopnia jednorodności badanej zbiorowości.

Skala centylowa

Analiza percentylowa umożliwia bardziej dokładną ocenę rozkładu empirycznego. Rozkład wyników w skali centylowej ma prostokątny charakter - każdej jednostce przyporządkowany jest 1% obserwacji. Skala centylowa ma charakter skali rangowej, centyl 50 odpowiada medianie rozkładu. Interpretacja skali jest bardzo prosta - centyl 60 należy rozumieć, że 60% populacji osiąga taki wynik bądź niższy. Wadą skali centylowej jest fakt, iż określonemu przedziałowi nie odpowiadają jednakowe różnice w wartości cechy badanej (Żechowski C. 2008 s 184).

Wady i ograniczenia percentyli

Różnice w wartościach cechy badanej

Wartości percentyli, mierzące pozycję danego wyniku na skali, mogą wprowadzać pewne błędy interpretacyjne ze względu na nierównomierne różnice między przedziałami na skali centylowej. Oznacza to, że różnica między 20. percentylem a 30. percentylem może być inna niż różnica między 80. percentylem a 90. percentylem. Tego rodzaju nieregularności mogą wpływać na trafność analizy i interpretacji wyników.

Aby uniknąć tych błędów, ważne jest uwzględnienie pełnego kontekstu analizy i nie poleganie jedynie na wartościach percentyli. Na przykład, warto wziąć pod uwagę rozkład całej próby danych, a nie tylko skupiać się na konkretnych punktach percentyli. Taki podejście pozwoli na bardziej kompleksowe zrozumienie sytuacji i uniknięcie jednostronnych wniosków.

Zależność od rozkładu danych

Inną wadą percentyli jest ich zależność od rozkładu danych. Percentyle nie uwzględniają kształtu rozkładu ani ewentualnych odstępstw od normalności. Jeśli rozkład danych jest skrzywiony lub zawiera odstępstwa, wartości percentyli mogą być zniekształcone i nieodpowiednie do reprezentowania ogólnej populacji.

W przypadku rozkładów niestandardowych lub danych, które nie spełniają założeń dotyczących normalności, warto rozważyć inne metody statystyczne, które lepiej odzwierciedlają charakterystykę próby. Można na przykład użyć kwantyli lub innych miar pozycyjnych, które mogą być bardziej odpornymi na skrzywienie lub odstępstwa od normalności.

Brak informacji o dokładnych wartościach

Percentyle same w sobie nie dostarczają informacji na temat dokładnych wartości w próbie danych. Oznacza to, że trudno jest określić, jakie są rzeczywiste wartości dla poszczególnych percentyli. Może to być szczególnie problematyczne, gdy analizujemy duże zbiory danych.

Jednym z rozwiązań tego problemu jest użycie interpolacji, czyli estymacji wartości pomiędzy dwoma znającymi percentylami. Interpolacja pozwala na szacowanie dokładnych wartości dla konkretnych percentyli, jednak może wprowadzać pewne niedokładności i błędy, zwłaszcza gdy próba danych jest mała.

Brak wrażliwości na ekstremalne wartości

Percentyle, ze względu na swoją naturę mierzenia pozycji na skali, nie są wrażliwe na ekstremalne wartości. Oznacza to, że bardzo duże lub bardzo małe wartości w próbie danych mogą mieć niewielki wpływ na wartości percentyli. Dla niektórych analiz, zwłaszcza tych dotyczących skrajnych przypadków, percentyle mogą być niewystarczające.

W takich sytuacjach, warto rozważyć użycie innych miar statystycznych, takich jak odchylenie standardowe, rozstęp międzykwartylowy czy mediany, które są bardziej wrażliwe na ekstremalne wartości. Te miary pozwalają na lepsze zrozumienie rozproszenia danych i uwzględnienie skrajnych przypadków.

Percentyl — artykuły polecane
Metody statystyczne — Dominanta — Współczynnik korelacji rang Spearmana — Rozkład częstości — Wariancja — Średnia — Kwartyl — Skala interwałowa — Test zgodności chi-kwadrat — Karta oceny pracownika

Bibliografia

Aczel A. (2018), Statystyka w zarządzaniu, Wydawnictwo Naukowe PWN, Warszawa
Koronacki J., Mielniczuk J. (2006), Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych, Wydawnictwo Naukowo-Techniczne, Warszawa
Nawarycz T., Pytel K., Ostrowska-Nawarycz L. (2018), Kalkulator wartości percentylowych cech medycznych, Łódź
Niewiadomski A. (2015) Reprezentowanie informacji lingwistycznej. Logika rozmyta typu 2, Instytut Informatyki, Politechnika Łódźka, Warszawa
Starzyńska W. (2006), Statystyka praktyczna, Wydawnictwo Naukowe PWN, Warszawa
Woźniak M. (2002), Statystyka ogólna, Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków
Zeliaś A. (2001), Metody statystyczne, Polskie Wydawnictwo Ekonomiczne, Warszawa
Zimny A. (2010), Statystyka opisowa Państwowa Wyższa Szkoła Zawodowa w Koninie, Konin
Żechowski C. (2008), Polska wersja Kwestionariusza Zaburzeń Odżywiania',' Psychiatria Polska, numer 2

Autor: Anna Kluszczyńska

.

Anonimowy

Szukaj

Percentyl

Przestrzenie nazw

Więcej

Działania na stronie

Spis treści

Skala centylowa

Wady i ograniczenia percentyli

Różnice w wartościach cechy badanej

Zależność od rozkładu danych

Brak informacji o dokładnych wartościach

Brak wrażliwości na ekstremalne wartości

Bibliografia

Nawigacja

Encyklopedia

Narzędzia wiki

Narzędzia wiki

Anonimowy

Szukaj

Percentyl

Skala centylowa

Wady i ograniczenia percentyli

Różnice w wartościach cechy badanej

Zależność od rozkładu danych

Brak informacji o dokładnych wartościach

Brak wrażliwości na ekstremalne wartości

Bibliografia

Nawigacja

Narzędzia wiki

Narzędzia dla stron

Kategorie