Percentyl

Z Encyklopedia Zarządzania
Wersja z dnia 08:00, 19 sty 2024 autorstwa Zybex (dyskusja | edycje)
(różn.) ← poprzednia wersja | przejdź do aktualnej wersji (różn.) | następna wersja → (różn.)

Percentyl nazywany jest również centylem - to jedna z miar przeciętnych inaczej mówiąc położenia. Miary przeciętne charakteryzują zbiorowość statystyczną niezależnie od różnic występujących pomiędzy poszczególnymi jednostkami, które wchodzą w jej skład. Dokonują charakterystyki podobieństw zbiorowości pod względem wyróżnionej cechy zmiennej. Percentyl mierzy skupienie jednostek w znaczeniu procentowym, dzieląc zbiorowość na 100 równych części. Dzięki tej mierze można dla każdego numeru obserwacji uporządkowanej zbiorowości określić procent zbiorowości znajdującej się powyżej lub poniżej tej obserwacji. Biorąc pod uwagę przykładowo dwudziesty piąty percentyl, interpretuje się, że 25% obserwacji ma wartość mniejszą lub równą wartości percentyla dwudziestego piątego a 75% ma wartość większą lub równą tej wartości (A. Zimny 2010 s. 22).

Wyróżniamy też inne miary położenia. Najbardziej powszechna i najczęściej liczona to średnia arytmetyczna. Wartość która pojawia się najczęściej nazywamy modą lub dominantą, wartość środkowa zwana medianą, którą można określić jako wartość, poniżej której znajduje się 50% obserwacji i powyżej której znajduje się dalsze 50% obserwacji. Zatem percentyl pięćdziesiąty jest równy medianie. Ponadto percentyl 25 to inaczej kwartyl pierwszy (dolny) a percentyl 75 to kwartyl trzeci (górny) (A. Zimny 2010 s. 25).

Do wyznaczenia percentyli stosowane są takie same wzory jak dla mediany, chociaż wyrażają one inne części całości ( Aczel A. 2000, s. 29).
,
gdzie:
x0 - dolna granica przedziału, w którym znajduje się dany percentyl
h0 - rozpiętość przedziału klasowego danego percentyla
n0 - częstość przedziału danego percentyla
N - liczba obserwacji lub danych
F-1 - częstość skumulowana przedziału poprzedzającego przedział zawierający percentyl.
Numer percentyla określa się za pomocą wzoru:
.
Wartości percentyli znajdują zastosowanie w określaniu miar rozproszenia,które pozwalają wyznaczyć wartości charakteryzujące rozrzut danych. Bazują one na odległościach między punktami. Zaliczamy do nich:

Skala centylowa

Analiza percentylowa umożliwia bardziej dokładną ocenę rozkładu empirycznego. Rozkład wyników w skali centylowej ma prostokątny charakter - każdej jednostce przyporządkowany jest 1% obserwacji. Skala centylowa ma charakter skali rangowej, centyl 50 odpowiada medianie rozkładu. Interpretacja skali jest bardzo prosta - centyl 60 należy rozumieć, że 60% populacji osiąga taki wynik bądź niższy. Wadą skali centylowej jest fakt, iż określonemu przedziałowi nie odpowiadają jednakowe różnice w wartości cechy badanej (Żechowski C. 2008 s 184).

Wady i ograniczenia percentyli

Różnice w wartościach cechy badanej

Wartości percentyli, mierzące pozycję danego wyniku na skali, mogą wprowadzać pewne błędy interpretacyjne ze względu na nierównomierne różnice między przedziałami na skali centylowej. Oznacza to, że różnica między 20. percentylem a 30. percentylem może być inna niż różnica między 80. percentylem a 90. percentylem. Tego rodzaju nieregularności mogą wpływać na trafność analizy i interpretacji wyników.

Aby uniknąć tych błędów, ważne jest uwzględnienie pełnego kontekstu analizy i nie poleganie jedynie na wartościach percentyli. Na przykład, warto wziąć pod uwagę rozkład całej próby danych, a nie tylko skupiać się na konkretnych punktach percentyli. Taki podejście pozwoli na bardziej kompleksowe zrozumienie sytuacji i uniknięcie jednostronnych wniosków.

Zależność od rozkładu danych

Inną wadą percentyli jest ich zależność od rozkładu danych. Percentyle nie uwzględniają kształtu rozkładu ani ewentualnych odstępstw od normalności. Jeśli rozkład danych jest skrzywiony lub zawiera odstępstwa, wartości percentyli mogą być zniekształcone i nieodpowiednie do reprezentowania ogólnej populacji.

W przypadku rozkładów niestandardowych lub danych, które nie spełniają założeń dotyczących normalności, warto rozważyć inne metody statystyczne, które lepiej odzwierciedlają charakterystykę próby. Można na przykład użyć kwantyli lub innych miar pozycyjnych, które mogą być bardziej odpornymi na skrzywienie lub odstępstwa od normalności.

Brak informacji o dokładnych wartościach

Percentyle same w sobie nie dostarczają informacji na temat dokładnych wartości w próbie danych. Oznacza to, że trudno jest określić, jakie są rzeczywiste wartości dla poszczególnych percentyli. Może to być szczególnie problematyczne, gdy analizujemy duże zbiory danych.

Jednym z rozwiązań tego problemu jest użycie interpolacji, czyli estymacji wartości pomiędzy dwoma znającymi percentylami. Interpolacja pozwala na szacowanie dokładnych wartości dla konkretnych percentyli, jednak może wprowadzać pewne niedokładności i błędy, zwłaszcza gdy próba danych jest mała.

Brak wrażliwości na ekstremalne wartości

Percentyle, ze względu na swoją naturę mierzenia pozycji na skali, nie są wrażliwe na ekstremalne wartości. Oznacza to, że bardzo duże lub bardzo małe wartości w próbie danych mogą mieć niewielki wpływ na wartości percentyli. Dla niektórych analiz, zwłaszcza tych dotyczących skrajnych przypadków, percentyle mogą być niewystarczające.

W takich sytuacjach, warto rozważyć użycie innych miar statystycznych, takich jak odchylenie standardowe, rozstęp międzykwartylowy czy mediany, które są bardziej wrażliwe na ekstremalne wartości. Te miary pozwalają na lepsze zrozumienie rozproszenia danych i uwzględnienie skrajnych przypadków.


Percentylartykuły polecane
Metody statystyczneDominantaWspółczynnik korelacji rang SpearmanaRozkład częstościWariancjaŚredniaKwartylSkala interwałowaTest zgodności chi-kwadratKarta oceny pracownika

Bibliografia

  • Aczel A. (2018), Statystyka w zarządzaniu, Wydawnictwo Naukowe PWN, Warszawa
  • Koronacki J., Mielniczuk J. (2006), Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych, Wydawnictwo Naukowo-Techniczne, Warszawa
  • Nawarycz T., Pytel K., Ostrowska-Nawarycz L. (2018), Kalkulator wartości percentylowych cech medycznych, Łódź
  • Niewiadomski A. (2015) Reprezentowanie informacji lingwistycznej. Logika rozmyta typu 2, Instytut Informatyki, Politechnika Łódźka, Warszawa
  • Starzyńska W. (2006), Statystyka praktyczna, Wydawnictwo Naukowe PWN, Warszawa
  • Woźniak M. (2002), Statystyka ogólna, Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków
  • Zeliaś A. (2001), Metody statystyczne, Polskie Wydawnictwo Ekonomiczne, Warszawa
  • Zimny A. (2010), Statystyka opisowa Państwowa Wyższa Szkoła Zawodowa w Koninie, Konin
  • Żechowski C. (2008), Polska wersja Kwestionariusza Zaburzeń Odżywiania',' Psychiatria Polska, numer 2


Autor: Anna Kluszczyńska

.