Metody statystyczne

Metody statystyczne
Polecane artykuły

Metody statystyczne – służą do badania i opisu zbiorowości statystycznych. Do nich zaliczamy:

  • Miary położenia (przeciętne, kwartyle)
  • Miary zmienności (miary rozproszenia, dyspersji)
  • Miary asymetrii lub skośności
  • Miary spłaszczenia i koncentracji

Miary położenia

Służą do określenia położenia zmiennych. Stosuje się je jedynie w stosunku do zbiorowości jednorodnej.

Podział

  1. Przeciętne – rozpatrywana jest zbiorowość statystyczna jako całość i wskazywana na przeciętny poziom cechy, pomijając przy tym różnice pomiędzy poszczególnymi jednostkami. Są to także miary mianowane. Dzielą się na:
  • średnie klasyczne (obliczane przy użyciu wszystkich wartości szeregu):
  • średnie pozycyjne (wyznaczane biorąc pod uwagę konkretną pozycję jednostek statystycznych w rozkładzie badanej zmiennej):
  1. Kwartyle – informują o rozkładzie zmiennej, opisują kształt tego rozkładu (np. decyle) czy szacują podstawowe parametry rozkładu. Stosuje się je także w przypadku szeregu rozdzielczego o otwartych przedziałach klasowych pierwszym i ostatnim.

Średnie pozycyjne

Modalna (dominanta, wartość typowa, wartość najczęstsza, moda)

Jest to wartość zmiennej cechy statystycznej, która występuje najczęściej w danej zbiorowości statystycznej. Wyznacza się ją zazwyczaj z rozkładów jednomodalnych – posiadających koncentrację jednostek statystycznych przy danej wartości cechy. W szeregach szczegółowych modalną liczymy zliczając jednostki zbiorowości o identycznej wartości cechy. Modalna to wartość cechy, która występuje najwięcej razy. W sytuacji gdy żadna z wartości badanej zmiennej nie występuje więcej niż raz wyznaczenie modalnej może być niemożliwe. W przypadku gdy badana zbiorowość jest liczna w celu ustalenia modalnej budujemy szereg przedziałowy w oparciu o wyjściowy szereg szczegółowy. W szeregach punktowych i strukturalnych modalna jest wartością lub odmianą cechy, której odpowiada największa liczebność. W szeregach z przedziałami klasowymi wprost można określić jedynie przedział, w którym modalna występuje (jest to przedział o największej liczebności). Jest to wtedy wartość abstrakcyjna. Na przykład możemy powiedzieć, że osoby bezrobotne w Polsce zarejestrowani na dzień 31.12.2006r., ale posiadający również staż pracy przepracowali najczęściej od 1 roku do 5 lat.
Modalną wyznaczamy tylko dla szeregów, które spełniają warunki:

  • są to rozkłady jednomodalne
  • jeśli występują w postaci szeregów przedziałowych to przedziały muszą mieć jednakowe rozpiętości lub co najmniej przedział modalnej i dwa przedziały wprost sąsiadujące z przedziałem modalnej muszą mieć takie same rozpiętości, zaś pozostałe przedziały powinny mieć nie mniejszą rozpiętość)
  • asymetria rozkładu przedstawiona przy użyciu szeregu przedziałowego jest umiarkowana (w przypadku szeregów skrajnie asymetrycznych czyli gdy modalna wystąpiłaby w skrajnych przedziałach w większości wypadków nie wyznacza się modalnej)
  • Szeregi, które są podstawą do ustalenia modalnej mogą posiadać otwarte przedziały klasowe.

Mediana (kwartyl drugi, wartość środkowa)

Jest to wartość cechy zmiennej dzieląca szereg na 2 równe części pod względem liczebności: 50% jednostek o wartościach większych lub równych medianie oraz 50% o wartościach mniejszych lub jej równych.

Miary zmienności

Pozwalają one na ustalenie stopnia zróżnicowania (zmienności) badanej zbiorowości pod względem jakiejś cechy. Miary te dzielą się na:

  • bezwzględne (absolutne):
  • rozstęp
  • rozstęp kwartylowy lub decylowy
  • odchylenie przeciętne
  • odchylenie ćwiartkowe
  • wariancja
  • odchylenie standardowe
  • względne (relatywne):
  • współczynnik zmienności

Bezwzględne miary zmienności

Rozstęp

Jest jedną z najprostszych miar rozproszenia. Jest to różnica między największą a najmniejszą wartością zmiennej w analizowanej zbiorowości:

\(R=\underset{\i}{\max}(x_i) - \underset{\i}{\min}(x_i)\)

Stosuje się go przede wszystkim w sytuacji, gdy potrzeba szybko określić obszar zmienności badanej zmiennej.

Rozstęp kwartylowy/decylowy

Stosuje się je gdy szereg rozdzielczy posiada otwarte przedziały klasowe:

\(R_{Q}=Q_{3}-Q_{1}\)

lub

\(R_{D}=D_{9}-D_{1}\)

Odchylenie przeciętne

Jest ono średnią arytmetyczną z bezwzględnych wartości odchyleń zmiennej od jej średniej:

\(d=\frac {1}{n}\sum\limits_{i=1}^n {|x_1- \bar x\ |}\)

Mówi nam o tym, o ile jednostki danej zbiorowości różnią się średnio ze względu na wartość badanej zmiennej od jej średniej arytmetycznej.

Odchylenie ćwiartkowe

Jest równe połowie różnicy między kwartylami górnym (trzecim) a dolnym (pierwszym):

\(Q=\frac {1}{2}(Q_3-Q_1)\)

Ono określa zróżnicowanie tylko części (50%) jednostek badanej zbiorowości położonych centralnie, pomiędzy 2 kwartylami.

Wariancja

Jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości zmiennej od ich średniej arytmetycznej:

\(s^2=\frac {1}{n}\sum\limits_{i=1}^n {(x_i-\bar x\))}^2\)

Wariancja jest wielkością nieujemną oraz miarą mianowaną. Jest stosowana przy budowaniu wielu parametrów, ale nie należy interpretować jej wyniku.

Odchylenie standardowe

Jest ono pierwiastkiem kwadratowym z wariancji:

\(s=\sqrt{s^2}\)

Mówi nam o tym, o ile jednostki badanej zbiorowości różnią się od średniej arytmetycznej tej zmiennej. Nie może być stosowane do porównywania zmienności między 2 lub większą liczbą zbiorowości pod względem tej samej zmiennej.

Względne miary zmienności

Współczynnik zmienności

Jest to względna miara zróżnicowania, która mówi jak silnie zróżnicowana jest badana zbiorowość pod względem cechy zmiennej i umożliwia ocenę średniej arytmetycznej. Jest on ilorazem bezwzględnej miary zmienności do odpowiednich wartości średnich (najczęściej odchylenie standardowe do średniej arytmetycznej i wyrażane jest w procentach):

\(V_s=\frac {s}{|\bar x\|} * 100\%\), \({\bar x\ > 0\)

Im większa jest wartość współczynnika tym silniejsze jest zróżnicowanie i na odwrót.

Miary asymetrii lub skośności

Współczynnik asymetrii

Określa on zarówno kierunek, jak i siłę asymetrii.

\(As=\frac {\bar x\ - Mo}{s}\)

Jeżeli: As=0 – rozkład symetryczny As>0 – asymetria prawostronna As<0 – asymetria lewostronna

Moment standaryzowany trzeciego rzędu

Jest on bardziej precyzyjny niż wcześniej wskazany:

\(As=\frac {m_3}{s^3}\)

Miary spłaszczenia i koncentracji

Współczynnik koncentracji (kurtoza)

Otrzymujemy go poprzez podzielenie momentu centralnego czwartego rzędu przez odchylenie standardowe podniesione do potęgi 4:

\(K=\frac {m_4}{s^4}\)

gdzie\[m_4\] - moment centralny czwartego rzedu

\(s^4\) - odchylenie standardowe do potęgi czwartej

Im wyższa jest wartość współczynnika K, tym krzywa liczebności wskazuje na tendencję do skupiania się jednostek wokół średniej.

Współczynnik ekscesu

Przyjmuje on wartość =0 gdy rozkład ma kształt normalny. Mówi nam czy koncentracja wartości badanej zmiennej wokół średniej w danym rozkładzie jest większa czy mniejsza niż w zbiorowości o rozkładzie normalnym:

\(K''=\frac {m_4}{s^4}-3\)

Współczynnik koncentracji Lorenza

Określa on stopień natężenia rozkładu ogólnej sumy wartości badanej cechy na poszczególne jednostki zbiorowości statystycznej:

\(K_L=\frac {a}{0,5}=\frac {0,5-b}{0,5}\)

gdzie:

a - powierzchnia pola zawartego między krzywą koncentracji a linią równomiernego rozkładu

b - powierzchnia pola leżącego pod krzywą koncentracji

Patrz także:

Bibliografia

  • Sobczyk M. (). Statystyka, Wydawnictwo Naukowe PWN,
  • Woźniak M.(red) (1997), Statystyka ogólna, Wyd. II poprawione, Akademia Ekonomiczna w Krakowie, Kraków,
  • Zeliaś A. (2000), Metody Statystyczne, Polskie Wydawnictwo Ekonomiczne, Warszawa.
  • Zimny A. (2010) Statystyka opisowa. Materiały pomocnicze do ćwiczeń, "Statystyka opisowa", Państwowa Wyższa Szkoła Zawodowa w Koninie

Autor: Monika Bizub, Aleksandra Duda