Metody statystyczne
Metody statystyczne |
---|
Polecane artykuły |
Metody statystyczne – służą do badania i opisu zbiorowości statystycznych. Do nich zaliczamy:
- Miary położenia (przeciętne, kwartyle)
- Miary zmienności (miary rozproszenia, dyspersji)
- Miary asymetrii lub skośności
- Miary spłaszczenia i koncentracji
TL;DR
Metody statystyki opisowej służą do badania i opisu zbiorowości statystycznych. W artykule omówiono miary położenia, miary zmienności, miary asymetrii i skośności oraz miary spłaszczenia i koncentracji. Przedstawiono definicje i zastosowania poszczególnych miar.
Miary położenia
Służą do określenia położenia zmiennych. Stosuje się je jedynie w stosunku do zbiorowości jednorodnej.
Podział
- Przeciętne – rozpatrywana jest zbiorowość statystyczna jako całość i wskazywana na przeciętny poziom cechy, pomijając przy tym różnice pomiędzy poszczególnymi jednostkami. Są to także miary mianowane. Dzielą się na:
- średnie klasyczne (obliczane przy użyciu wszystkich wartości szeregu):
- średnia arytmetyczna
- średnia geometryczna
- średnia harmoniczna
- średnia kwadratowa
- średnie pozycyjne (wyznaczane biorąc pod uwagę konkretną pozycję jednostek statystycznych w rozkładzie badanej zmiennej):
- Kwartyle – informują o rozkładzie zmiennej, opisują kształt tego rozkładu (np. decyle) czy szacują podstawowe parametry rozkładu. Stosuje się je także w przypadku szeregu rozdzielczego o otwartych przedziałach klasowych pierwszym i ostatnim.
Średnie pozycyjne
Modalna (dominanta, wartość typowa, wartość najczęstsza, moda)
Jest to wartość zmiennej cechy statystycznej, która występuje najczęściej w danej zbiorowości statystycznej. Wyznacza się ją zazwyczaj z rozkładów jednomodalnych – posiadających koncentrację jednostek statystycznych przy danej wartości cechy.
W szeregach szczegółowych modalną liczymy zliczając jednostki zbiorowości o identycznej wartości cechy. Modalna to wartość cechy, która występuje najwięcej razy. W sytuacji gdy żadna z wartości badanej zmiennej nie występuje więcej niż raz wyznaczenie modalnej może być niemożliwe. W przypadku gdy badana zbiorowość jest liczna w celu ustalenia modalnej budujemy szereg przedziałowy w oparciu o wyjściowy szereg szczegółowy.
W szeregach punktowych i strukturalnych modalna jest wartością lub odmianą cechy, której odpowiada największa liczebność.
W szeregach z przedziałami klasowymi wprost można określić jedynie przedział, w którym modalna występuje (jest to przedział o największej liczebności). Jest to wtedy wartość abstrakcyjna.
Na przykład możemy powiedzieć, że osoby bezrobotne w Polsce zarejestrowani na dzień 31.12.2006r., ale posiadający również staż pracy przepracowali najczęściej od 1 roku do 5 lat.
Modalną wyznaczamy tylko dla szeregów, które spełniają warunki:
- są to rozkłady jednomodalne
- jeśli występują w postaci szeregów przedziałowych to przedziały muszą mieć jednakowe rozpiętości lub co najmniej przedział modalnej i dwa przedziały wprost sąsiadujące z przedziałem modalnej muszą mieć takie same rozpiętości, zaś pozostałe przedziały powinny mieć nie mniejszą rozpiętość)
- asymetria rozkładu przedstawiona przy użyciu szeregu przedziałowego jest umiarkowana (w przypadku szeregów skrajnie asymetrycznych czyli gdy modalna wystąpiłaby w skrajnych przedziałach w większości wypadków nie wyznacza się modalnej)
- Szeregi, które są podstawą do ustalenia modalnej mogą posiadać otwarte przedziały klasowe.
Mediana (kwartyl drugi, wartość środkowa)
Jest to wartość cechy zmiennej dzieląca szereg na 2 równe części pod względem liczebności: 50% jednostek o wartościach większych lub równych medianie oraz 50% o wartościach mniejszych lub jej równych.
Miary zmienności
Pozwalają one na ustalenie stopnia zróżnicowania (zmienności) badanej zbiorowości pod względem jakiejś cechy. Miary te dzielą się na:
- bezwzględne (absolutne):
- rozstęp
- rozstęp kwartylowy lub decylowy
- odchylenie przeciętne
- odchylenie ćwiartkowe
- wariancja
- odchylenie standardowe
- względne (relatywne):
- współczynnik zmienności
Bezwzględne miary zmienności
Rozstęp
Jest jedną z najprostszych miar rozproszenia. Jest to różnica między największą a najmniejszą wartością zmiennej w analizowanej zbiorowości:
Stosuje się go przede wszystkim w sytuacji, gdy potrzeba szybko określić obszar zmienności badanej zmiennej.
Rozstęp kwartylowy/decylowy
Stosuje się je gdy szereg rozdzielczy posiada otwarte przedziały klasowe:
lub
Odchylenie przeciętne
Jest ono średnią arytmetyczną z bezwzględnych wartości odchyleń zmiennej od jej średniej:
Mówi nam o tym, o ile jednostki danej zbiorowości różnią się średnio ze względu na wartość badanej zmiennej od jej średniej arytmetycznej.
Odchylenie ćwiartkowe
Jest równe połowie różnicy między kwartylami górnym (trzecim) a dolnym (pierwszym):
Ono określa zróżnicowanie tylko części (50%) jednostek badanej zbiorowości położonych centralnie, pomiędzy 2 kwartylami.
Wariancja
Jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości zmiennej od ich średniej arytmetycznej:
Wariancja jest wielkością nieujemną oraz miarą mianowaną. Jest stosowana przy budowaniu wielu parametrów, ale nie należy interpretować jej wyniku.
Odchylenie standardowe
Jest ono pierwiastkiem kwadratowym z wariancji:
Mówi nam o tym, o ile jednostki badanej zbiorowości różnią się od średniej arytmetycznej tej zmiennej. Nie może być stosowane do porównywania zmienności między 2 lub większą liczbą zbiorowości pod względem tej samej zmiennej.
Względne miary zmienności
Współczynnik zmienności
Jest to względna miara zróżnicowania, która mówi jak silnie zróżnicowana jest badana zbiorowość pod względem cechy zmiennej i umożliwia ocenę średniej arytmetycznej. Jest on ilorazem bezwzględnej miary zmienności do odpowiednich wartości średnich (najczęściej odchylenie standardowe do średniej arytmetycznej i wyrażane jest w procentach):
Im większa jest wartość współczynnika tym silniejsze jest zróżnicowanie i na odwrót.
Miary asymetrii lub skośności
Współczynnik asymetrii
Określa on zarówno kierunek, jak i siłę asymetrii.
Jeżeli: As=0 – rozkład symetryczny As>0 – asymetria prawostronna As<0 – asymetria lewostronna
Moment standaryzowany trzeciego rzędu
Jest on bardziej precyzyjny niż wcześniej wskazany:
Miary spłaszczenia i koncentracji
Współczynnik koncentracji (kurtoza)
Otrzymujemy go poprzez podzielenie momentu centralnego czwartego rzędu przez odchylenie standardowe podniesione do potęgi 4:
gdzie:
- moment centralny czwartego rzedu
- odchylenie standardowe do potęgi czwartej
Im wyższa jest wartość współczynnika K, tym krzywa liczebności wskazuje na tendencję do skupiania się jednostek wokół średniej.
Współczynnik ekscesu
Przyjmuje on wartość =0 gdy rozkład ma kształt normalny. Mówi nam czy koncentracja wartości badanej zmiennej wokół średniej w danym rozkładzie jest większa czy mniejsza niż w zbiorowości o rozkładzie normalnym:
Współczynnik koncentracji Lorenza
Określa on stopień natężenia rozkładu ogólnej sumy wartości badanej cechy na poszczególne jednostki zbiorowości statystycznej:
gdzie:
a - powierzchnia pola zawartego między krzywą koncentracji a linią równomiernego rozkładu
b - powierzchnia pola leżącego pod krzywą koncentracji
Patrz także:
- Wskaźniki iloczynu skalarnego
- Wariancja składnika resztowego
- Skala interwałowa
- Skalowanie wielowymiarowe
- Próg absolutny
- Operat losowania
- Obszar odrzucenia
- Ocena absolutna
- Modele tendencji rozwojowej w planowaniu
- Indukcja eliminacyjna
- Funkcja regresji kosztów i przychodów
Bibliografia
- Sobczyk M. (). Statystyka, Wydawnictwo Naukowe PWN,
- Woźniak M.(red) (1997), Statystyka ogólna, Wyd. II poprawione, Akademia Ekonomiczna w Krakowie, Kraków,
- Zeliaś A. (2000), Metody Statystyczne, Polskie Wydawnictwo Ekonomiczne, Warszawa.
- Zimny A. (2010) Statystyka opisowa. Materiały pomocnicze do ćwiczeń, "Statystyka opisowa", Państwowa Wyższa Szkoła Zawodowa w Koninie
Autor: Monika Bizub, Aleksandra Duda