Metody statystyczne: Różnice pomiędzy wersjami
m (Czyszczenie tekstu) |
|||
Linia 14: | Linia 14: | ||
}} | }} | ||
'''Metody [[statystyka opisowa|statystyczne]]''' | '''Metody [[statystyka opisowa|statystyczne]]''' - służą do badania i opisu [[zbiorowość statystyczna|zbiorowości statystycznych]]. Do nich zaliczamy: | ||
:*Miary położenia (przeciętne, [[kwartyl]]e) | :* Miary położenia (przeciętne, [[kwartyl]]e) | ||
:*Miary zmienności (miary rozproszenia, dyspersji) | :* Miary zmienności (miary rozproszenia, dyspersji) | ||
:*Miary asymetrii lub skośności | :* Miary asymetrii lub skośności | ||
:*Miary spłaszczenia i koncentracji | :* Miary spłaszczenia i koncentracji | ||
==TL;DR== | ==TL;DR== | ||
Metody statystyki opisowej służą do badania i opisu zbiorowości statystycznych. W artykule omówiono miary położenia, miary zmienności, miary asymetrii i skośności oraz miary spłaszczenia i koncentracji. Przedstawiono definicje i zastosowania poszczególnych miar. | Metody statystyki opisowej służą do badania i opisu zbiorowości statystycznych. W artykule omówiono miary położenia, miary zmienności, miary asymetrii i skośności oraz miary spłaszczenia i koncentracji. Przedstawiono definicje i zastosowania poszczególnych miar. | ||
Linia 26: | Linia 27: | ||
===Podział=== | ===Podział=== | ||
# ''Przeciętne'' | # ''Przeciętne'' - rozpatrywana jest [[zbiorowość statystyczna]] jako całość i wskazywana na przeciętny poziom cechy, pomijając przy tym różnice pomiędzy poszczególnymi jednostkami. Są to także miary mianowane. Dzielą się na: | ||
:*[[średnia|średnie]] klasyczne (obliczane przy użyciu wszystkich wartości szeregu): | :* [[średnia|średnie]] klasyczne (obliczane przy użyciu wszystkich wartości szeregu): | ||
::*średnia arytmetyczna | ::*średnia arytmetyczna | ||
::*[[średnia geometryczna]] | ::* [[średnia geometryczna]] | ||
::*średnia harmoniczna | ::*średnia harmoniczna | ||
::*średnia kwadratowa | ::*średnia kwadratowa | ||
:*średnie pozycyjne (wyznaczane biorąc pod uwagę konkretną pozycję jednostek statystycznych w rozkładzie badanej zmiennej): | :*średnie pozycyjne (wyznaczane biorąc pod uwagę konkretną pozycję jednostek statystycznych w rozkładzie badanej zmiennej): | ||
::*[[mediana]] | ::* [[mediana]] | ||
::*[[dominanta|modalna]] | ::* [[dominanta|modalna]] | ||
# ''Kwartyle'' | # ''Kwartyle'' - informują o rozkładzie zmiennej, opisują kształt tego rozkładu (np. decyle) czy szacują podstawowe parametry rozkładu. Stosuje się je także w przypadku szeregu rozdzielczego o otwartych przedziałach klasowych pierwszym i ostatnim. | ||
===Średnie pozycyjne=== | ===Średnie pozycyjne=== | ||
====Modalna (dominanta, wartość typowa, wartość najczęstsza, moda)==== | ====Modalna (dominanta, wartość typowa, wartość najczęstsza, moda)==== | ||
Jest to wartość zmiennej cechy statystycznej, która występuje najczęściej w danej [[Zbiorowość statystyczna|zbiorowości statystycznej]]. Wyznacza się ją zazwyczaj z rozkładów jednomodalnych | Jest to wartość zmiennej cechy statystycznej, która występuje najczęściej w danej [[Zbiorowość statystyczna|zbiorowości statystycznej]]. Wyznacza się ją zazwyczaj z rozkładów jednomodalnych - posiadających koncentrację jednostek statystycznych przy danej wartości cechy. | ||
W szeregach szczegółowych modalną liczymy zliczając jednostki zbiorowości o identycznej wartości cechy. Modalna to wartość cechy, która występuje najwięcej razy. W sytuacji gdy żadna z wartości badanej zmiennej nie występuje więcej niż raz wyznaczenie modalnej może być niemożliwe. W przypadku gdy badana zbiorowość jest liczna w celu ustalenia modalnej budujemy szereg przedziałowy w oparciu o wyjściowy szereg szczegółowy. | W szeregach szczegółowych modalną liczymy zliczając jednostki zbiorowości o identycznej wartości cechy. Modalna to wartość cechy, która występuje najwięcej razy. W sytuacji gdy żadna z wartości badanej zmiennej nie występuje więcej niż raz wyznaczenie modalnej może być niemożliwe. W przypadku gdy badana zbiorowość jest liczna w celu ustalenia modalnej budujemy szereg przedziałowy w oparciu o wyjściowy szereg szczegółowy. | ||
Linia 53: | Linia 55: | ||
* asymetria rozkładu przedstawiona przy użyciu szeregu przedziałowego jest umiarkowana (w przypadku szeregów skrajnie asymetrycznych czyli gdy modalna wystąpiłaby w skrajnych przedziałach w większości wypadków nie wyznacza się modalnej) | * asymetria rozkładu przedstawiona przy użyciu szeregu przedziałowego jest umiarkowana (w przypadku szeregów skrajnie asymetrycznych czyli gdy modalna wystąpiłaby w skrajnych przedziałach w większości wypadków nie wyznacza się modalnej) | ||
* Szeregi, które są podstawą do ustalenia modalnej mogą posiadać otwarte przedziały klasowe. | * Szeregi, które są podstawą do ustalenia modalnej mogą posiadać otwarte przedziały klasowe. | ||
<google>ban728t</google> | <google>ban728t</google> | ||
Linia 61: | Linia 62: | ||
==Miary zmienności== | ==Miary zmienności== | ||
Pozwalają one na ustalenie stopnia zróżnicowania (zmienności) badanej zbiorowości pod względem jakiejś cechy. Miary te dzielą się na: | Pozwalają one na ustalenie stopnia zróżnicowania (zmienności) badanej zbiorowości pod względem jakiejś cechy. Miary te dzielą się na: | ||
:*bezwzględne (absolutne): | :* bezwzględne (absolutne): | ||
::*[[rozstęp]] | ::* [[rozstęp]] | ||
::*rozstęp kwartylowy lub decylowy | ::*rozstęp kwartylowy lub decylowy | ||
::*odchylenie przeciętne | ::*odchylenie przeciętne | ||
::*odchylenie ćwiartkowe | ::*odchylenie ćwiartkowe | ||
::*[[wariancja]] | ::* [[wariancja]] | ||
::*[[odchylenie standardowe]] | ::* [[odchylenie standardowe]] | ||
:*względne (relatywne): | :* względne (relatywne): | ||
::*współczynnik zmienności | ::*współczynnik zmienności | ||
===Bezwzględne miary zmienności=== | ===Bezwzględne miary zmienności=== | ||
====Rozstęp==== | ====Rozstęp==== | ||
Linia 114: | Linia 116: | ||
Mówi nam o tym, o ile jednostki badanej zbiorowości różnią się od średniej arytmetycznej tej zmiennej. Nie może być stosowane do porównywania zmienności między 2 lub większą liczbą zbiorowości pod względem tej samej zmiennej. | Mówi nam o tym, o ile jednostki badanej zbiorowości różnią się od średniej arytmetycznej tej zmiennej. Nie może być stosowane do porównywania zmienności między 2 lub większą liczbą zbiorowości pod względem tej samej zmiennej. | ||
=== Względne miary zmienności=== | ===Względne miary zmienności=== | ||
====Współczynnik zmienności==== | ====Współczynnik zmienności==== | ||
Jest to względna miara zróżnicowania, która mówi jak silnie zróżnicowana jest badana zbiorowość pod względem cechy zmiennej i umożliwia ocenę średniej arytmetycznej. Jest on ilorazem bezwzględnej miary zmienności do odpowiednich wartości średnich (najczęściej odchylenie standardowe do średniej arytmetycznej i wyrażane jest w procentach): | Jest to względna miara zróżnicowania, która mówi jak silnie zróżnicowana jest badana zbiorowość pod względem cechy zmiennej i umożliwia ocenę średniej arytmetycznej. Jest on ilorazem bezwzględnej miary zmienności do odpowiednich wartości średnich (najczęściej odchylenie standardowe do średniej arytmetycznej i wyrażane jest w procentach): | ||
Linia 122: | Linia 124: | ||
Im większa jest wartość współczynnika tym silniejsze jest zróżnicowanie i na odwrót. | Im większa jest wartość współczynnika tym silniejsze jest zróżnicowanie i na odwrót. | ||
== Miary asymetrii lub skośności== | ==Miary asymetrii lub skośności== | ||
===Współczynnik asymetrii=== | ===Współczynnik asymetrii=== | ||
Określa on zarówno kierunek, jak i siłę asymetrii. | Określa on zarówno kierunek, jak i siłę asymetrii. | ||
Linia 129: | Linia 131: | ||
Jeżeli: | Jeżeli: | ||
As=0 | As=0 - rozkład symetryczny | ||
As>0 | As>0 - asymetria prawostronna | ||
As<0 | As<0 - asymetria lewostronna | ||
===Moment standaryzowany trzeciego rzędu=== | ===Moment standaryzowany trzeciego rzędu=== |
Wersja z 10:09, 2 lis 2023
Metody statystyczne |
---|
Polecane artykuły |
Metody statystyczne - służą do badania i opisu zbiorowości statystycznych. Do nich zaliczamy:
- Miary położenia (przeciętne, kwartyle)
- Miary zmienności (miary rozproszenia, dyspersji)
- Miary asymetrii lub skośności
- Miary spłaszczenia i koncentracji
TL;DR
Metody statystyki opisowej służą do badania i opisu zbiorowości statystycznych. W artykule omówiono miary położenia, miary zmienności, miary asymetrii i skośności oraz miary spłaszczenia i koncentracji. Przedstawiono definicje i zastosowania poszczególnych miar.
Miary położenia
Służą do określenia położenia zmiennych. Stosuje się je jedynie w stosunku do zbiorowości jednorodnej.
Podział
- Przeciętne - rozpatrywana jest zbiorowość statystyczna jako całość i wskazywana na przeciętny poziom cechy, pomijając przy tym różnice pomiędzy poszczególnymi jednostkami. Są to także miary mianowane. Dzielą się na:
- średnie klasyczne (obliczane przy użyciu wszystkich wartości szeregu):
- średnia arytmetyczna
- średnia geometryczna
- średnia harmoniczna
- średnia kwadratowa
- średnie pozycyjne (wyznaczane biorąc pod uwagę konkretną pozycję jednostek statystycznych w rozkładzie badanej zmiennej):
- Kwartyle - informują o rozkładzie zmiennej, opisują kształt tego rozkładu (np. decyle) czy szacują podstawowe parametry rozkładu. Stosuje się je także w przypadku szeregu rozdzielczego o otwartych przedziałach klasowych pierwszym i ostatnim.
Średnie pozycyjne
Modalna (dominanta, wartość typowa, wartość najczęstsza, moda)
Jest to wartość zmiennej cechy statystycznej, która występuje najczęściej w danej zbiorowości statystycznej. Wyznacza się ją zazwyczaj z rozkładów jednomodalnych - posiadających koncentrację jednostek statystycznych przy danej wartości cechy.
W szeregach szczegółowych modalną liczymy zliczając jednostki zbiorowości o identycznej wartości cechy. Modalna to wartość cechy, która występuje najwięcej razy. W sytuacji gdy żadna z wartości badanej zmiennej nie występuje więcej niż raz wyznaczenie modalnej może być niemożliwe. W przypadku gdy badana zbiorowość jest liczna w celu ustalenia modalnej budujemy szereg przedziałowy w oparciu o wyjściowy szereg szczegółowy.
W szeregach punktowych i strukturalnych modalna jest wartością lub odmianą cechy, której odpowiada największa liczebność.
W szeregach z przedziałami klasowymi wprost można określić jedynie przedział, w którym modalna występuje (jest to przedział o największej liczebności). Jest to wtedy wartość abstrakcyjna.
Na przykład możemy powiedzieć, że osoby bezrobotne w Polsce zarejestrowani na dzień 31.12.2006r., ale posiadający również staż pracy przepracowali najczęściej od 1 roku do 5 lat.
Modalną wyznaczamy tylko dla szeregów, które spełniają warunki:
- są to rozkłady jednomodalne
- jeśli występują w postaci szeregów przedziałowych to przedziały muszą mieć jednakowe rozpiętości lub co najmniej przedział modalnej i dwa przedziały wprost sąsiadujące z przedziałem modalnej muszą mieć takie same rozpiętości, zaś pozostałe przedziały powinny mieć nie mniejszą rozpiętość)
- asymetria rozkładu przedstawiona przy użyciu szeregu przedziałowego jest umiarkowana (w przypadku szeregów skrajnie asymetrycznych czyli gdy modalna wystąpiłaby w skrajnych przedziałach w większości wypadków nie wyznacza się modalnej)
- Szeregi, które są podstawą do ustalenia modalnej mogą posiadać otwarte przedziały klasowe.
Mediana (kwartyl drugi, wartość środkowa)
Jest to wartość cechy zmiennej dzieląca szereg na 2 równe części pod względem liczebności: 50% jednostek o wartościach większych lub równych medianie oraz 50% o wartościach mniejszych lub jej równych.
Miary zmienności
Pozwalają one na ustalenie stopnia zróżnicowania (zmienności) badanej zbiorowości pod względem jakiejś cechy. Miary te dzielą się na:
- bezwzględne (absolutne):
- rozstęp
- rozstęp kwartylowy lub decylowy
- odchylenie przeciętne
- odchylenie ćwiartkowe
- wariancja
- odchylenie standardowe
- względne (relatywne):
- współczynnik zmienności
Bezwzględne miary zmienności
Rozstęp
Jest jedną z najprostszych miar rozproszenia. Jest to różnica między największą a najmniejszą wartością zmiennej w analizowanej zbiorowości:
Stosuje się go przede wszystkim w sytuacji, gdy potrzeba szybko określić obszar zmienności badanej zmiennej.
Rozstęp kwartylowy/decylowy
Stosuje się je gdy szereg rozdzielczy posiada otwarte przedziały klasowe:
lub
Odchylenie przeciętne
Jest ono średnią arytmetyczną z bezwzględnych wartości odchyleń zmiennej od jej średniej:
Mówi nam o tym, o ile jednostki danej zbiorowości różnią się średnio ze względu na wartość badanej zmiennej od jej średniej arytmetycznej.
Odchylenie ćwiartkowe
Jest równe połowie różnicy między kwartylami górnym (trzecim) a dolnym (pierwszym):
Ono określa zróżnicowanie tylko części (50%) jednostek badanej zbiorowości położonych centralnie, pomiędzy 2 kwartylami.
Wariancja
Jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości zmiennej od ich średniej arytmetycznej:
Wariancja jest wielkością nieujemną oraz miarą mianowaną. Jest stosowana przy budowaniu wielu parametrów, ale nie należy interpretować jej wyniku.
Odchylenie standardowe
Jest ono pierwiastkiem kwadratowym z wariancji:
Mówi nam o tym, o ile jednostki badanej zbiorowości różnią się od średniej arytmetycznej tej zmiennej. Nie może być stosowane do porównywania zmienności między 2 lub większą liczbą zbiorowości pod względem tej samej zmiennej.
Względne miary zmienności
Współczynnik zmienności
Jest to względna miara zróżnicowania, która mówi jak silnie zróżnicowana jest badana zbiorowość pod względem cechy zmiennej i umożliwia ocenę średniej arytmetycznej. Jest on ilorazem bezwzględnej miary zmienności do odpowiednich wartości średnich (najczęściej odchylenie standardowe do średniej arytmetycznej i wyrażane jest w procentach):
Im większa jest wartość współczynnika tym silniejsze jest zróżnicowanie i na odwrót.
Miary asymetrii lub skośności
Współczynnik asymetrii
Określa on zarówno kierunek, jak i siłę asymetrii.
Jeżeli: As=0 - rozkład symetryczny As>0 - asymetria prawostronna As<0 - asymetria lewostronna
Moment standaryzowany trzeciego rzędu
Jest on bardziej precyzyjny niż wcześniej wskazany:
Miary spłaszczenia i koncentracji
Współczynnik koncentracji (kurtoza)
Otrzymujemy go poprzez podzielenie momentu centralnego czwartego rzędu przez odchylenie standardowe podniesione do potęgi 4:
gdzie:
- moment centralny czwartego rzedu
- odchylenie standardowe do potęgi czwartej
Im wyższa jest wartość współczynnika K, tym krzywa liczebności wskazuje na tendencję do skupiania się jednostek wokół średniej.
Współczynnik ekscesu
Przyjmuje on wartość =0 gdy rozkład ma kształt normalny. Mówi nam czy koncentracja wartości badanej zmiennej wokół średniej w danym rozkładzie jest większa czy mniejsza niż w zbiorowości o rozkładzie normalnym:
Współczynnik koncentracji Lorenza
Określa on stopień natężenia rozkładu ogólnej sumy wartości badanej cechy na poszczególne jednostki zbiorowości statystycznej:
gdzie:
a - powierzchnia pola zawartego między krzywą koncentracji a linią równomiernego rozkładu
b - powierzchnia pola leżącego pod krzywą koncentracji
Patrz także:
- Wskaźniki iloczynu skalarnego
- Wariancja składnika resztowego
- Skala interwałowa
- Skalowanie wielowymiarowe
- Próg absolutny
- Operat losowania
- Obszar odrzucenia
- Ocena absolutna
- Modele tendencji rozwojowej w planowaniu
- Indukcja eliminacyjna
- Funkcja regresji kosztów i przychodów
Bibliografia
- Sobczyk M. (). Statystyka, Wydawnictwo Naukowe PWN
- Woźniak M.(red) (1997), Statystyka ogólna, Wyd. II poprawione, Akademia Ekonomiczna w Krakowie, Kraków
- Zeliaś A. (2000), Metody Statystyczne, Polskie Wydawnictwo Ekonomiczne, Warszawa
- Zimny A. (2010) Statystyka opisowa. Materiały pomocnicze do ćwiczeń, "Statystyka opisowa", Państwowa Wyższa Szkoła Zawodowa w Koninie
Autor: Monika Bizub, Aleksandra Duda