Rozkład częstości

Z Encyklopedia Zarządzania
Wersja do druku nie jest już wspierana i może powodować błędy w wyświetlaniu. Zaktualizuj swoje zakładki i zamiast funkcji strony do druku użyj domyślnej funkcji drukowania w swojej przeglądarce.

Rozkłady częstości związane są z rozkładami empirycznymi zmiennych, lub szeregami rozdzielczymi punktowymi lub klasowymi.

Rozkład empiryczny jest to przyporządkowanie kolejnym wartościom zmiennej odpowiadających im liczebności .

Natomiast rozkładem częstości jest przyporządkowanie wartościom badanej zmiennej odpowiadających im częstości. Częstość dla wartości definiuje się jako stosunek liczebności z jaką występuję wartość w zbiorze danych do ilości wszystkich danych w próbie. Rozkład odzwierciedla więc strukturę badanej zbiorowości z punktu widzenia określonej cechy[1]

Znać rozkład częstości danej cechy to znać jej przedziały klasowe (wartości) i częstości absolutne lub względne (także procentowe) poszczególnych przedziałów klasowych (wartości). [2]

Rozkłady empiryczne są ustalane na podstawie konkretnych obserwacji, a umiejętność odróżnienia różnych ich typów jest nieodzownym warunkiem prawidłowej analizy statystycznej.

Od ich rodzaju zależy bowiem dobór odpowiednich charakterystyk służących do opisu zbiorowości.

TL;DR

Rozkład częstości to przyporządkowanie wartościom zmiennej odpowiadających im częstości. Jest używany do analizy statystycznej i opisu zbiorowości. Rozkład częstości można przedstawić za pomocą tablic, histogramów lub wzorów matematycznych. Parametry rozkładu częstości to średnia wartość i wariancja. W przypadku dwuwymiarowego rozkładu częstości analizuje się dwie zmienne jednocześnie. Każdemu rozkładowi częstości odpowiada dystrybuanta.

Jednowymiarowy rozkład częstości

Rozkład częstości opracowywany jest dla oceny zmienności wyników uzyskanych w próbie losowej. Zbiór złożony z obserwacji dokonanych na zmiennej losowej można uporządkować i przedstawić w formie rozkładu częstości.

Przypuśćmy, że wśród obserwacji znajduje się różnych wartości zmiennej losowej .

Rozkład częstości jest przyporządkowaniem każdej wartości (i=1,....., I) częstości względnej , z którą wartość występuje w zbiorze obserwacji.

Częstość względna jest wyznaczona jako iloraz , gdzie to ilość wystąpień wartości w zbiorze obserwacji zmiennej .

Zauważmy, że , dla każdej wartości , ponieważ jest częstością względną;

jeżeli natomiast zsumujemy częstości względne wszystkich wartości zmiennej , to

Rozkład częstości jest zatem rozkładem prawdopodobieństwa zmiennej , gdyż jest określony na zbiorze wartości tej zmiennej oraz przypisuje prawdopodobieństwa wartościom tej zmiennej.

Rozkład częstości jest zaliczany do grupy dyskretnych rozkładów prawdopodobieństwa, gdyż określony jest na zbiorze przeliczalnym. Funkcja zdefiniowana powyżej nazywana jest funkcją rozkładu prawdopodobieństwa lub w tym konkretnym przypadku z uwagi na to, że rozkład częstości jest rozkładem dyskretnym - funkcją masy prawdopodobieństwa[3]

Rozkład częstości można przedstawić w postaci tablicy, graficznie (w postaci wykresu) lub za pomocą wzorów matematycznych.

Jedną z metod ilustracji rozkładu zmiennej jest budowa histogramu.

Jeżeli w zbiorze obserwacji występuje wiele różnych wartości zmiennej to wygodnie jest przedstawić rozkład częstości dokonując grupowania obserwacji.

Wartości należy pogrupować w przedziały wykluczające się wzajemnie i pokrywające cały zbiór zmienności , a każdemu przedziałowi przyporządkować częstość względną, z jaką wartości zmiennej pojawiają się w danym przedziale. Takie grupowanie obserwacji nazywamy szeregiem rozdzielczym przedziałowym[4]

Parametry rozkładu częstości

Najważniejsze parametry jednowymiarowego rozkład częstości to:

  1. średnia wartość zmiennej - która mierzy tendencję centralną
  2. wariancja - która mierzy odchylenie od średniej

Jeżeli rozkład częstości zmiennej oznaczymy przez to średnia wartość zmiennej wyniesie:

a wariancja zmiennej jest równa:

Dwuwymiarowy rozkład częstości

Zbiór złożony z łącznych obserwacji na dwóch zmiennych i można uporządkować i przedstawić w postaci łącznego rozkładu częstości.

Przypuśćmy, że wśród obserwacji znajduje się różnych wartości zmiennej oraz różnych wartości zmiennej .

Łączny rozkład częstości jest przyporządkowaniem każdej parze wartości częstość względnej , z którą ta para wartości występuje w zbiorze obserwacji.

Jeżeli rozważamy łączny rozkład częstości, to jednowymiarowy rozkład częstości każdej ze zmiennych nazywamy rozkładem brzegowym. Tak więc przy danym łącznym rozkładzie częstości , brzegowy rozkład częstości zmiennej , , przyporządkowuje każdej wartości częstość względną występowania tej wartości bez względu na to, jaką wartość przyjmie zmienna ; podobnie brzegowy rozkład częstości zmiennej . [4]

Dystrybuanta rozkładu częstości

Każdemu z rozkładów częstości, które rozpatrywaliśmy, odpowiada dystrybuanta. Jednowymiarowa dystrybuanta rozkładu częstości przyporządkowuje każdej wartości sumę częstości względnych , z jakimi występują w zbiorze obserwacji wartości zmiennej mniejsze lub równe .

Dystrybuantę otrzymujemy więc dodając częstości:


Rozkład częstościartykuły polecane
Wnioskowanie statystyczneŚredniaKwartylTest zgodności chi-kwadratZmienna losowaRozkład normalnyWspółczynnik korelacji rang SpearmanaPercentylANOVA

Przypisy

  1. M.Sobczyk, s. 32
  2. W. Starzyńska, ' s. 34
  3. Hellwig Z. (1998).
  4. 4,0 4,1 A.S.Goldberger, s. 74

Bibliografia

  • Goldberger A. (1972), Teoria ekonometrii, PWE, Warszawa
  • Hellwig Z. (1998), Elementy rachunku prawdopodobieństwa i statystyki matematycznej , Wydawnictwo Naukowe PWN, Warszawa
  • Ostasiewicz W. (2012), Myślenie statystyczne, Wolters Kluwer, Warszawa
  • Sobczyk M. (2007), Statystyka, Wydawnictwo Naukowe PWN, Warszawa
  • Starzyńska W. (2006), Statystyka praktyczna, Wydawnictwo Naukowe PWN, Warszawa


Autor: Nowacka Bernadeta, Angelika Jurek