Rozkład częstości

Rozkład częstości
Polecane artykuły


Rozkłady częstości związane są z rozkładami empirycznymi zmiennych, lub szeregami rozdzielczymi punktowymi lub klasowymi.
Rozkład empiryczny jest to przyporządkowanie kolejnym wartościom \(x_i\) zmiennej \(X\) odpowiadających im liczebności \(n_i\).
Natomiast rozkładem częstości jest przyporządkowanie wartościom \(x_i\) badanej zmiennej \(X\) odpowiadających im częstości. Częstość dla wartości \(x_i\) definiuje się jako stosunek liczebności \(n_i\) z jaką występuję wartość \(x_i\) w zbiorze danych do ilości wszystkich danych w próbie. Rozkład odzwierciedla więc strukturę badanej zbiorowości z punktu widzenia określonej cechy. [1]

Znać rozkład częstości danej cechy to znać jej przedziały klasowe (wartości) i częstości absolutne lub względne (także procentowe) poszczególnych przedziałów klasowych (wartości). [2]

Rozkłady empiryczne są ustalane na podstawie konkretnych obserwacji, a umiejętność odróżnienia różnych ich typów jest nieodzownym warunkiem prawidłowej analizy statystycznej.
Od ich rodzaju zależy bowiem dobór odpowiednich charakterystyk służących do opisu zbiororwości.

Jednowymiarowy rozkład częstości

Rozkład częstości opracowywany jest dla oceny zmienności wyników uzyskanych w próbie losowej. Zbiór złożony z \(N\) obserwacji dokonanych na zmiennej losowej \(X\) można uporządkować i przedstawić w formie rozkładu częstości.
Przypuśćmy, że wśród obserwacji znajduje się \(I \le N\) różnych wartości zmiennej losowej \(X\).
Rozkład częstości \(f (x)\) jest przyporządkowaniem każdej wartości \(x_i\) (i=1,....., I) częstości względnej \(f (x_i)\), z którą wartość \(x_i\) występuje w zbiorze obserwacji.
Częstość względna jest wyznaczona jako iloraz \(\frac{n_i}{N}\), gdzie \(n_i\) to ilość wystąpień wartości \(x_i\) w zbiorze obserwacji zmiennej \(X\).
Zauważmy, że \(0 \le f (x) \le 1\), dla każdej wartości \(x\), ponieważ \(f (x)\) jest częstością względną;
jeżeli natomiast zsumujemy częstości względne wszystkich wartości zmiennej \(X\), to

\(\sum_{i=1}^I f (x_i)= 1\)

Rozkład częstości jest zatem rozkładem prawdopodobieństwa zmiennej \(X\), gdyż jest określony na zbiorze wartości tej zmiennej oraz przypisuje prawdopodobieństwa wartościom tej zmiennej.
Rozkład częstości jest zaliczany do grupy dyskretnych rozkładów prawdopodobieństwa, gdyż określony jest na zbiorze przeliczalnym. Funkcja zdefiniowana powyżej nazywana jest funkcją rozkładu prawdopodobieństwa lub w tym konkretnym przypadku z uwagi na to, że rozkład częstości jest rozkładem dyskretnym- funkcją masy prawdopodobieństwa. [3]

Rozkład częstości można przedstawić w postaci tablicy, graficznie (w postaci wykresu) lub za pomocą wzorów matematycznych.
Jedną z metod ilustracji rozkładu zmiennej jest budowa histogramu. [4]

Jeżeli w zbiorze obserwacji występuje wiele różnych wartości zmiennej to wygodnie jest przedstawić rozkład częstości dokonując grupowania obserwacji.
Wartości \(x\) należy pogrupować w przedziały wykluczające się wzajemnie i pokrywające cały zbiór zmienności \(X\), a każdemu przedziałowi przyporządkować częstość względną, z jaką wartości zmiennej \(X\) pojawiają się w danym przedziale. Takie grupowanie obserwacji nazywamy szeregiem rozdzielczym przedziałowym. [5]

Parametry rozkładu częstości

Najważniejsze parametry jednowymiarowego rozkład częstości to:

  1. średnia wartość zmiennej- która mierzy tendencję centralną
  2. wariancja- która mierzy odchylenie od średniej

Jeżeli rozkład częstości zmiennej \(X\) oznaczymy przez \(f (x)\) to średnia wartość zmiennej wyniesie:

\(m=\sum_{i=i}^I x_if (x_i)\)

a wariancja zmiennej \(X\) jest równa:

\(v=\sum_{i=1}^I\left (x_i-m)^2\right)f (x_i)\)

Dwuwymiarowy rozkład częstości

Zbiór złożony z \(N\) łącznych obserwacji na dwóch zmiennych \(X\) i \(Y\) można uporządkować i przedstawić w postaci łącznego rozkładu częstości.
Przypuśćmy, że wśród obserwacji znajduje się \(I \le N\) różnych wartości zmiennej \(X\) oraz \(J \le N\) różnych wartości zmiennej \(Y\).
Łączny rozkład częstości \(f (x, y)\) jest przyporządkowaniem każdej parze wartości \((x_i, y_i)\) \((i=1,....., I, j=1....., J)\) częstość względnej \(f (x_i, y_i)\), z którą ta para wartości występuje w zbiorze obserwacji.

Jeżeli rozważamy łączny rozkład częstości, to jednowymiarowy rozkład częstości każdej ze zmiennych nazywamy rozkładem brzegowym. Tak więc przy danym łącznym rozkładzie częstości \(f (x, y)\), brzegowy rozkład częstości zmiennej \(X\), \(f (x)\), przyporządkowuje każdej wartości \(x_i\) częstość względną \(f (x_i)\) występowania tej wartości bez względu na to, jaką wartość przyjmie zmienna \(Y\); podobnie brzegowy rozkład częstości zmiennej \(Y\). [5]

Dystrybuanta rozkładu częstości

Każdemu z rozkładów częstości, które rozpatrywaliśmy, odpowiada dystrybuanta. Jednowymiarowa dystrybuanta \(F (x)\) rozkładu częstości przyporządkowuje każdej wartości \(x\) sumę częstości względnych \(f (x_i)\), z jakimi występują w zbiorze obserwacji wartości zmiennej \(X\) mniejsze lub równe \(x\).
Dystrybuantę otrzymujemy więc dodając częstości:

\( F (x)= \sum_{x_i≤ x}f (x_i).\)

Bibliografia

Przypisy

  1. M.Sobczyk, Statystyka, PWN, Warszawa 2005 rok, s. 32
  2. W. Starzyńska, Statystyka praktyczna, PWN, Warszawa 2002, s. 34
  3. Hellwig Z. (1998). Elementy rachunku prawdopodobieństwa i statystyki matematycznej , Wydawnictwo Naukowe PWN, Warszawa
  4. Kozieł M. Statystyka opisowa
  5. 5,0 5,1 A.S.Goldberger, "Teoria ekonometrii", PWE, Warszawa 1972, s. 74

Autor: Nowacka Bernadeta, Angelika Jurek