Rozkład częstości: Różnice pomiędzy wersjami
mNie podano opisu zmian |
m (cleanup bibliografii i rotten links) |
||
Linia 14: | Linia 14: | ||
}} | }} | ||
Rozkłady częstości związane są z rozkładami ''empirycznymi'' zmiennych, lub szeregami rozdzielczymi punktowymi lub klasowymi. | Rozkłady częstości związane są z rozkładami ''empirycznymi'' zmiennych, lub szeregami rozdzielczymi punktowymi lub klasowymi. | ||
Rozkład empiryczny jest to przyporządkowanie | Rozkład empiryczny jest to przyporządkowanie | ||
kolejnym wartościom <math>x_i</math> [[Zmienna|zmiennej]] <math>X</math> odpowiadających im liczebności <math>n_i</math>. | kolejnym wartościom <math>x_i</math> [[Zmienna|zmiennej]] <math>X</math> odpowiadających im liczebności <math>n_i</math>. | ||
Natomiast '''rozkładem częstości''' jest przyporządkowanie wartościom <math>x_i</math> badanej zmiennej <math>X</math> odpowiadających im częstości. Częstość dla wartości <math>x_i</math> definiuje się jako stosunek liczebności <math>n_i</math> z jaką występuję [[wartość]] <math>x_i</math> w zbiorze danych do ilości wszystkich danych w próbie. | Natomiast '''rozkładem częstości''' jest przyporządkowanie wartościom <math>x_i</math> badanej zmiennej <math>X</math> odpowiadających im częstości. Częstość dla wartości <math>x_i</math> definiuje się jako stosunek liczebności <math>n_i</math> z jaką występuję [[wartość]] <math>x_i</math> w zbiorze danych do ilości wszystkich danych w próbie. | ||
Rozkład odzwierciedla więc strukturę badanej zbiorowości z punktu widzenia określonej cechy. | Rozkład odzwierciedla więc strukturę badanej zbiorowości z punktu widzenia określonej cechy. | ||
Linia 24: | Linia 26: | ||
<ref>W. Starzyńska, ' s. 34</ref> | <ref>W. Starzyńska, ' s. 34</ref> | ||
Rozkłady empiryczne są ustalane na podstawie konkretnych [[Obserwacja|obserwacji]], a umiejętność odróżnienia różnych ich typów jest nieodzownym warunkiem prawidłowej analizy statystycznej. | Rozkłady empiryczne są ustalane na podstawie konkretnych [[Obserwacja|obserwacji]], a umiejętność odróżnienia różnych ich typów jest nieodzownym warunkiem prawidłowej analizy statystycznej. | ||
Od ich rodzaju zależy bowiem dobór odpowiednich charakterystyk służących do opisu zbiorowości. | Od ich rodzaju zależy bowiem dobór odpowiednich charakterystyk służących do opisu zbiorowości. | ||
Linia 35: | Linia 38: | ||
Rozkład częstości opracowywany jest dla oceny zmienności wyników uzyskanych w [[próba|próbie]] losowej. | Rozkład częstości opracowywany jest dla oceny zmienności wyników uzyskanych w [[próba|próbie]] losowej. | ||
Zbiór złożony z <math>N</math> obserwacji dokonanych na zmiennej losowej <math>X</math> można uporządkować i przedstawić w formie | Zbiór złożony z <math>N</math> obserwacji dokonanych na zmiennej losowej <math>X</math> można uporządkować i przedstawić w formie | ||
'''rozkładu częstości'''. | '''rozkładu częstości'''. | ||
Przypuśćmy, że wśród obserwacji znajduje się <math>I \le N</math> różnych wartości zmiennej losowej <math>X</math>. | |||
Przypuśćmy, że wśród obserwacji znajduje się <math>I \le N</math> różnych wartości zmiennej losowej <math>X</math>. | |||
'''Rozkład częstości''' <math>f (x)</math> jest przyporządkowaniem każdej wartości <math>x_i</math> (i=1,....., I) | '''Rozkład częstości''' <math>f (x)</math> jest przyporządkowaniem każdej wartości <math>x_i</math> (i=1,....., I) | ||
częstości względnej <math>f (x_i)</math>, z którą wartość <math>x_i</math> występuje w zbiorze obserwacji. | częstości względnej <math>f (x_i)</math>, z którą wartość <math>x_i</math> występuje w zbiorze obserwacji. | ||
Częstość względna jest wyznaczona jako iloraz <math>\frac{n_i}{N}</math>, gdzie <math>n_i</math> to ilość wystąpień wartości <math>x_i</math> w zbiorze obserwacji zmiennej <math>X</math>. | |||
Zauważmy, że <math>0 \le f (x) \le 1</math>, dla każdej wartości <math>x</math>, ponieważ <math>f (x)</math> jest częstością względną; | Częstość względna jest wyznaczona jako iloraz <math>\frac{n_i}{N}</math>, gdzie <math>n_i</math> to ilość wystąpień wartości <math>x_i</math> w zbiorze obserwacji zmiennej <math>X</math>. | ||
jeżeli natomiast zsumujemy częstości względne wszystkich wartości zmiennej <math>X</math>, to | |||
Zauważmy, że <math>0 \le f (x) \le 1</math>, dla każdej wartości <math>x</math>, ponieważ <math>f (x)</math> jest częstością względną; | |||
jeżeli natomiast zsumujemy częstości względne wszystkich wartości zmiennej <math>X</math>, to | |||
<center><math>\sum_{i=1}^I f (x_i)= 1</math></center> | <center><math>\sum_{i=1}^I f (x_i)= 1</math></center> | ||
Rozkład częstości jest zatem rozkładem prawdopodobieństwa zmiennej <math>X</math>, gdyż jest określony na zbiorze wartości tej zmiennej oraz przypisuje prawdopodobieństwa wartościom tej zmiennej. | Rozkład częstości jest zatem rozkładem prawdopodobieństwa zmiennej <math>X</math>, gdyż jest określony na zbiorze wartości tej zmiennej oraz przypisuje prawdopodobieństwa wartościom tej zmiennej. | ||
Rozkład częstości jest zaliczany do grupy dyskretnych rozkładów prawdopodobieństwa, gdyż określony jest na zbiorze przeliczalnym. [[Funkcja]] zdefiniowana powyżej nazywana jest funkcją rozkładu prawdopodobieństwa lub w tym konkretnym przypadku z uwagi na to, że rozkład częstości jest rozkładem dyskretnym- funkcją masy prawdopodobieństwa. | Rozkład częstości jest zaliczany do grupy dyskretnych rozkładów prawdopodobieństwa, gdyż określony jest na zbiorze przeliczalnym. [[Funkcja]] zdefiniowana powyżej nazywana jest funkcją rozkładu prawdopodobieństwa lub w tym konkretnym przypadku z uwagi na to, że rozkład częstości jest rozkładem dyskretnym- funkcją masy prawdopodobieństwa. | ||
<ref> Hellwig Z. (1998). </ref> | <ref> Hellwig Z. (1998). </ref> | ||
Rozkład częstości można przedstawić w postaci tablicy, graficznie (w postaci wykresu) lub za pomocą wzorów matematycznych. | Rozkład częstości można przedstawić w postaci tablicy, graficznie (w postaci wykresu) lub za pomocą wzorów matematycznych. | ||
Jedną z metod ilustracji rozkładu zmiennej jest budowa [[histogram|histogramu]]. | Jedną z metod ilustracji rozkładu zmiennej jest budowa [[histogram|histogramu]]. | ||
<ref>Kozieł M. </ref> | <ref>Kozieł M. </ref> | ||
Jeżeli w zbiorze obserwacji występuje wiele różnych wartości zmiennej to wygodnie jest przedstawić rozkład częstości dokonując grupowania obserwacji. | Jeżeli w zbiorze obserwacji występuje wiele różnych wartości zmiennej to wygodnie jest przedstawić rozkład częstości dokonując grupowania obserwacji. | ||
Wartości <math>x</math> należy pogrupować w przedziały wykluczające się wzajemnie i pokrywające cały zbiór zmienności <math>X</math>, a każdemu przedziałowi przyporządkować częstość względną, z jaką wartości zmiennej <math>X</math> pojawiają się w danym przedziale. Takie grupowanie obserwacji nazywamy szeregiem rozdzielczym przedziałowym. | Wartości <math>x</math> należy pogrupować w przedziały wykluczające się wzajemnie i pokrywające cały zbiór zmienności <math>X</math>, a każdemu przedziałowi przyporządkować częstość względną, z jaką wartości zmiennej <math>X</math> pojawiają się w danym przedziale. Takie grupowanie obserwacji nazywamy szeregiem rozdzielczym przedziałowym. | ||
<ref name="A.S.Goldberger 1972">A.S.Goldberger, s. 74</ref> | <ref name="A.S.Goldberger 1972">A.S.Goldberger, s. 74</ref> | ||
Linia 61: | Linia 73: | ||
#[[wariancja]]- która mierzy odchylenie od średniej | #[[wariancja]]- która mierzy odchylenie od średniej | ||
Jeżeli rozkład częstości zmiennej <math>X</math> oznaczymy przez <math>f (x)</math> to średnia wartość zmiennej wyniesie: | Jeżeli rozkład częstości zmiennej <math>X</math> oznaczymy przez <math>f (x)</math> to średnia wartość zmiennej wyniesie: | ||
<center><math>m=\sum_{i=i}^I x_if (x_i)</math></center> | <center><math>m=\sum_{i=i}^I x_if (x_i)</math></center> | ||
a wariancja zmiennej <math>X</math> jest równa: | a wariancja zmiennej <math>X</math> jest równa: | ||
<center><math>v=\sum_{i=1}^I\left (x_i-m)^2\right)f (x_i)</math></center> | <center><math>v=\sum_{i=1}^I\left (x_i-m)^2\right)f (x_i)</math></center> | ||
Linia 70: | Linia 84: | ||
Zbiór złożony z <math>N</math> łącznych obserwacji na dwóch zmiennych <math>X</math> i <math>Y</math> można uporządkować i przedstawić w postaci | Zbiór złożony z <math>N</math> łącznych obserwacji na dwóch zmiennych <math>X</math> i <math>Y</math> można uporządkować i przedstawić w postaci | ||
łącznego rozkładu częstości. | łącznego rozkładu częstości. | ||
Przypuśćmy, że wśród obserwacji znajduje się <math>I \le N</math> różnych wartości zmiennej <math>X</math> oraz <math>J \le N</math> różnych wartości zmiennej <math>Y</math>. | |||
Łączny '''rozkład częstości''' <math>f (x, y)</math> jest przyporządkowaniem każdej parze wartości <math>(x_i, y_i)</math> <math>(i=1,....., I, j=1....., J)</math> częstość względnej <math>f (x_i, y_i)</math>, z którą ta para wartości występuje w zbiorze obserwacji. | Przypuśćmy, że wśród obserwacji znajduje się <math>I \le N</math> różnych wartości zmiennej <math>X</math> oraz <math>J \le N</math> różnych wartości zmiennej <math>Y</math>. | ||
Łączny '''rozkład częstości''' <math>f (x, y)</math> jest przyporządkowaniem każdej parze wartości <math>(x_i, y_i)</math> <math>(i=1,....., I, j=1....., J)</math> częstość względnej <math>f (x_i, y_i)</math>, z którą ta para wartości występuje w zbiorze obserwacji. | |||
Jeżeli rozważamy łączny rozkład częstości, to jednowymiarowy rozkład częstości każdej ze zmiennych nazywamy ''rozkładem brzegowym''. Tak więc przy danym łącznym rozkładzie częstości <math>f (x, y)</math>, brzegowy rozkład częstości zmiennej <math>X</math>, <math>f (x)</math>, przyporządkowuje każdej wartości <math>x_i</math> częstość względną <math>f (x_i)</math> występowania tej wartości bez względu na to, jaką wartość przyjmie [[zmienna]] <math>Y</math>; podobnie brzegowy rozkład częstości zmiennej <math>Y</math>. | Jeżeli rozważamy łączny rozkład częstości, to jednowymiarowy rozkład częstości każdej ze zmiennych nazywamy ''rozkładem brzegowym''. Tak więc przy danym łącznym rozkładzie częstości <math>f (x, y)</math>, brzegowy rozkład częstości zmiennej <math>X</math>, <math>f (x)</math>, przyporządkowuje każdej wartości <math>x_i</math> częstość względną <math>f (x_i)</math> występowania tej wartości bez względu na to, jaką wartość przyjmie [[zmienna]] <math>Y</math>; podobnie brzegowy rozkład częstości zmiennej <math>Y</math>. | ||
Linia 80: | Linia 96: | ||
Każdemu z rozkładów częstości, które rozpatrywaliśmy, odpowiada dystrybuanta. | Każdemu z rozkładów częstości, które rozpatrywaliśmy, odpowiada dystrybuanta. | ||
Jednowymiarowa dystrybuanta <math>F (x)</math> rozkładu częstości przyporządkowuje każdej wartości <math>x</math> sumę częstości względnych <math>f (x_i)</math>, z jakimi występują w zbiorze obserwacji wartości zmiennej <math>X</math> mniejsze lub równe <math>x</math>. | Jednowymiarowa dystrybuanta <math>F (x)</math> rozkładu częstości przyporządkowuje każdej wartości <math>x</math> sumę częstości względnych <math>f (x_i)</math>, z jakimi występują w zbiorze obserwacji wartości zmiennej <math>X</math> mniejsze lub równe <math>x</math>. | ||
Dystrybuantę otrzymujemy więc dodając częstości: | |||
Dystrybuantę otrzymujemy więc dodając częstości: | |||
<center><math> F (x)= \sum_{x_i \le x}f (x_i).</math> </center> | <center><math> F (x)= \sum_{x_i \le x}f (x_i).</math> </center> | ||
Linia 89: | Linia 107: | ||
==Bibliografia== | ==Bibliografia== | ||
<noautolinks> | <noautolinks> | ||
* Goldberger A.S. (1972). ''Teoria ekonometri'', PWE, Warszawa, s. 74 | * Goldberger A.S. (1972). ''Teoria ekonometri'', PWE, Warszawa, s. 74 | ||
* Hellwig Z. (1998). ''[ | * Hellwig Z. (1998). ''[https://lucc.pl/inf/rach_prawdopodobienstwa/hellwig_-_elementy_rachunku_prawdopodobienstwa_i_statystyki_matematycznej.pdf Elementy rachunku prawdopodobieństwa i statystyki matematycznej ]'', Wydawnictwo Naukowe PWN, Warszawa | ||
* Kozieł M. ''Statystyka opisowa'' | * Kozieł M. ''Statystyka opisowa'' | ||
* Ostasiewicz W. (2012). ''[https://books.google.pl/books?hl=pl&lr=&id=QZpSAwAAQBAJ&oi=fnd&pg=PA5&dq=rozk%C5%82ady+zmiennych+losowych+pdf&ots=00QoPJdDh_&sig=9n_UQooHNPhvrmrN1LYU2PxdAlc&redir_esc=y#v=onepage&q&f=false Myślenie statystyczne''], Wolters Kluwer, Warszawa | * Ostasiewicz W. (2012). ''[https://books.google.pl/books?hl=pl&lr=&id=QZpSAwAAQBAJ&oi=fnd&pg=PA5&dq=rozk%C5%82ady+zmiennych+losowych+pdf&ots=00QoPJdDh_&sig=9n_UQooHNPhvrmrN1LYU2PxdAlc&redir_esc=y#v=onepage&q&f=false Myślenie statystyczne''], Wolters Kluwer, Warszawa | ||
* Sobczyk M. (2005). ''Statystyka'', Wydawnictwo Naukowe PWN, Warszawa, s. 32 | * Sobczyk M. (2005). ''Statystyka'', Wydawnictwo Naukowe PWN, Warszawa, s. 32 | ||
* Starzyńska W. (2002). ''Statystyka praktyczna'', Wydawnictwo Naukowe PWN, Warszawa, s. 34 | * Starzyńska W. (2002). ''Statystyka praktyczna'', Wydawnictwo Naukowe PWN, Warszawa, s. 34 | ||
</noautolinks> | </noautolinks> | ||
Wersja z 22:28, 29 paź 2023
Rozkład częstości |
---|
Polecane artykuły |
Rozkłady częstości związane są z rozkładami empirycznymi zmiennych, lub szeregami rozdzielczymi punktowymi lub klasowymi.
Rozkład empiryczny jest to przyporządkowanie kolejnym wartościom zmiennej odpowiadających im liczebności .
Natomiast rozkładem częstości jest przyporządkowanie wartościom badanej zmiennej odpowiadających im częstości. Częstość dla wartości definiuje się jako stosunek liczebności z jaką występuję wartość w zbiorze danych do ilości wszystkich danych w próbie. Rozkład odzwierciedla więc strukturę badanej zbiorowości z punktu widzenia określonej cechy. [1]
Znać rozkład częstości danej cechy to znać jej przedziały klasowe (wartości) i częstości absolutne lub względne (także procentowe) poszczególnych przedziałów klasowych (wartości). [2]
Rozkłady empiryczne są ustalane na podstawie konkretnych obserwacji, a umiejętność odróżnienia różnych ich typów jest nieodzownym warunkiem prawidłowej analizy statystycznej.
Od ich rodzaju zależy bowiem dobór odpowiednich charakterystyk służących do opisu zbiorowości.
TL;DR
Rozkład częstości to przyporządkowanie wartościom zmiennej odpowiadających im częstości. Jest używany do analizy statystycznej i opisu zbiorowości. Rozkład częstości można przedstawić za pomocą tablic, histogramów lub wzorów matematycznych. Parametry rozkładu częstości to średnia wartość i wariancja. W przypadku dwuwymiarowego rozkładu częstości analizuje się dwie zmienne jednocześnie. Każdemu rozkładowi częstości odpowiada dystrybuanta.
Jednowymiarowy rozkład częstości
Rozkład częstości opracowywany jest dla oceny zmienności wyników uzyskanych w próbie losowej. Zbiór złożony z obserwacji dokonanych na zmiennej losowej można uporządkować i przedstawić w formie rozkładu częstości.
Przypuśćmy, że wśród obserwacji znajduje się różnych wartości zmiennej losowej .
Rozkład częstości jest przyporządkowaniem każdej wartości (i=1,....., I) częstości względnej , z którą wartość występuje w zbiorze obserwacji.
Częstość względna jest wyznaczona jako iloraz , gdzie to ilość wystąpień wartości w zbiorze obserwacji zmiennej .
Zauważmy, że , dla każdej wartości , ponieważ jest częstością względną;
jeżeli natomiast zsumujemy częstości względne wszystkich wartości zmiennej , to
Rozkład częstości jest zatem rozkładem prawdopodobieństwa zmiennej , gdyż jest określony na zbiorze wartości tej zmiennej oraz przypisuje prawdopodobieństwa wartościom tej zmiennej.
Rozkład częstości jest zaliczany do grupy dyskretnych rozkładów prawdopodobieństwa, gdyż określony jest na zbiorze przeliczalnym. Funkcja zdefiniowana powyżej nazywana jest funkcją rozkładu prawdopodobieństwa lub w tym konkretnym przypadku z uwagi na to, że rozkład częstości jest rozkładem dyskretnym- funkcją masy prawdopodobieństwa. [3]
Rozkład częstości można przedstawić w postaci tablicy, graficznie (w postaci wykresu) lub za pomocą wzorów matematycznych.
Jedną z metod ilustracji rozkładu zmiennej jest budowa histogramu. [4]
Jeżeli w zbiorze obserwacji występuje wiele różnych wartości zmiennej to wygodnie jest przedstawić rozkład częstości dokonując grupowania obserwacji.
Wartości należy pogrupować w przedziały wykluczające się wzajemnie i pokrywające cały zbiór zmienności , a każdemu przedziałowi przyporządkować częstość względną, z jaką wartości zmiennej pojawiają się w danym przedziale. Takie grupowanie obserwacji nazywamy szeregiem rozdzielczym przedziałowym. [5]
Parametry rozkładu częstości
Najważniejsze parametry jednowymiarowego rozkład częstości to:
- średnia wartość zmiennej- która mierzy tendencję centralną
- wariancja- która mierzy odchylenie od średniej
Jeżeli rozkład częstości zmiennej oznaczymy przez to średnia wartość zmiennej wyniesie:
a wariancja zmiennej jest równa:
Dwuwymiarowy rozkład częstości
Zbiór złożony z łącznych obserwacji na dwóch zmiennych i można uporządkować i przedstawić w postaci łącznego rozkładu częstości.
Przypuśćmy, że wśród obserwacji znajduje się różnych wartości zmiennej oraz różnych wartości zmiennej .
Łączny rozkład częstości jest przyporządkowaniem każdej parze wartości częstość względnej , z którą ta para wartości występuje w zbiorze obserwacji.
Jeżeli rozważamy łączny rozkład częstości, to jednowymiarowy rozkład częstości każdej ze zmiennych nazywamy rozkładem brzegowym. Tak więc przy danym łącznym rozkładzie częstości , brzegowy rozkład częstości zmiennej , , przyporządkowuje każdej wartości częstość względną występowania tej wartości bez względu na to, jaką wartość przyjmie zmienna ; podobnie brzegowy rozkład częstości zmiennej . [5]
Dystrybuanta rozkładu częstości
Każdemu z rozkładów częstości, które rozpatrywaliśmy, odpowiada dystrybuanta. Jednowymiarowa dystrybuanta rozkładu częstości przyporządkowuje każdej wartości sumę częstości względnych , z jakimi występują w zbiorze obserwacji wartości zmiennej mniejsze lub równe .
Dystrybuantę otrzymujemy więc dodając częstości:
Przypisy
Bibliografia
- Goldberger A.S. (1972). Teoria ekonometri, PWE, Warszawa, s. 74
- Hellwig Z. (1998). Elementy rachunku prawdopodobieństwa i statystyki matematycznej , Wydawnictwo Naukowe PWN, Warszawa
- Kozieł M. Statystyka opisowa
- Ostasiewicz W. (2012). Myślenie statystyczne, Wolters Kluwer, Warszawa
- Sobczyk M. (2005). Statystyka, Wydawnictwo Naukowe PWN, Warszawa, s. 32
- Starzyńska W. (2002). Statystyka praktyczna, Wydawnictwo Naukowe PWN, Warszawa, s. 34
Autor: Nowacka Bernadeta, Angelika Jurek