Rozkład normalny: Różnice pomiędzy wersjami
m (Infobox update) |
m (cleanup bibliografii i rotten links) |
||
(Nie pokazano 17 wersji utworzonych przez 3 użytkowników) | |||
Linia 1: | Linia 1: | ||
Rozkład normalny jest jednym z najważniejszych rozkładów teoretycznych prawdopodobieństwa. | |||
Rozkład normalny jest nazywany inaczej rozkładem Gaussa lub Gaussa-Laplace’a. | |||
Carl Friedrich Gauss (1777-1855) oraz Pierre Simon de Laplace (1749-1827) posługiwali się w swoich pracach rozkładem normalnym niezależnie od siebie, jednakże nie byli oni pierwszymi matematykami, którzy opisali rozkład normalny. Zrobił to przed nimi francuski matematyk Abraham de Moivre (1667-1754), który 12 listopada 1733 roku opublikował pracę o zbieżności rozkładu dwumianowego do rozkładu normalnego, zawierającą wzór na funkcję gęstości prawdopodobieństwa rozkładu normalnego<ref>Snopkowski R. (2005), s. 51-61</ref> | |||
Rozkład normalny jest jednym z najważniejszych rozkładów | ==TL;DR== | ||
Rozkład normalny, znany również jako rozkład Gaussa, jest jednym z najważniejszych rozkładów prawdopodobieństwa. Może być zdefiniowany poprzez funkcję gęstości prawdopodobieństwa, dystrybuantę, funkcję charakterystyczną, momenty i kumulanty. Standardowy rozkład normalny ma wartość oczekiwaną równą 0 i odchylenie standardowe równe 1. Standaryzacja zmiennej o rozkładzie normalnym pozwala korzystać z tablic statystycznych dla rozkładu normalnego o dowolnych parametrach. Rozkład normalny jest symetryczny i ma krzywą w kształcie dzwonu. Ma wiele zastosowań w statystyce matematycznej, gdy cechy zbiorowości mają taki rozkład. | |||
==Definicja rozkładu normalnego== | ==Definicja rozkładu normalnego== | ||
Linia 29: | Linia 16: | ||
* kumulanty (funkcję tworzącą kumulanty) | * kumulanty (funkcję tworzącą kumulanty) | ||
Zmienna losowa <math>X</math> ma rozkład <math>\mathcal N (\mu, \sigma)</math>, jeżeli jej funkcja gęstości prawdopodobieństwa wyrażona jest wzorem: | [[Zmienna]] losowa <math>X</math> ma rozkład <math>\mathcal N (\mu, \sigma)</math>, jeżeli jej [[funkcja]] gęstości prawdopodobieństwa wyrażona jest wzorem: | ||
: <math>f_{\mu, \sigma}(x) = \frac{1}{\sigma\sqrt{2\pi}}\,\exp\left (\frac {-(x-\mu)^2} {2\sigma^2}\right)</math> | : <math>f_{\mu, \sigma}(x) = \frac{1}{\sigma\sqrt{2\pi}}\,\exp\left (\frac {-(x-\mu)^2} {2\sigma^2}\right)</math> | ||
gdzie <math>\mu</math> to wartość oczekiwana zmiennej losowej <math>X</math> oraz | gdzie <math>\mu</math> to [[wartość]] oczekiwana zmiennej losowej <math>X</math> oraz | ||
<math>\sigma</math> to odchylenie standardowe zmiennej losowej <math>X</math>. | |||
<ref>Ostasiewicz W. (2012) | <math>\sigma</math> to [[odchylenie standardowe]] zmiennej losowej <math>X</math>. | ||
<ref>Ostasiewicz W. (2012)</ref> | |||
Dystrybuanta rozkładu normalnego określona jest następującym wzorem: | [[Dystrybuanta rozkładu normalnego]] określona jest następującym wzorem: | ||
: <math>P (X \le x) = \int\limits_{-\infty}^x \frac{1}{\sigma\sqrt{2\pi} } e^\frac{-(x-\mu)^2}{2\sigma^2}\, dx</math> | : <math>P (X \le x) = \int\limits_{-\infty}^x \frac{1}{\sigma\sqrt{2\pi} } e^\frac{-(x-\mu)^2}{2\sigma^2}\, dx</math> | ||
Rozkład normalny należy do grupy rozkładów ciągłych tzn. dystrybuanta rozkładu normalnego jest funkcją ciągłą. | Rozkład normalny należy do grupy rozkładów ciągłych tzn. dystrybuanta rozkładu normalnego jest funkcją ciągłą. | ||
Funkcja charakterystyczna rozkładu normalnego ma postać: | Funkcja charakterystyczna rozkładu normalnego ma postać: | ||
: <math>\varphi (t) = \exp\left (i\mu t-\frac{\sigma^2 t^2}{2}\right)</math> | : <math>\varphi (t) = \exp\left (i\mu t-\frac{\sigma^2 t^2}{2}\right)</math> | ||
<google>n</google> | |||
==Standardowy rozkład normalny== | ==Standardowy rozkład normalny== | ||
Jeśli <math>X \sim \mathcal N (0,1)</math> czyli wartość oczekiwana <math>\mu=0</math> i odchylenie standardowe <math>\sigma=1</math>, to mówimy, że zmienna losowa ma ''standardowy rozkład normalny''. | Jeśli <math>X \sim \mathcal N (0,1)</math> czyli [[wartość oczekiwana]] <math>\mu=0</math> i odchylenie standardowe <math>\sigma=1</math>, to mówimy, że [[zmienna losowa]] ma ''standardowy rozkład normalny''. | ||
Funkcja gęstości dla standardowego rozkładu normalnego ma postać: | Funkcja gęstości dla standardowego rozkładu normalnego ma postać: | ||
: <math>f_{0, 1}(x) = \phi (x) = \frac{1}{\sqrt{2\pi}}\,\exp\left (-\frac{x^2}{2}\right)</math> | : <math>f_{0, 1}(x) = \phi (x) = \frac{1}{\sqrt{2\pi}}\,\exp\left (-\frac{x^2}{2}\right)</math> | ||
Natomiast dystrybuanta standardowego rozkładu normalnego, w literaturze oznaczana symbolem <math>\Phi</math>, ma postać: | |||
: <math>\Phi (z) = \int\limits_{-\infty}^z \frac{1}{\sqrt{2\pi}}\, e^{-\frac{z^2}{2}}\, dz.</math> | : <math>\Phi (z) = \int\limits_{-\infty}^z \frac{1}{\sqrt{2\pi}}\, e^{-\frac{z^2}{2}}\, dz.</math> | ||
Linia 57: | Linia 48: | ||
: <math>Z = \frac{X - \mu}{\sigma}</math> | : <math>Z = \frac{X - \mu}{\sigma}</math> | ||
ma standardowy rozkład normalny, czyli <math>Z \sim \mathcal N (0,1)</math>. | ma standardowy rozkład normalny, czyli <math>Z \sim \mathcal N (0,1)</math>. | ||
<ref> Hellwig Z. (1998) | <ref> Hellwig Z. (1998), s. 83-87</ref> | ||
Standaryzacja zmiennej losowej o rozkładnie normalnym umożliwia korzystanie z tablic statystycznych dla rozkładu normalnego o dowolnych parametrach przy zachowaniu następującej zależności: | [[Standaryzacja]] zmiennej losowej o rozkładnie normalnym umożliwia korzystanie z tablic statystycznych dla rozkładu normalnego o dowolnych parametrach przy zachowaniu następującej zależności: | ||
: <math>P (X \le x) = \Phi\left (\frac{x-\mu}{\sigma}\right)</math> | : <math>P (X \le x) = \Phi\left (\frac{x-\mu}{\sigma}\right)</math> | ||
==Własności== | ==Własności== | ||
Rozkład normalny jest rozkładem symetrycznym (czyli liczebności odpowiadające wartościom zmiennej rozkładają się symetrycznie wokół liczebności największej). Każdy rozkład normalny jest rozkładem symetrycznym, ale nie każdy rozkład symetryczny jest rozkładem normalnym, ponieważ do rozkładów symetrycznych należą także rozkłady ''leptokurytyczne'' (czyli wysmukłe) oraz platokurtyczne (spłaszczone), które nie są normalnymi | Rozkład normalny jest rozkładem symetrycznym (czyli liczebności odpowiadające wartościom zmiennej rozkładają się symetrycznie wokół liczebności największej). Każdy rozkład normalny jest rozkładem symetrycznym, ale nie każdy rozkład symetryczny jest rozkładem normalnym, ponieważ do rozkładów symetrycznych należą także rozkłady ''leptokurytyczne'' (czyli wysmukłe) oraz platokurtyczne (spłaszczone), które nie są normalnymi<ref>Sobczyk M. (2005), s. 33</ref> | ||
Kolejną właściwością tego rozkładu jest jedno maksimum oraz ściśle określona [[kurtoza]] (czyli koncentracja wartości zmiennej wokół średniej arytmetycznej) | Kolejną właściwością tego rozkładu jest jedno maksimum oraz ściśle określona [[kurtoza]] (czyli koncentracja wartości zmiennej wokół średniej arytmetycznej) | ||
Wykres rozkładu normalnego ma postać krzywej w kształcie dzwonu. W punkcie centralnym | Wykres rozkładu normalnego ma postać krzywej w kształcie dzwonu. W punkcie centralnym | ||
rozkładu znajduje się średnia arytmetyczna, a także [[dominanta]] i mediana. | rozkładu znajduje się średnia arytmetyczna, a także [[dominanta]] i [[mediana]]. | ||
Z tego wynika, że średnia arytmetyczna jest wartością cechy najczęściej spotykaną | Z tego wynika, że średnia arytmetyczna jest wartością cechy najczęściej spotykaną | ||
w badanej zbiorowości | w badanej zbiorowości<ref>Makać W., Urbanek-Krzysztofiak D. (2004), s. 83</ref> | ||
Wykres funkcji gęstości f jest krzywą symetryczną względem prostej o równaniu: | Wykres funkcji gęstości f jest krzywą symetryczną względem prostej o równaniu: | ||
Linia 86: | Linia 76: | ||
odchylenia zmiennej losowej od jej wartości oczekiwanej. | odchylenia zmiennej losowej od jej wartości oczekiwanej. | ||
Warto zapamiętać, że przy wzroście wartości oczekiwanej zmiennej losowej rozkład | Warto zapamiętać, że przy wzroście wartości oczekiwanej zmiennej losowej rozkład | ||
"przesuwa się" na osi w [[prawo]], i odwrotnie. Zmiana odchylenia standardowego znajduje | "przesuwa się" na osi w [[prawo]], i odwrotnie. [[Zmiana]] odchylenia standardowego znajduje | ||
wyraz w tzw. kurtozie rozkładu: im mniejsze jest odchylenie standardowe, tym rozkład jest bardziej wysmukły, i odwrotnie- im większe | wyraz w tzw. kurtozie rozkładu: im mniejsze jest odchylenie standardowe, tym rozkład jest bardziej wysmukły, i odwrotnie - im większe | ||
jest odchylenie, tym rozkład jest bardziej spłaszczony. | jest odchylenie, tym rozkład jest bardziej spłaszczony. | ||
Linia 93: | Linia 83: | ||
przedstawiony jedyne w formie teoretycznej, nie może być potwierdzony w praktyce. | przedstawiony jedyne w formie teoretycznej, nie może być potwierdzony w praktyce. | ||
Aby przy ocenie charakteru rozkładu badanej zmiennej losowej nie popełnić istotnego błędu, | Aby przy ocenie charakteru rozkładu badanej zmiennej losowej nie popełnić istotnego błędu, | ||
trzeba każdorazowe założenie dotyczące typu rozkładu uzasadnić empirycznie lub za pomocą | trzeba każdorazowe [[założenie]] dotyczące typu rozkładu uzasadnić empirycznie lub za pomocą | ||
używanych do tego testów statystycznych. | używanych do tego testów statystycznych. | ||
Linia 104: | Linia 94: | ||
==Rozkład normalny a rozkład t Studenta== | ==Rozkład normalny a rozkład t Studenta== | ||
W przeciwieństwie do rozkładu t Studenta, kształt rozkładu normalnego nie zależy od stopni | W przeciwieństwie do rozkładu t Studenta, kształt rozkładu normalnego nie zależy od stopni | ||
swobody. Im mniejsza jest liczba stopni swobody, tym większa jest różnica między | swobody. Im mniejsza jest liczba stopni swobody, tym większa jest różnica między | ||
Linia 110: | Linia 99: | ||
==Znaczenie rozkładu normalnego== | ==Znaczenie rozkładu normalnego== | ||
Rozkład normalny ma szczególnie duże znaczenie w statystyce matematycznej, gdyż wiele cech | Rozkład normalny ma szczególnie duże znaczenie w statystyce matematycznej, gdyż wiele cech | ||
różnych zbiorowości charakteryzuje się takim właśnie rozkładem. | różnych zbiorowości charakteryzuje się takim właśnie rozkładem. | ||
Linia 116: | Linia 104: | ||
na wartość X ma wpływ duża ilość niezależnie działających czynników, z których | na wartość X ma wpływ duża ilość niezależnie działających czynników, z których | ||
każdy ma znikomy efekt. Typowym przykładem może tu być wysokość położenia | każdy ma znikomy efekt. Typowym przykładem może tu być wysokość położenia | ||
cząstki w procesie dyfuzji, błąd pomiaru, wzrost ludzki itp<ref>Brosztein I.N. (1968) | cząstki w procesie dyfuzji, [[błąd]] pomiaru, wzrost ludzki itp<ref>Brosztein I.N. (1968)</ref> | ||
== | {{infobox5|list1={{i5link|a=[[Średnia]]}} — {{i5link|a=[[Współczynnik determinacji]]}} — {{i5link|a=[[Dominanta]]}} — {{i5link|a=[[Metody statystyczne]]}} — {{i5link|a=[[Rozstęp]]}} — {{i5link|a=[[Średnia geometryczna]]}} — {{i5link|a=[[Percentyl]]}} — {{i5link|a=[[Współczynnik korelacji rang Spearmana]]}} — {{i5link|a=[[Kwantyl]]}} }} | ||
==Przypisy== | ==Przypisy== | ||
<references/> | <references /> | ||
==Bibliografia== | |||
<noautolinks> | |||
* Bronsztejn I. (1968), ''Matematyka. Poradnik encyklopedyczny'', Wydawnictwo Naukowe PWN, Warszawa | |||
* Hellwig Z. (1998), ''[https://lucc.pl/inf/rach_prawdopodobienstwa/hellwig_-_elementy_rachunku_prawdopodobienstwa_i_statystyki_matematycznej.pdf Elementy rachunku prawdopodobieństwa i statystyki matematycznej ]'', Wydawnictwo Naukowe PWN, Warszawa | |||
* Makać W., Urbanek-Krzysztofiak D. (2004), ''Metody opisu statystycznego'', WUG, Gdańsk | |||
* Ostasiewicz W. (2012), ''Myślenie statystyczne'', Wolters Kluwer, Warszawa | |||
* Snopkowski R. (2005), ''[https://yadda.icm.edu.pl/baztech/element/bwmeta1.element.baztech-article-AGH5-0013-0046/c/Snopkowski_3.pdf Funkcje zmiennych losowych - możliwości redukcji modeli stochastycznych, Cz. 2]'', Górnictwo i Geoinżynieria, R. 29, z. 3 | |||
* Sobczyk M. (2007), ''Statystyka'', Wydawnictwo Naukowe PWN, Warszawa | |||
</noautolinks> | |||
{{a|Nowacka Bernadeta, Angelika Jurek}} | {{a|Nowacka Bernadeta, Angelika Jurek}} | ||
[[Kategoria: | [[Kategoria:Rozkład]] | ||
{{#metamaster:description|Rozkład normalny, znany jako Gaussa, jest jednym z najważniejszych rozkładów prawdopodobieństwa. Dowiedz się więcej na naszej stronie.}} |
Aktualna wersja na dzień 22:56, 16 gru 2023
Rozkład normalny jest jednym z najważniejszych rozkładów teoretycznych prawdopodobieństwa.
Rozkład normalny jest nazywany inaczej rozkładem Gaussa lub Gaussa-Laplace’a.
Carl Friedrich Gauss (1777-1855) oraz Pierre Simon de Laplace (1749-1827) posługiwali się w swoich pracach rozkładem normalnym niezależnie od siebie, jednakże nie byli oni pierwszymi matematykami, którzy opisali rozkład normalny. Zrobił to przed nimi francuski matematyk Abraham de Moivre (1667-1754), który 12 listopada 1733 roku opublikował pracę o zbieżności rozkładu dwumianowego do rozkładu normalnego, zawierającą wzór na funkcję gęstości prawdopodobieństwa rozkładu normalnego[1]
TL;DR
Rozkład normalny, znany również jako rozkład Gaussa, jest jednym z najważniejszych rozkładów prawdopodobieństwa. Może być zdefiniowany poprzez funkcję gęstości prawdopodobieństwa, dystrybuantę, funkcję charakterystyczną, momenty i kumulanty. Standardowy rozkład normalny ma wartość oczekiwaną równą 0 i odchylenie standardowe równe 1. Standaryzacja zmiennej o rozkładzie normalnym pozwala korzystać z tablic statystycznych dla rozkładu normalnego o dowolnych parametrach. Rozkład normalny jest symetryczny i ma krzywą w kształcie dzwonu. Ma wiele zastosowań w statystyce matematycznej, gdy cechy zbiorowości mają taki rozkład.
Definicja rozkładu normalnego
Rozkład normalny może być jednoznacznie zdefiniowany poprzez:
- funkcję gęstości prawdopodobieństwa
- dystrybuantę
- funkcję charakterystyczną
- momenty (funkcję tworzącą momenty)
- kumulanty (funkcję tworzącą kumulanty)
Zmienna losowa ma rozkład , jeżeli jej funkcja gęstości prawdopodobieństwa wyrażona jest wzorem:
gdzie to wartość oczekiwana zmiennej losowej oraz
to odchylenie standardowe zmiennej losowej . [2]
Dystrybuanta rozkładu normalnego określona jest następującym wzorem:
Rozkład normalny należy do grupy rozkładów ciągłych tzn. dystrybuanta rozkładu normalnego jest funkcją ciągłą.
Funkcja charakterystyczna rozkładu normalnego ma postać:
Standardowy rozkład normalny
Jeśli czyli wartość oczekiwana i odchylenie standardowe , to mówimy, że zmienna losowa ma standardowy rozkład normalny.
Funkcja gęstości dla standardowego rozkładu normalnego ma postać:
Natomiast dystrybuanta standardowego rozkładu normalnego, w literaturze oznaczana symbolem , ma postać:
Standardowy rozkład normalny został stablicowany, co oznacza, że tablice statystyczne zawierają wartości dystrybuany dla rozkładu .
Standaryzacja zmiennej o rozkładzie normalnym
Jeżeli , czyli zmienna losowa ma rozkład normalny z parametrami , to zmienna losowa
ma standardowy rozkład normalny, czyli . [3]
Standaryzacja zmiennej losowej o rozkładnie normalnym umożliwia korzystanie z tablic statystycznych dla rozkładu normalnego o dowolnych parametrach przy zachowaniu następującej zależności:
Własności
Rozkład normalny jest rozkładem symetrycznym (czyli liczebności odpowiadające wartościom zmiennej rozkładają się symetrycznie wokół liczebności największej). Każdy rozkład normalny jest rozkładem symetrycznym, ale nie każdy rozkład symetryczny jest rozkładem normalnym, ponieważ do rozkładów symetrycznych należą także rozkłady leptokurytyczne (czyli wysmukłe) oraz platokurtyczne (spłaszczone), które nie są normalnymi[4]
Kolejną właściwością tego rozkładu jest jedno maksimum oraz ściśle określona kurtoza (czyli koncentracja wartości zmiennej wokół średniej arytmetycznej) Wykres rozkładu normalnego ma postać krzywej w kształcie dzwonu. W punkcie centralnym rozkładu znajduje się średnia arytmetyczna, a także dominanta i mediana. Z tego wynika, że średnia arytmetyczna jest wartością cechy najczęściej spotykaną w badanej zbiorowości[5]
Wykres funkcji gęstości f jest krzywą symetryczną względem prostej o równaniu:
mającą oś Ox jako asymptotę, maksimum absolutne w punkcie równe , oraz dwa punkty przegięcia w odległości od osi symetrii.
Dla różnych wartości oczekiwanych i różnych odchyleń standardowych otrzymujemy różne postacie (różne kształty) krzywej normalnej mające ten sam charakter ogólny i te same właściwości. Mamy więc do czynienia nie z jedną krzywą normalną, lecz z całą 'rodziną' krzywych. W miarę oddalania się od wartości oczekiwanej w kierunku wartości wyższych i niższych, krzywa zbliża się asymptotycznie do osi Ox. W rozkładzie normalnym częstotliwość pojawiania się zdarzeń o średniej wartości badanej cechy jest zatem największa, lub, mówiąc inaczej, prawdopodobieństwo wystąpienia takiego zdarzenia jest najwyższe. Częstość pojawiania się zdarzenia (prawdopodobieństwo wystąpienia) maleje odpowiednio do wzrostu odchylenia zmiennej losowej od jej wartości oczekiwanej. Warto zapamiętać, że przy wzroście wartości oczekiwanej zmiennej losowej rozkład "przesuwa się" na osi w prawo, i odwrotnie. Zmiana odchylenia standardowego znajduje wyraz w tzw. kurtozie rozkładu: im mniejsze jest odchylenie standardowe, tym rozkład jest bardziej wysmukły, i odwrotnie - im większe jest odchylenie, tym rozkład jest bardziej spłaszczony.
Rozkład normalny, którego graficznym wyrazem jest krzywa noralna, może być przedstawiony jedyne w formie teoretycznej, nie może być potwierdzony w praktyce. Aby przy ocenie charakteru rozkładu badanej zmiennej losowej nie popełnić istotnego błędu, trzeba każdorazowe założenie dotyczące typu rozkładu uzasadnić empirycznie lub za pomocą używanych do tego testów statystycznych.
Rozkład zmiennej losowej uzyskany na podstawie próby może się różnić od rozkładu normalnego tej zmiennej, występującego w populacji generalnej, z następujących powodów:
- niewłaściwego grupowania
- zastosowania niewłaściwej metody pobierania próby
- nie dość licznej próby
- niewłaściwej skali pomiaru badanej cechy (zjawiska)
Rozkład normalny a rozkład t Studenta
W przeciwieństwie do rozkładu t Studenta, kształt rozkładu normalnego nie zależy od stopni swobody. Im mniejsza jest liczba stopni swobody, tym większa jest różnica między rozkładem normalnym a t Studenta i odwrotnie.
Znaczenie rozkładu normalnego
Rozkład normalny ma szczególnie duże znaczenie w statystyce matematycznej, gdyż wiele cech różnych zbiorowości charakteryzuje się takim właśnie rozkładem. W praktyce ze zmiennymi losowymi X o rozkładzie normalnym spotykamy się w przypadkach, gdy na wartość X ma wpływ duża ilość niezależnie działających czynników, z których każdy ma znikomy efekt. Typowym przykładem może tu być wysokość położenia cząstki w procesie dyfuzji, błąd pomiaru, wzrost ludzki itp[6]
Rozkład normalny — artykuły polecane |
Średnia — Współczynnik determinacji — Dominanta — Metody statystyczne — Rozstęp — Średnia geometryczna — Percentyl — Współczynnik korelacji rang Spearmana — Kwantyl |
Przypisy
Bibliografia
- Bronsztejn I. (1968), Matematyka. Poradnik encyklopedyczny, Wydawnictwo Naukowe PWN, Warszawa
- Hellwig Z. (1998), Elementy rachunku prawdopodobieństwa i statystyki matematycznej , Wydawnictwo Naukowe PWN, Warszawa
- Makać W., Urbanek-Krzysztofiak D. (2004), Metody opisu statystycznego, WUG, Gdańsk
- Ostasiewicz W. (2012), Myślenie statystyczne, Wolters Kluwer, Warszawa
- Snopkowski R. (2005), Funkcje zmiennych losowych - możliwości redukcji modeli stochastycznych, Cz. 2, Górnictwo i Geoinżynieria, R. 29, z. 3
- Sobczyk M. (2007), Statystyka, Wydawnictwo Naukowe PWN, Warszawa
Autor: Nowacka Bernadeta, Angelika Jurek