Rozkład normalny

Z Encyklopedia Zarządzania
Skocz do: nawigacja, szukaj
Rozkład normalny
Pojęcie nadrzędne
Pojęcia związane
Metody i techniki

Rozkład normalny jest jednym z najważniejszych rozkładów teoretycznych prawdopodobieństwa.

Rozkład normalny jest nazywany inaczej rozkładem Gaussa lub Gaussa-Laplace’a.
Carl Friedrich Gauss (1777–1855) oraz Pieerre Simon de Laplace (1749–1827) posługiwali się w swoich pracach rozkładem normalnym niezależnie od siebie, jednakże nie byli oni pierwszymi matematykami, którzy opisali rozkład normalny. Zrobił to przed nimi francuski matematyk Abraham de Moivre (1667–1754), który 12 listopada 1733 roku opublikował pracę o zbieżności rozkładu dwumianowego do rozkładu normalnego, zawierającą wzór na funkcję gęstości prawdopodobieństwa rozkładu normalnego.[1]

Definicja rozkładu normalnego

Rozkład normalny może być jednoznacznie zdefiniowany poprzez:

  • funkcję gęstości prawdopodobieństwa
  • dystrybuantę
  • funkcję charakterystyczną
  • momenty (funkcję tworzącą momenty )
  • kumulanty (funkcję tworzącą kumulanty)


Zmienna losowa \(X\) ma rozkład \(\mathcal N(\mu, \sigma)\), jeżeli jej funkcja gęstości prawdopodobieństwa wyrażona jest wzorem: \[f_{\mu, \sigma}(x) = \frac{1}{\sigma\sqrt{2\pi}}\,\exp\left(\frac {-(x-\mu )^2} {2\sigma^2}\right)\] gdzie \(\mu\) to wartość oczekiwana zmiennej losowej \(X\) oraz
\(\sigma\) to odchylenie standardowe zmiennej losowej \(X\). [2]


Dystrybuanta rozkładu normalnego określona jest następującym wzorem: \[P(X \le x) = \int\limits_{-\infty}^x \frac{1}{\sigma\sqrt{2\pi} } e^\frac{-(x-\mu)^2}{2\sigma^2}\,dx\]

Rozkład normalny należy do grupy rozkładów ciągłych tzn. dystrybuanta rozkładu normalnego jest funkcją ciągłą.

Funkcja charakterystyczna rozkładu normalnego ma postać: \[\varphi(t) = \exp\left(i\mu t-\frac{\sigma^2 t^2}{2}\right)\]

Standardowy rozkład normalny

Jeśli \(X \sim \mathcal N(0,1)\) czyli wartość oczekiwana \(\mu=0\) i odchylenie standardowe \(\sigma=1\), to mówimy, że zmienna losowa ma standardowy rozkład normalny.

Funkcja gęstości dla standardowego rozkładu normalnego ma postać: \[f_{0, 1}(x) = \phi(x) = \frac{1}{\sqrt{2\pi}}\,\exp\left(-\frac{x^2}{2}\right)\]
Natomiast dystrybuanta standardowego rozkładu normalnego, w literaturze oznaczana symbolem \(\Phi\), ma postać: \[\Phi(z) = \int\limits_{-\infty}^z \frac{1}{\sqrt{2\pi}}\,e^{-\frac{z^2}{2}}\,dz.\]

Standardowy rozkład normalny został stablicowany, co oznacza, że tablice statystyczne zawierają wartości dystrybuany dla rozkładu \(\mathcal N(0,1)\).

Standaryzacja zmiennej o rozkładzie normalnym

Jeżeli \(X \sim \mathcal N(\mu, \sigma)\), czyli zmienna losowa \(X\) ma rozkład normalny z parametrami \(\mu , \sigma\), to zmienna losowa \(Z\) \[Z = \frac{X - \mu}{\sigma}\] ma standardowy rozkład normalny, czyli \(Z \sim \mathcal N(0,1)\). [3]

Standaryzacja zmiennej losowej o rozkładnie normalnym umożliwia korzystanie z tablic statystycznych dla rozkładu normalnego o dowolnych parametrach przy zachowaniu następującej zależności: \[P(X \le x) = \Phi\left(\frac{x-\mu}{\sigma}\right)\]

Własności

Rozkład normalny jest rozkładem symetrycznym (czyli liczebności odpowiadające wartościom zmiennej rozkładają się symetrycznie wokół liczebności największej). Każdy rozkład normalny jest rozkładem symetrycznym, ale nie każdy rozkład symetryczny jest rozkładem normalnym, ponieważ do rozkładów symetrycznych należą także rozkłady leptokurytyczne (czyli wysmukłe) oraz platokurtyczne (spłaszczone), które nie są normalnymi.[4]

Kolejną właściwością tego rozkładu jest jedno maksimum oraz ściśle określona kurtoza (czyli koncentracja wartości zmiennej wokół średniej arytmetycznej)

Wykres rozkładu normalnego ma postać krzywej w kształcie dzwonu. W punkcie centralnym rozkładu znajduje się średnia arytmetyczna, a także dominanta i mediana. Z tego wynika, że średnia arytmetyczna jest wartością cechy najczęściej spotykaną w badanej zbiorowości.[5]

Wykres funkcji gęstości f jest krzywą symetryczną względem prostej o równaniu:

\(x = \mu\)

mającą oś Ox jako asymptotę, maksimum absolutne w punkcie \(x = \mu\) równe \(f_{max}=\frac{1}{\left (\sigma\sqrt{2\pi}\right)}\), oraz dwa punkty przegięcia w odległości \(\sigma\) od osi symetrii.

Dla różnych wartości oczekiwanych i różnych odchyleń standardowych otrzymujemy różne postacie (różne kształty) krzywej normalnej mające ten sam charakter ogólny i te same właściwości. Mamy więc do czynienia nie z jedną krzywą normalną, lecz z całą 'rodziną' krzywych. W miarę oddalania się od wartości oczekiwanej \(\mu\) w kierunku wartości wyższych i niższych, krzywa zbliża się asymptotycznie do osi Ox. W rozkładzie normalnym częstotliwość pojawiania się zdarzeń o średniej wartości badanej cechy jest zatem największa, lub, mówiąc inaczej, prawdopodobieństwo wystąpienia takiego zdarzenia jest najwyższe. Częstość pojawiania się zdarzenia (prawdopodobieństwo wystąpienia) maleje odpowiednio do wzrostu odchylenia zmiennej losowej od jej wartości oczekiwanej. Warto zapamiętać, że przy wzroście wartości oczekiwanej zmiennej losowej rozkład "przesuwa się" na osi w prawo, i odwrotnie. Zmiana odchylenia standardowego znajduje wyraz w tzw. kurtozie rozkładu: im mniejsze jest odchylenie standardowe, tym rozkład jest bardziej wysmukły, i odwrotnie- im większe jest odchylenie, tym rozkład jest bardziej spłaszczony.

Rozkład normalny, którego graficznym wyrazem jest krzywa noralna, może być przedstawiony jedyne w formie teoretycznej, nie może być potwierdzony w praktyce. Aby przy ocenie charakteru rozkładu badanej zmiennej losowej nie popełnić istotnego błędu, trzeba każdorazowe założenie dotyczące typu rozkładu uzasadnić empirycznie lub za pomocą używanych do tego testów statystycznych.

Rozkład zmiennej losowej uzyskany na podstawie próby może się różnić od rozkładu normalnego tej zmiennej, występującego w populacji generalnej, z następujących powodów:

  1. niewłaściwego grupowania
  2. zastosowania niewłaściwej metody pobierania próby
  3. nie dość licznej próby
  4. niewłaściwej skali pomiaru badanej cechy (zjawiska)

Rozkład normalny a rozkład t Studenta

W przeciwieństwie do rozkładu t Studenta, kształt rozkładu normalnego nie zależy od stopni swobody. Im mniejsza jest liczba stopni swobody, tym większa jest różnica między rozkładem normalnym a t Studenta i odwrotnie.

Znaczenie rozkładu normalnego

Rozkład normalny ma szczególnie duże znaczenie w statystyce matematycznej, gdyż wiele cech różnych zbiorowości charakteryzuje się takim właśnie rozkładem. W praktyce ze zmiennymi losowymi X o rozkładzie normalnym spotykamy się w przypadkach, gdy na wartość X ma wpływ duża ilość niezależnie działających czynników, z których każdy ma znikomy efekt. Typowym przykładem może tu być wysokość położenia cząstki w procesie dyfuzji, błąd pomiaru, wzrost ludzki itp[6]

Bibliografia


Przypisy

  1. Snopkowski R. (2005). Funkcje zmiennych losowych - możliwości redukcji modeli stochastycznych, Cz. 2, "Górnictwo i Geoinżynieria", R. 29, z. 3, s. 51-61
  2. Ostasiewicz W. (2012). Myślenie statystyczne, Wolters Kluwer, Warszawa
  3. Hellwig Z. (1998). Elementy rachunku prawdopodobieństwa i statystyki matematycznej , Wydawnictwo Naukowe PWN, Warszawa, s. 83-87
  4. Sobczyk M. (2005). Statystyka, Wydawnictwo Naukowe PWN, Warszawa, s. 33
  5. Makać W., Urbanek-Krzysztofiak D. (2004). Metody opisu statystycznego, Wydawnictwo UG, Gdańsk, s. 83
  6. Brosztein I.N. (1968). Matematyka poradnik encyklopedyczny, Wydawnictwo Naukowe PWN, Warszawa

Autor: Nowacka Bernadeta, Angelika Jurek