Rozkład normalny

Z Encyklopedia Zarządzania
Skocz do: nawigacja, szukaj

Rozkład normalny jest rozkładem empirycznym, czyli przyporządkowaniem kolejnym wartościom zmiennej \(\left (x_i\right)\) odpowiadających im liczebności (\( n_i\)).
Rozkłady empiryczne są ustalane na podstawie konkretnych obserwacji, a umiejętność
odróżnienia różnych ich typów jest nieodzownym warunkiem prawidłowej analizy statystycznej.

Od ich rodzaju zależy bowiem dobór odpowiednich charakterystyk służących do opisu zbiorowości.

Rozkład normalny jest najczęściej spotykanym rodzajem rozkładu empirycznego. Wynika to z faktu,
iż wiele zjawisk, zwłaszcza przyrodniczych, kształtuje się wg takiego właśnie rozkładu.[1]

  1. Jest to rozkład teoretyczny, charakteryzujący się określonymi właściwościami. Jest on rozkładem

symetrycznym (czyli liczebności odpowiadające wartościom zmiennej rozkładają się symetrycznie
wokół liczebności największej). Każdy rozkład normalny jest rozkładem symetrycznym, ale nie każdy rozkład
symetryczny jest rozkładem normalnym, ponieważ do rozkładów symetrycznych należą także
rozkłady leptokurytyczne (czyli wysmukłe) oraz platokurtyczne (spłaszczone),
które nie są normalnymi.[2]

Kolejną właściwością tego rozkładu jest jedno maksimum oraz ściśle określona kurtoza
(czyli koncentracja wartości zmiennej wokół średniej arytmetycznej)

Wykres rozkładu normalnego ma postać krzywej w kształcie dzwonu. W punkcie centralnym
rozkładu znajduje się średnia arytmetyczna, a także dominanta i mediana.
Z tego wynika, że średnia arytmetyczna jest wartością cechy najczęściej spotykaną
w badanej zbiorowości.[3]

Rozkład normalny zmiennej losowej ciągłej jest opisywany następującą funkcją:

f (x)= (\(\frac{1}{\sigma\left (x\right)\sqrt2\pi}\))\(e^c\)
gdzie
\(e^c\) = exp \( \left[ \frac{-\left (x - E\left (x\right)\right)^2}{2\sigma^2(x)} \right]\)

gdzie: f (x)- funkcja gęstości rozkładu normalnego \(\sigma\)(x)- odchylenie standardowe zmiennej ciągłej x

\(\pi\)= 3,1416

e= 2,1718

E (x)- wartość oczekiwana zmiennej ciągłej x

Wykres funkcji f jest krzywą symetryczną względem prostej o równaniu:

x= E (X)

mającą oś Ox jako asymptotę, maksimum absolutne w punkcie x= E (x) równe \(max=\frac{1}{\left (\sigma\sqrt{2\pi}\right)}\),
oraz dwa punkty przegięcia w odległości \(\sigma\) od osi symetrii.

Dla różnych wartości oczekiwanych i różnych odchyleń standardowych otrzymujemy
różne postacie (różne kształty) krzywej normalnej mające ten sam charakter ogólny i te same
właściwości. Mamy więc do czynienia nie z jedną krzywą normalną, lecz z całą 'rodziną' krzywych.
W miarę oddalania się od wartości oczekiwanej E (x) w kierunku wartości wyższych i niższych, krzywa zbliża się asymptotycznie
do osi x. W rozkładzie normalnym częstotliwość pojawiania się zdarzeń o średniej wartości badanej cechy jest zatem największa, lub,
mówiąc inaczej, prawdopodobieństwo wystąpienia takiego zdarzenia jest najwyższe.
Częstość pojawiania się zdarzenia (prawdopodobieństwo wystąpienia) maleje odpowiednio do wzrostu
odchylenia zmiennej losowej od jej wartości oczekiwanej.
Warto zapamiętać, że przy wzroście wartości oczekiwanej zmiennej losowej rozkład
"przesuwa się" na osi w prawo, i odwrotnie. Zmiana odchylenia standardowego znajduje
wyraz w tzw. kurtozie rozkładu: im mniejsze jest odchylenie standardowe, tym rozkład jest bardziej wysmukły, i odwrotnie- im większe
jest odchylenie, tym rozkład jest bardziej spłaszczony.

Rozkład normalny, którego graficznym wyrazem jest krzywa noralna, może być

przedstawiony jedyne w formie teoretycznej, nie może być potwierdzony w praktyce.
Aby przy ocenie charakteru rozkładu badanej zmiennej losowej nie popełnić istotnego błędu,
trzeba każdorazowe założenie dotyczące typu rozkładu uzasadnić empirycznie lub za pomocą
używanych do tego testów statystycznych.

Rozkład zmiennej losowej uzyskany na podstawie próby może się różnić od rozkładu
normalnego tej zmiennej, występującego w populacji generalnej, z następujących powodów:

  1. niewłaściwego grupowania
  2. zastosowania niewłaściwej metody pobierania próby
  3. nie dość licznej próby
  4. niewłaściwej skali pomiaru badanej cechy (zjawiska)

Rozkład normalny a rozkład t Studenta

W przeciwieństwie do rozkładu t Studenta, kształt rozkładu normalnego nie zależy od stopni

swobody. Im mniejsza jest liczba stopni swobody, tym większa jest różnica między
rozkładem normalnym a t Studenta i odwrotnie.

Znaczenie rozkładu normalnego

Rozkład normalny ma szczególnie duże znaczenie w statystyce matematycznej, gdyż wiele cech
różnych zbiorowości charakteryzuje się takim właśnie rozkładem. W praktyce ze zmiennymi losowymi X o rozkładzie normalnym spotykamy się w przypadkach, gdy
na wartość X ma wpływ duża ilość niezależnie działających czynników, z których
każdy ma znikomy efekt. Typowym przykładem może tu być wysokość położenia
cząstki w procesie dyfuzji, błąd pomiaru, wzrost ludzki itp[4]

Bibliografia

  1. M.Krzysztofiak, A. Luszniewicz, "Statystystyka", Warszawa, 1976
  2. M.Sobczyk, Statystyka, PWN, Warszawa 2005, s. 33
  3. W.Makać, D. Urbanek-Krzysztofiak, "Metody opisu statystycznego", Wydawnictwo UG, Gdańska 2004rok, s. 83.
  4. I.N.Brosztein, Matematyka poradnik encyklopedyczny, PWN, Warszawa 1968

Autor: Nowacka Bernadeta