Estymator obciążony: Różnice pomiędzy wersjami
m (Infobox update) |
(LinkTitles.) |
||
Linia 20: | Linia 20: | ||
podstawie [[próba|próby]]: | podstawie [[próba|próby]]: | ||
: <math>Z_n= f\left (X_1, X_2, X_3....X_n\right)</math>, | : <math>Z_n= f\left (X_1, X_2, X_3....X_n\right)</math>, | ||
to konkretna wartość T, jaką [[zmienna]] będzie przyjmować, nazywamy oceną punktową | to konkretna [[wartość]] T, jaką [[zmienna]] będzie przyjmować, nazywamy oceną punktową | ||
parametru Q- czyli wartość estymatora.<br> | parametru Q- czyli wartość estymatora.<br> | ||
Estymator nazywamy '''obciążonym''', jeżeli jego wartość oczekiwana nie jest | Estymator nazywamy '''obciążonym''', jeżeli jego [[wartość oczekiwana]] nie jest | ||
równa faktycznej wartości parametru populacji generalnej, tj: | równa faktycznej wartości parametru populacji generalnej, tj: | ||
Linia 32: | Linia 32: | ||
Tak więc z estymatorem obciążonym mamy do czynienia jeżeli pomiędzy średnią wartością estymatora a wartością parametru występuje różnica.<br> | Tak więc z estymatorem obciążonym mamy do czynienia jeżeli pomiędzy średnią wartością estymatora a wartością parametru występuje różnica.<br> | ||
Im większa jest ta różnica, tym parametr populacji oszacowany jest z większym błędem systematycznym, nielosowym. Jedynie [[estymator nieobciążony]]<br> | Im większa jest ta różnica, tym parametr populacji oszacowany jest z większym błędem systematycznym, nielosowym. Jedynie [[estymator nieobciążony]]<br> | ||
pozwala przyjmować założenie, że suma błędów popełnionych przy wielokrotnym (teoretycznie nieskończonym) powtarzaniu szacunku parametru<br> | pozwala przyjmować [[założenie]], że suma błędów popełnionych przy wielokrotnym (teoretycznie nieskończonym) powtarzaniu szacunku parametru<br> | ||
populacji na podstawie próby jest równa zeru. | populacji na podstawie próby jest równa zeru. | ||
(Jeżeli <math>b (Z_n)</math> > 0 to estymator obciążony daje oceny przeciętnie zawyżone w stosunku do szacowanego parametru,<br> | (Jeżeli <math>b (Z_n)</math> > 0 to estymator obciążony daje oceny przeciętnie zawyżone w stosunku do szacowanego parametru,<br> | ||
Linia 100: | Linia 100: | ||
<center><math>E\left (S^2\right)=\sigma^2\frac{n-1}{n}</math></center> oraz <center><math> E\left (\bar{S^2}\right) = \sigma^2.</math></center> | <center><math>E\left (S^2\right)=\sigma^2\frac{n-1}{n}</math></center> oraz <center><math> E\left (\bar{S^2}\right) = \sigma^2.</math></center> | ||
Oznacza to, że statystyka <math>\bar{S^2}</math> jest estymatorem nieobciążonym wariancji, natomiast statystyka '''<math>S^2</math>''' - estymatorem '''obciążonym''' wariancji.<br> | Oznacza to, że [[statystyka]] <math>\bar{S^2}</math> jest estymatorem nieobciążonym wariancji, natomiast statystyka '''<math>S^2</math>''' - estymatorem '''obciążonym''' wariancji.<br> | ||
'''Obciążenie''' estymatora <math>S^2</math> wynosi <center><math>b_n= E\left (S^2\right)</math> - <math>\sigma^2= \sigma^2 \frac{n-1}{n} - \sigma^2</math> = <math>-\sigma^2 \frac{1}{n}</math></center> | '''[[Obciążenie]]''' estymatora <math>S^2</math> wynosi <center><math>b_n= E\left (S^2\right)</math> - <math>\sigma^2= \sigma^2 \frac{n-1}{n} - \sigma^2</math> = <math>-\sigma^2 \frac{1}{n}</math></center> | ||
Obciążenie to jest mniejsze od zera, co oznacza, że statystyka <math>S^2</math> przeciętnie nie doszacowuje wartości <math>\sigma^2</math> populacji. | Obciążenie to jest mniejsze od zera, co oznacza, że statystyka <math>S^2</math> przeciętnie nie doszacowuje wartości <math>\sigma^2</math> populacji. | ||
Ponieważ: | Ponieważ: | ||
Linia 116: | Linia 116: | ||
:2. Estymatorem częstości względnej z populacji generalnej <math>E\left (w_i\right)= p_i </math> jest częstosć względna ([[wskaźnik]] struktury) z próby losowej <math>w_i</math> | :2. Estymatorem częstości względnej z populacji generalnej <math>E\left (w_i\right)= p_i </math> jest częstosć względna ([[wskaźnik]] struktury) z próby losowej <math>w_i</math> | ||
o rozkładzie normalnym Gaussa- Laplace`a w przypadku dużej próby i o rozkładzie dwumianowym Bernouliego- w przypadku małej próby. | o rozkładzie normalnym Gaussa- Laplace`a w przypadku dużej próby i o rozkładzie dwumianowym Bernouliego- w przypadku małej próby. | ||
:3. Estymatorem odchylenia standardowego z populacji generalnej <math> E\left[S\left (x\right)\right]= \sigma (X)</math> jest odchylenie standardowe z próby | :3. Estymatorem odchylenia standardowego z populacji generalnej <math> E\left[S\left (x\right)\right]= \sigma (X)</math> jest [[odchylenie standardowe]] z próby | ||
losowej S (x) o rozkładzie normalnym Gaussa- Laplace`a w przypadku dużej próby, natomiast estymatorem wariancji z populacji generalnej <math> E\left[S\left (x\right)\right]= \sigma^2(X)</math> <br>w przypadku | losowej S (x) o rozkładzie normalnym Gaussa- Laplace`a w przypadku dużej próby, natomiast estymatorem wariancji z populacji generalnej <math> E\left[S\left (x\right)\right]= \sigma^2(X)</math> <br>w przypadku | ||
małej próby jest [[wariancja]] z próby <math>S^2</math>(x) o rozkładzie [[test zgodności chi-kwadrat|chi-kwadrat]].(M. Krzysztofiak, 1976) | małej próby jest [[wariancja]] z próby <math>S^2</math>(x) o rozkładzie [[test zgodności chi-kwadrat|chi-kwadrat]].(M. Krzysztofiak, 1976) |
Wersja z 19:24, 19 maj 2020
Estymator obciążony |
---|
Polecane artykuły |
Estymator jest oceną parametru populacji. Jeżeli parametr populacji generalnej oznaczymy przez Q, przez - funkcję (estymator) wartości zmiennych uzyskanych na podstawie próby:
- ,
to konkretna wartość T, jaką zmienna będzie przyjmować, nazywamy oceną punktową
parametru Q- czyli wartość estymatora.
Estymator nazywamy obciążonym, jeżeli jego wartość oczekiwana nie jest równa faktycznej wartości parametru populacji generalnej, tj:
a wyrażenie
nazywamy obciążeniem estymatora.(M.Sobczyk, 2005)
Tak więc z estymatorem obciążonym mamy do czynienia jeżeli pomiędzy średnią wartością estymatora a wartością parametru występuje różnica.
Im większa jest ta różnica, tym parametr populacji oszacowany jest z większym błędem systematycznym, nielosowym. Jedynie estymator nieobciążony
pozwala przyjmować założenie, że suma błędów popełnionych przy wielokrotnym (teoretycznie nieskończonym) powtarzaniu szacunku parametru
populacji na podstawie próby jest równa zeru.
(Jeżeli > 0 to estymator obciążony daje oceny przeciętnie zawyżone w stosunku do szacowanego parametru,
natomiast jeżeli b (Zn) < 0
to estymator obciążony daje oceny przeciętnie zaniżone w stosunku do szacowanego parametru).
Dowód na obciążenie estymatora
Nieobciążony estymator wariancji (znajoma jest nam wartość oczekiwana ):
Obciążony estymator wariancji (nie wiemy jaka jest wartość oczekiwana , więc zastępujemy ją estymatorem ):
Rozwijając równanie otrzymujemy:
=
=
Aby dowiedzieć się, że powyższy estymator jest obciążony musimy zbadać wartość oczekiwaną:
Można zapisać:
gdzie to wartość nieobciążonego estymatora wariancji
W celu rozwinięcia wprowadzamy zmienną losową :
Zakładamy, że ciąg jest ciągiem zmiennych losowych niezależnych o jednakowym rozkładzie i parametrach oraz . Założenie to jest prawdziwe, ponieważ ciąg jest realizacją próby
Wartość oczekiwania zmiennej losowej :
Na podstawie własności wartości oczekiwanej można powyższe równanie rozwiązać w następujący sposób:
Wariancja losowej :
Rozwijając to równanie otrzymujemy:
Z powyższych równań można wywnioskować:
Podstawiając równania:
oraz do
Otrzymujemy:
Co pokazuje że wartość oczekiwana obciążonego estymatora jest różna od prawdziwej wartości wariancji:
Parser nie mógł rozpoznać (błąd składni): {\displaystyle E (S^2)≠\sigma^2}
c.n.d (M. Bodjański, 2008)
Przykład
Dla dowolnego rozkładu populacji z wariancją oraz średnią m., niech statystyki:
będą estymatorami wariancji w n-elementowej próbie. Można wykazać, że
oraz
Oznacza to, że statystyka jest estymatorem nieobciążonym wariancji, natomiast statystyka - estymatorem obciążonym wariancji.
Obciążenie estymatora wynosi
Obciążenie to jest mniejsze od zera, co oznacza, że statystyka przeciętnie nie doszacowuje wartości populacji. Ponieważ:
to oznacza, że statystyka jest estymatorem asymptotycznie nieobciążonym (przy dużych próbach obciążenie to nie ma praktycznie znaczenia).
Estymatory podstawowych parametrów
Estymację parametrów rozkładu jednej zmiennej ograniczę do estymacji średniej arytmetycznej, częstości względnej (frakcji) oraz wariancji
populacji generalnej. Wyodrębnię estymację przedziałową tych parametrów w przypadkach dużej próby losowej (n>30) i małej próby losowej (n<30).
Estymatory wymienionych parametrów rozkładów jednej zmiennej są następujące:
- 1. Estymatorem średniej arytmetycznej populacji generalnej jest średnia arytmetyczna z próby losowej ,
o rozkładzie normalnym Gaussa- Laplace`a, w przypadku dużej próby i o rozkładzie t Studenta, w przypadku małej próby
- 2. Estymatorem częstości względnej z populacji generalnej jest częstosć względna (wskaźnik struktury) z próby losowej
o rozkładzie normalnym Gaussa- Laplace`a w przypadku dużej próby i o rozkładzie dwumianowym Bernouliego- w przypadku małej próby.
- 3. Estymatorem odchylenia standardowego z populacji generalnej jest odchylenie standardowe z próby
losowej S (x) o rozkładzie normalnym Gaussa- Laplace`a w przypadku dużej próby, natomiast estymatorem wariancji z populacji generalnej
w przypadku
małej próby jest wariancja z próby (x) o rozkładzie chi-kwadrat.(M. Krzysztofiak, 1976)
Bibliografia
- Adrian A. (2014) Statystyka i Opracowanie Danych
- Błaszczyński J. (2018) Estymatory - Statystyka i analiza danych 2017/2018
- Bodjański M. (2008) Estymator wariancji - dowód na obciążenie, Problemy techniki uzbrojenia, s. 96
- Krzysztofiak M. (1976) Statystyka, PWE, Warszawa, s. 172
- Sobczyk M. (2005) Statystyka, PWN, Warszawa, s. 141
Autor: Nowacka Bernadeta, Kamil Niemiec