Test zgodności chi-kwadrat: Różnice pomiędzy wersjami

Z Encyklopedia Zarządzania
(LinkTitles.)
m (cleanup bibliografii i rotten links)
 
(Nie pokazano 16 wersji utworzonych przez 2 użytkowników)
Linia 1: Linia 1:
{{infobox4
'''Test zgodności chi-kwadrat''' jest to najczęściej stosowany test nieparametryczny. Służy on do weryfikowania hipotezy, że obserwowana cecha X w zbiorowości generalnej ma określony typ rozkładu, np. dwumianowy, Poissona, normalny itd.
|list1=
<ul>
<li>[[Przedział ufności]]</li>
<li>[[Estymator]]</li>
<li>[[Zmienna losowa]]</li>
<li>[[Percentyl]]</li>
<li>[[Metody statystyczne]]</li>
<li>[[Estymator nieobciążony]]</li>
<li>[[Estymator obciążony]]</li>
<li>[[Wartościowanie jakości]]</li>
<li>[[Estymacja]]</li>
</ul>
}}


 
"Testy zgodności służą do weryfikacji hipotezy o tym, że rozkład prawdopodobieństwa badanej cechy jest rozkładem określonego typu. Testy te są oczywiście testami nieparametrycznymi, gdyż testując hipotezę o typie rozkładu, nie możemy zakładać, jaki on jest.
 
Test zgodności chi-kwadrat wymaga dużej próby wylosowanej w sposób niezależny ze zbiorowości generalnej. Pozwala testować rozkłady zmiennej losowej skokowej, lub rozkłady zmiennej losowej ciągłej. [[Próba]] powinna być podzielona na rozłączne klasy w taki sposób, aby w każdej klasie była wystarczająca liczba obserwacji. Na ogół wymóg ten to około pięciu do dziesięciu obserwacji. To zastrzeżenie należy brać pod uwagę, jeżeli samodzielnie tworzymy szereg rozdzielczy zmiennej ciągłej. Dla zmiennej skokowej o niezbyt dużej liczbie możliwych realizacji, tzw. klasy są tworzone naturalnie przez kolejne wartości należące do zbioru realizacji".<ref>Kot M.S. Jakubowski J. Sokołowski A.(2011), ''Statystyka'', Wydawnictwo Difin, Warszawa s.241</ref>
'''Test zgodności chi-kwadrat''' jest to najczęściej stosowany test nieparametryczny. Służy on do weryfikowania hipotezy, że obserwowana cecha X w zbiorowości generalnej ma określony typ rozkładu, np. dwumianowy, Poissona, normalny itd.
 
"Testy zgodności służą do weryfikacji hipotezy o tym, że rozkład prawdopodobieństwa badanej cechy jest rozkładem określonego typu. Testy te są oczywiście testami nieparametrycznymi, gdyż testując hipotezę o typie rozkładu, nie możemy zakładać, jaki on jest.  
Test zgodności chi-kwadrat wymaga dużej próby wylosowanej w sposób niezależny ze zbiorowości generalnej. Pozwala testować rozkłady zmiennej losowej skokowej, lub rozkłady zmiennej losowej ciągłej. [[Próba]] powinna być podzielona na rozłączne klasy w taki sposób, aby w każdej klasie była wystarczająca liczba obserwacji. Na ogół wymóg ten to około pięciu do dziesięciu obserwacji. To zastrzeżenie należy brać pod uwagę, jeżeli samodzielnie tworzymy szereg rozdzielczy zmiennej ciągłej. Dla zmiennej skokowej o niezbyt dużej liczbie możliwych realizacji, tzw. klasy są tworzone naturalnie przez kolejne wartości należące do zbioru realizacji."<ref>Kot M.S. Jakubowski J. Sokołowski A.(2011), ''Statystyka'', Wydawnictwo Difin, Warszawa s.241</ref>


Przykłady formułowania hipotezy:
Przykłady formułowania hipotezy:
Linia 25: Linia 8:
* H0: cecha X ma rozkład N (100, 5)
* H0: cecha X ma rozkład N (100, 5)


Aby jednoznacznie określić rozkład teoretyczny w danej klasie najczęściej należy najpierw na podstawie [[próba|próby]] oszacować odpowiednie parametry.  
Aby jednoznacznie określić rozkład teoretyczny w danej klasie najczęściej należy najpierw na podstawie [[próba|próby]] oszacować odpowiednie parametry.


Test zgodności chi-kwadrat stosuje się:
Test zgodności chi-kwadrat stosuje się:
* gdy [[dane]] pochodzą z dużej n-elementowej próby wyznaczonej w sposób niezależny
* gdy [[dane]] pochodzą z dużej n-elementowej próby wyznaczonej w sposób niezależny
* gdy dane są przedstawione w postaci szeregu rozdzielczego o r przedziałach klasowych, o liczebnościach przedziałów n,..., n spełniających warunek  
* gdy dane są przedstawione w postaci szeregu rozdzielczego o r przedziałach klasowych, o liczebnościach przedziałów n,..., n spełniających warunek
 
''' n1 + n2 +... + nr = n. Na ogół przyjmuje się, że ni >5, i = 1, 2,..., r'''
''' n1 + n2 +... + nr = n. Na ogół przyjmuje się, że ni >5, i = 1, 2,..., r'''
* gdy rozkład hipotetyczny może być zarówno rozkładem typu ciągłego, jak i skokowego.  
* gdy rozkład hipotetyczny może być zarówno rozkładem typu ciągłego, jak i skokowego.
 
<google>n</google>


Postać statystyki sprawdzającej [[hipoteza|hipotezy]] H0:
Postać statystyki sprawdzającej [[hipoteza|hipotezy]] H0:


<math>{\chi}^2=\sum_{i=1}^r\frac{\left (ni-npi\right)^2}{npi}</math>
<math>{\chi}^2=\sum_{i=1}^r\frac{\left (ni-npi\right)^2}{npi}</math>
<google>ban728t</google>
gdzie:
gdzie:
* pi - [[prawdopodobieństwo]], że cecha X przyjmuje [[wartość]] należącą do i-tego przedziału klasowego
* pi - [[prawdopodobieństwo]], że cecha X przyjmuje [[wartość]] należącą do i-tego przedziału klasowego
* npi - liczba jednostek, które powinny znaleźć się w i-tym przedziale przy założeniu, że cecha ma rozkład zgodny z hipotezą.  
* npi - liczba jednostek, które powinny znaleźć się w i-tym przedziale przy założeniu, że cecha ma rozkład zgodny z hipotezą.


[[statystyka]] ta ma rozkład <math>{\chi}^2</math> o ''k=(r-s-1)''
[[statystyka]] ta ma rozkład <math>{\chi}^2</math> o ''k=(r-s-1)''
Linia 50: Linia 34:
<math>{\chi}^2</math> oznacza wartość empiryczną statystyki
<math>{\chi}^2</math> oznacza wartość empiryczną statystyki


Statystka ta stanowi rozbieżność pomiędzy rozkładem empirycznym a teoretycznym, co oznacza że [[zbyt]] duże wartości <math>{\chi}^2</math> powodują odrzucenie hipotezy zerowej.  
Statystka ta stanowi rozbieżność pomiędzy rozkładem empirycznym a teoretycznym, co oznacza że [[zbyt]] duże wartości <math>{\chi}^2</math> powodują odrzucenie hipotezy zerowej.


Postać zbioru krytycznego:
Postać zbioru krytycznego:
Linia 56: Linia 40:
<math>P ({\chi}^2>{\chi}_{\alpha}^2)= {\alpha}</math>
<math>P ({\chi}^2>{\chi}_{\alpha}^2)= {\alpha}</math>


Gdzie:  
Gdzie:
<math>{\chi}_{\alpha}^2</math> - wartość krytyczna z tablic rozkładu <math>{\chi}^2</math> dla k = r - s - 1 stopni swobody i P = alfa
<math>{\chi}_{\alpha}^2</math> - wartość krytyczna z tablic rozkładu <math>{\chi}^2</math> dla k = r - s - 1 stopni swobody i P = alfa


Reguły decyzyjne:
Reguły decyzyjne:
Linia 69: Linia 53:


to odrzuca się hipoteze alternatywną: <math>\sigma^2=\sigma_0^2</math> na [[korzyść]] hipotezy:<math>\sigma^2\ne\sigma_0^2</math>
to odrzuca się hipoteze alternatywną: <math>\sigma^2=\sigma_0^2</math> na [[korzyść]] hipotezy:<math>\sigma^2\ne\sigma_0^2</math>
==TL;DR==
Test zgodności chi-kwadrat jest używany do weryfikowania hipotezy dotyczącej rozkładu cechy w populacji. Test ten jest stosowany, gdy dane pochodzą z dużej próby i mogą być przedstawione w postaci szeregu rozdzielczego. Statystyka testowa jest porównywana z wartością krytyczną, i jeśli jest mniejsza, hipoteza zerowa nie jest odrzucana. Przykład testu zgodności chi-kwadrat dotyczy rzetelności kostki do gry.


==Przykład testu zgodności chi-kwadrat==
==Przykład testu zgodności chi-kwadrat==
 
"Badano [[rzetelność]] kostki do gry, tym celu wykonano nią 150 rzutów. Czy wyniki upoważniają nas do twierdzenia że kostka jest nierzetelna? [[Poziom istotności]] wynosi 0,05. Rozkład wyników przedstawia się następująco:
"Badano [[rzetelność]] kostki do gry, tym celu wykonano nią 150 rzutów. Czy wyniki upoważniają nas do twierdzenia że kostka jest nierzetelna? [[Poziom istotności]] wynosi 0,05. Rozkład wyników przedstawia się następująco:


{| class="wikitable"
{| class="wikitable"
Linia 89: Linia 75:
| 1 || 20 || 1/6 || 25 || -5 || 25 || 1,000
| 1 || 20 || 1/6 || 25 || -5 || 25 || 1,000
|-
|-
| 2 || 23 || 1/6 || 25 || -2 || 4 || 0,160
| 2 || 23 || 1/6 || 25 || -2 || 4 || 0,160
|-
|-
| 3 || 27 || 1/6 || 25 || +2 || 4 || 0,160
| 3 || 27 || 1/6 || 25 || +2 || 4 || 0,160
|-
|-
| 4 || 24 || 1/6 || 25 || -1 || 1 || 0,040
| 4 || 24 || 1/6 || 25 || -1 || 1 || 0,040
|-
|-
| 5 || 24 || 1/6 || 25 || -1 || 1 || 0,040
| 5 || 24 || 1/6 || 25 || -1 || 1 || 0,040
|-
|-
| 6 || 32 || 1/6 || 25 || +7 || 49 || 1,960
| 6 || 32 || 1/6 || 25 || +7 || 49 || 1,960
|-
|-
| Suma || 150 || 1 || 150 || 0 || || 3,360
| Suma || 150 || 1 || 150 || 0 || || 3,360
|} źródło: <ref>Kot M.S. Jakubowski J. Sokołowski A.(2011), ''Statystyka'', Wydawnictwo Difin, Warszawa s.243</ref>
|} źródło: <ref>Kot M.S. Jakubowski J. Sokołowski A.(2011), ''Statystyka'', Wydawnictwo Difin, Warszawa s.243</ref>


Wartość statystyki testowej wynosi więc <math>{\chi}^2 = 3,360</math> . W tablicy rozkładu chi-kwadrat w wierszu piątym, w kolumnie 0,05 znajdziemy wartość krytyczną 11,070. Empiryczna wartość statystyki testowej, czyli 3,360 jest mniejsza od wartości krytycznej 11,070, zatem nie ma podstaw do odrzucenia hipotezy zerowej."<ref>Kot M.S. Jakubowski J. Sokołowski A.(2011), ''Statystyka'', Wydawnictwo Difin, Warszawa s.243</ref>
Wartość statystyki testowej wynosi więc <math>{\chi}^2 = 3,360</math>. W tablicy rozkładu chi-kwadrat w wierszu piątym, w kolumnie 0,05 znajdziemy wartość krytyczną 11,070. Empiryczna wartość statystyki testowej, czyli 3,360 jest mniejsza od wartości krytycznej 11,070, zatem nie ma podstaw do odrzucenia hipotezy zerowej".<ref>Kot M.S. Jakubowski J. Sokołowski A.(2011), ''Statystyka'', Wydawnictwo Difin, Warszawa s.243</ref>


==Bibliografia==
{{infobox5|list1={{i5link|a=[[Przedział ufności]]}} &mdash; {{i5link|a=[[Estymator]]}} &mdash; {{i5link|a=[[Zmienna losowa]]}} &mdash; {{i5link|a=[[Percentyl]]}} &mdash; {{i5link|a=[[Metody statystyczne]]}} &mdash; {{i5link|a=[[Estymator nieobciążony]]}} &mdash; {{i5link|a=[[Estymator obciążony]]}} &mdash; {{i5link|a=[[Wartościowanie jakości]]}} &mdash; {{i5link|a=[[Estymacja]]}} }}
* Domański Cz. Szymczak M.(2014)[https://www.researchgate.net/profile/Marta_Marszalek4/publication/283257721_Satelitarny_rachunek_produkcji_gospodarstw_domowych_jako_sposob_pomiaru_pozarynkowej_dzialalnosci_gospodarstw_domowych_Satellite_Account_of_Household_Production_in_the_context_of_the_measurement_of_ho/links/562f4e8b08ae22b1703715fd.pdf#page=184 ''Analiza niezawodności produktów z wykorzystaniem rozkładu Hjortha i zmodyfikowanego rozkładu Weibulla''] Statystyka - zastosowania biznesowe i społeczne, Wydawnictwo Wyższej Szkoły Menadżerskiej w Warszawie, Warszawa
* Iwasiewicz A. Paszek Z. (2004) ''Statystyka z elementami statystycznych metod monitorowania [[proces]]ów'' Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków
* Kot M.S. Jakubowski J. Sokołowski A.(2011), ''Statystyka'', Wydawnictwo Difin, Warszawa
* Ostasiewicz S. Rusnak Z. Siedlecka U.(1997), ''Statystyka - elementy teorii i zadania'' Wydawnictwo Akademii Ekonomicznej we Wrocławiu, Wrocław
* Niedbalska G.(2016), [http://pressto.amu.edu.pl/index.php/nsw/article/download/4827/4929 ''Statystyka nauki i techniki, nowe idee, projekty i wyzwania''] Nauka i Szkolnictwo Wyższe, Vol.31 Nr.1
* Rumsey D.J.(2016), ''Statystyka dla bystrzaków'', Wydawnictwo Helion, Warszawa
* Sobczyk M.(2007), ''Statystyka'', Wydawnictwo Naukowe PWN, Warszawa
* Witkowski J. (2014), [http://lodz.stat.gov.pl/gfx/lodz/userfiles/_public/pliki/inne/201311_d_konf_swr_streszcz_refer.pdf#page=10 ''Statystyka oficjalna wobez wyzwań globalnych''] Wiadomości statystyczne, Vol.2014 Nr.4


==Przypisy==
==Przypisy==
<references/>
<references />
 


==Bibliografia==
<noautolinks>
* Domański C. Szymczak M. (2014), ''Analiza niezawodności produktów z wykorzystaniem rozkładu Hjortha i zmodyfikowanego rozkładu Weibulla'', Wydawnictwo Wyższej Szkoły Menadżerskiej w Warszawie, Warszawa
* Iwasiewicz A., Paszek Z. (2004), ''Statystyka z elementami statystycznych metod monitorowania procesów'', Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków
* Kot S., Jakubowski J., Sokołowski A. (2011), ''Statystyka'', Difin, Warszawa
* Niedbalska G. (2016), ''[https://pressto.amu.edu.pl/index.php/nsw/article/download/4827/4929 Statystyka nauki i techniki, nowe idee, projekty i wyzwania]'', Nauka i Szkolnictwo Wyższe, Vol.31 Nr.1
* Ostasiewicz S., Rusnak Z., Siedlecka U. (2006), ''Statystyka. Elementy Teorii i Zadania'', Wydawnictwo Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław
* Rumsey D. (2016), ''Statystyka dla bystrzaków'', Helion, Gliwice
* Sobczyk M. (2007), ''Statystyka'', Wydawnictwo Naukowe PWN, Warszawa
* Witkowski J. (2014), ''[https://lodz.stat.gov.pl/gfx/lodz/userfiles/_public/pliki/inne/201311_d_konf_swr_streszcz_refer.pdf#page=10 Statystyka oficjalna wobez wyzwań globalnych]'' Wiadomości statystyczne, Vol. 2014, Nr 4
</noautolinks>


{{a|Magdalena Klepaczka, Aleksandra Kocjan}}
{{a|Magdalena Klepaczka, Aleksandra Kocjan}}
[[Kategoria:Statystyka i Ekonometria]]
[[Kategoria:Miary statystyczne]]
<!--[[en:Chi-square conformance test]]-->
<!--[[en:Chi-square conformance test]]-->
{{#metamaster:description|Test chi-kwadrat jest popularnym testem nieparametrycznym do weryfikacji hipotezy o rozkładzie badanej cechy. Może być stosowany dla cech skokowych i ciągłych.}}

Aktualna wersja na dzień 21:47, 17 gru 2023

Test zgodności chi-kwadrat jest to najczęściej stosowany test nieparametryczny. Służy on do weryfikowania hipotezy, że obserwowana cecha X w zbiorowości generalnej ma określony typ rozkładu, np. dwumianowy, Poissona, normalny itd.

"Testy zgodności służą do weryfikacji hipotezy o tym, że rozkład prawdopodobieństwa badanej cechy jest rozkładem określonego typu. Testy te są oczywiście testami nieparametrycznymi, gdyż testując hipotezę o typie rozkładu, nie możemy zakładać, jaki on jest. Test zgodności chi-kwadrat wymaga dużej próby wylosowanej w sposób niezależny ze zbiorowości generalnej. Pozwala testować rozkłady zmiennej losowej skokowej, lub rozkłady zmiennej losowej ciągłej. Próba powinna być podzielona na rozłączne klasy w taki sposób, aby w każdej klasie była wystarczająca liczba obserwacji. Na ogół wymóg ten to około pięciu do dziesięciu obserwacji. To zastrzeżenie należy brać pod uwagę, jeżeli samodzielnie tworzymy szereg rozdzielczy zmiennej ciągłej. Dla zmiennej skokowej o niezbyt dużej liczbie możliwych realizacji, tzw. klasy są tworzone naturalnie przez kolejne wartości należące do zbioru realizacji".[1]

Przykłady formułowania hipotezy:

  • H0: cecha X ma rozkład określony dystrybuantą F (x) = F0(x)
  • H0: cecha X ma rozkład N (100, 5)

Aby jednoznacznie określić rozkład teoretyczny w danej klasie najczęściej należy najpierw na podstawie próby oszacować odpowiednie parametry.

Test zgodności chi-kwadrat stosuje się:

  • gdy dane pochodzą z dużej n-elementowej próby wyznaczonej w sposób niezależny
  • gdy dane są przedstawione w postaci szeregu rozdzielczego o r przedziałach klasowych, o liczebnościach przedziałów n,..., n spełniających warunek

n1 + n2 +... + nr = n. Na ogół przyjmuje się, że ni >5, i = 1, 2,..., r

  • gdy rozkład hipotetyczny może być zarówno rozkładem typu ciągłego, jak i skokowego.

Postać statystyki sprawdzającej hipotezy H0:

gdzie:

  • pi - prawdopodobieństwo, że cecha X przyjmuje wartość należącą do i-tego przedziału klasowego
  • npi - liczba jednostek, które powinny znaleźć się w i-tym przedziale przy założeniu, że cecha ma rozkład zgodny z hipotezą.

statystyka ta ma rozkład o k=(r-s-1)

  • gdzie:
  • k - ilość stopni swobody
  • s - liczba parametrów do wyznaczenia na podstawie próby
  • r - liczba przedziałów klasowych

oznacza wartość empiryczną statystyki

Statystka ta stanowi rozbieżność pomiędzy rozkładem empirycznym a teoretycznym, co oznacza że zbyt duże wartości powodują odrzucenie hipotezy zerowej.

Postać zbioru krytycznego:

Gdzie: - wartość krytyczna z tablic rozkładu dla k = r - s - 1 stopni swobody i P = alfa

Reguły decyzyjne:

  • jeśli wartość - spełnia nierówność:

albo nierówność:

to odrzuca się hipoteze alternatywną: na korzyść hipotezy:

TL;DR

Test zgodności chi-kwadrat jest używany do weryfikowania hipotezy dotyczącej rozkładu cechy w populacji. Test ten jest stosowany, gdy dane pochodzą z dużej próby i mogą być przedstawione w postaci szeregu rozdzielczego. Statystyka testowa jest porównywana z wartością krytyczną, i jeśli jest mniejsza, hipoteza zerowa nie jest odrzucana. Przykład testu zgodności chi-kwadrat dotyczy rzetelności kostki do gry.

Przykład testu zgodności chi-kwadrat

"Badano rzetelność kostki do gry, tym celu wykonano nią 150 rzutów. Czy wyniki upoważniają nas do twierdzenia że kostka jest nierzetelna? Poziom istotności wynosi 0,05. Rozkład wyników przedstawia się następująco:

Liczba oczek 1 2 3 4 5 6
Liczba rzutów 20 23 27 24 24 32

Rozwiązanie:

1 20 1/6 25 -5 25 1,000
2 23 1/6 25 -2 4 0,160
3 27 1/6 25 +2 4 0,160
4 24 1/6 25 -1 1 0,040
5 24 1/6 25 -1 1 0,040
6 32 1/6 25 +7 49 1,960
Suma 150 1 150 0 3,360

źródło: [2]

Wartość statystyki testowej wynosi więc . W tablicy rozkładu chi-kwadrat w wierszu piątym, w kolumnie 0,05 znajdziemy wartość krytyczną 11,070. Empiryczna wartość statystyki testowej, czyli 3,360 jest mniejsza od wartości krytycznej 11,070, zatem nie ma podstaw do odrzucenia hipotezy zerowej".[3]


Test zgodności chi-kwadratartykuły polecane
Przedział ufnościEstymatorZmienna losowaPercentylMetody statystyczneEstymator nieobciążonyEstymator obciążonyWartościowanie jakościEstymacja

Przypisy

  1. Kot M.S. Jakubowski J. Sokołowski A.(2011), Statystyka, Wydawnictwo Difin, Warszawa s.241
  2. Kot M.S. Jakubowski J. Sokołowski A.(2011), Statystyka, Wydawnictwo Difin, Warszawa s.243
  3. Kot M.S. Jakubowski J. Sokołowski A.(2011), Statystyka, Wydawnictwo Difin, Warszawa s.243

Bibliografia

  • Domański C. Szymczak M. (2014), Analiza niezawodności produktów z wykorzystaniem rozkładu Hjortha i zmodyfikowanego rozkładu Weibulla, Wydawnictwo Wyższej Szkoły Menadżerskiej w Warszawie, Warszawa
  • Iwasiewicz A., Paszek Z. (2004), Statystyka z elementami statystycznych metod monitorowania procesów, Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków
  • Kot S., Jakubowski J., Sokołowski A. (2011), Statystyka, Difin, Warszawa
  • Niedbalska G. (2016), Statystyka nauki i techniki, nowe idee, projekty i wyzwania, Nauka i Szkolnictwo Wyższe, Vol.31 Nr.1
  • Ostasiewicz S., Rusnak Z., Siedlecka U. (2006), Statystyka. Elementy Teorii i Zadania, Wydawnictwo Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław
  • Rumsey D. (2016), Statystyka dla bystrzaków, Helion, Gliwice
  • Sobczyk M. (2007), Statystyka, Wydawnictwo Naukowe PWN, Warszawa
  • Witkowski J. (2014), Statystyka oficjalna wobez wyzwań globalnych Wiadomości statystyczne, Vol. 2014, Nr 4


Autor: Magdalena Klepaczka, Aleksandra Kocjan