Testy statystyczne

Z Encyklopedia Zarządzania

Test statystyczny to reguła postępowania, która przyporządkowuje wynikom próby losowej decyzję przyjęcia lub odrzucenia hipotezy zerowej (M. Sobczyk 2007, s. 147).

Wersja formalna testu statystycznego inaczej niezrandomizowanego wygląda następująco: "Testem hipotezy H0 przeciw alternatywie H1 nazywamy statystykę, gdzie X jest przestrzenią realizacji, natomiast wartość 1 interpretuje się jako decyzję o odrzuceniu hipotezy H0, zaś 0 oznacza, że nie należy odrzucać H0" (M. Sobczyk 2007, s. 147).

Hipoteza i poziom istotności

Hipoteza statystyczna to przypuszczenie odnośnie rozkładu populacji generalnej. Jej prawdziwość ocenia się na podstawie wyników próby losowej (M. Sobczyk 2007, s 146).

Hipotezę, którą należy zweryfikować określa się mianem hipotezy zerowej H0, natomiast hipotezę niepodlegającą weryfikacji jako hipotezę alternatywną H1 (M. Sobczyk 2007, s. 146).

Hipoteza zerowa może być prawdziwa lub fałszywa. Wówczas rozpatruje się następujące przypadki (M. Sobczyk 2007, s. 147):

  • H0 jest prawdziwa – test potwierdził H0 lub test obalił hipotezę zerową i w zamian przyjęto hipotezę alternatywną – określa się to jako błąd I rodzaju.
  • H0 jest fałszywa – test potwierdził H0 (błąd drugiego rodzaju) lub test obalił hipotezę zerową, na miejsce której przyjęto hipotezę alternatywną.

O odrzuceniu H0 lub stwierdzeniu, że nie ma podstaw do jej odrzucenia decyduje się na podstawie testów istotności. Wykorzystuje się do tego p-value, czyli poziom istotności, który jest najmniejszym poziomem, przy którym dla danej wartości statystyki testowej odrzucona zostałaby H0. Zwykle p-value wynosi 0,05 (M. Sobczyk 2007, s. 148).

W praktyce testy istotności są stosowane najczęściej. Ich przebieg oparty jest na następującym schemacie (M. Sobczyk 2007, s. 149-150):

  • Ustalenie hipotezy – określenie hipotezy zerowej oraz postawienie hipotezy przeciwnej czyli hipotezy alternatywnej.
  • Dobranie statystyki testowej – statystyka testowa to zmienna losowa, obliczana na podstawie danych z próby. Na tej podstawie podejmuje się decyzje o odrzuceniu lub nieodrzuceniu hipotezy zerowej na rzecz hipotezy alternatywnej (M. Sobczyk 2007, s. 149).
  • Ustalenie zbioru krytycznego– „ Zbiór krytyczny to taki podzbiór wartości, jakie może przyjmować statystyka testowa, że prawdopodobieństwo, iż wyliczona wartość statystyki testowej na podstawie pobranej próby należy do tego zbioru, jest równe α” (M. Sobczyk 2007, s. 150).
  • Podjęcie decyzji – jeśli statystyka dla danych z próby ma wartość należącą do zbioru krytycznego wówczas należy odrzucić H0. Natomiast jeśli statystyka testowa nie należy do zbioru to nie ma podstaw do odrzucenia H0.

Podział testów statystycznych

Testy parametryczne dotyczą parametrów statystycznych populacji. Ze względu na zastosowanie testy te dzielą się na dwie grupy (Cz. Domański 2014, s. 37-40):

Służące do weryfikacji populacji jednowymiarowych:

  • testy dla średniej,
  • testy dla proporcji,
  • testy dla wariancji

Służące do porównania własności dwóch populacji:

  • testy dla dwóch średnich,
  • testy dla dwóch proporcji,
  • testy dla dwóch wariancji.

Testy nieparametryczne dotyczą rozkładu zmiennej lub losowości próby. Tego rodzaju testy również można podzielić ze względu na zastosowanie (Cz. Domański 2014, s. 37-40):

Weryfikujące własności populacji jednowymiarowych:

  • test zgodności chi-kwadrat,
  • test zgodności Kołmogorowa,
  • test normalności Shapiro-Wilka,
  • test serii.

Porównujące własność dwóch populacji:

  • test Kołmogorowa – Smirnowa,
  • test jednorodności chi-kwadrat,
  • test mediany,
  • test serii,
  • test znaków.

Wnioskowanie Bayesowskie

Metodę wnioskowania statystycznego wykorzystującą twierdzenie Bayesa nazywa się wnioskowaniem lub statystyką bayesowską. Polega ona na aktualizacji prawdopodobieństwa subiektywnego hipotez na podstawie dotychczasowego prawdopodobieństwa i nowych danych (Cz. Domański 2014, s. 87-88).

Twierdzenie Bayesa wyraża zależność: „prawdopodobieństwo hipotezy H w świetle danych E, odpowiada prawdopodobieństwu danych E przy założeniu hipotezy H, pomnożonemu przez dotychczasowe prawdopodobieństwo H i podzielonemu przez prawdopodobieństwo danych E” (Cz. Domański 2014, s. 87-88).

Bibliografia

  • Bobowski Z. (2004), Wybrane metody statystyki opisowej w wnioskowania statystycznego, Wydawnictwo WWSZiP, s. 137-157.
  • Domański Cz. i in. (2014), Testy statystyczne w procesie podejmowania decyzji, Wydawnictwo Uniwersytetu Łódzkiego, Łódź, s. 11-28.
  • Kurkiewicz J. (2005), Podstawy statystyki, Oficyna Wydawnicza AFM, Kraków, s 190-203.
  • Smaga, Ł. (2017), Bootstrap methods for multivariate hypothesis testing, Communications in Statistics - Simulation and Computation 46, 7654–7667.
  • Smaga, Ł. (2015), Wald-type statistics using {2}-inverses for hypothesis testing in general factorial designs Statistics & Probability Letters 107, 215–220.
  • Sobczyk M. (2007), Statystyka, Wydawnictwo Naukowe PWN, Warszawa, s. 146-150..

Autor: Anna Tas