Testy statystyczne

Z Encyklopedia Zarządzania

Test statystyczny to reguła postępowania, która przyporządkowuje wynikom próby losowej decyzję przyjęcia lub odrzucenia hipotezy zerowej.

Wersja formalna testu statystycznego inaczej niezrandomizowanego wygląda następująco: "Testem hipotezy H0 przeciw alternatywie H1 nazywamy statystykę, gdzie X jest przestrzenią realizacji, natomiast wartość 1 interpretuje się jako decyzję o odrzuceniu hipotezy H0, zaś 0 oznacza, że nie należy odrzucać H0."

Hipoteza i poziom istotności

Hipoteza statystyczna to przypuszczenie odnośnie rozkładu populacji generalnej. Jej prawdziwość ocenia się na podstawie wyników próby losowej.

Hipotezę, którą należy zweryfikować określa się mianem hipotezy zerowej H0, natomiast hipotezę niepodlegającą weryfikacji jako hipotezę alternatywną H1.

Hipoteza zerowa może być prawdziwa lub fałszywa. Wówczas rozpatruje się następujące przypadki:

  • H0 jest prawdziwa – test potwierdził H0 lub test obalił hipotezę zerową i w zamian przyjęto hipotezę alternatywną – określa się to jako błąd I rodzaju.
  • H0 jest fałszywa – test potwierdził H0 (błąd drugiego rodzaju) lub test obalił hipotezę zerową, na miejsce której przyjęto hipotezę alternatywną.

O odrzuceniu H0 lub stwierdzeniu, że nie ma podstaw do jej odrzucenia decyduje się na podstawie testów istotności. Wykorzystuje się do tego p-value, czyli poziom istotności, który jest najmniejszym poziomem, przy którym dla danej wartości statystyki testowej odrzucona zostałaby H0. Zwykle p-value wynosi 0,05.

W praktyce testy istotności są stosowane najczęściej. Ich przebieg oparty jest na następującym schemacie:

  • Ustalenie hipotezy – określenie hipotezy zerowej oraz postawienie hipotezy przeciwnej czyli hipotezy alternatywnej.
  • Dobranie statystyki testowej – „statystyka testowa to zmienna losowa, której wartość oblicza się na podstawie danych z próby. Zależnie od uzyskanych wartości podejmuje się decyzje o odrzuceniu lub nieodrzuceniu hipotezy zerowej na rzecz hipotezy alternatywnej.
  • Ustalenie zbioru krytycznego– „ Zbiór krytyczny to taki podzbiór wartości, jakie może przyjmować statystyka testowa, że prawdopodobieństwo, iż wyliczona wartość statystyki testowej na podstawie pobranej próby należy do tego zbioru, jest równe α.”
  • Podjęcie decyzji – jeśli statystyka dla danych z próby ma wartość należącą do zbioru krytycznego wówczas należy odrzucić H0. Natomiast jeśli statystyka testowa nie należy do zbioru to nie ma podstaw do odrzucenia H0.

Podział testów statystycznych

Testy parametryczne dotyczą parametrów statystycznych populacji. Ze względu na zastosowanie testy te dzielą się na dwie grupy:

Służące do weryfikacji populacji jednowymiarowych:

  • testy dla średniej,
  • testy dla proporcji,
  • testy dla wariancji

Służące do porównania własności dwóch populacji:

  • testy dla dwóch średnich,
  • testy dla dwóch proporcji,
  • testy dla dwóch wariancji.

Testy nieparametryczne dotyczą rozkładu zmiennej lub losowości próby. Tego rodzaju testy również można podzielić ze względu na zastosowanie:

Weryfikujące własności populacji jednowymiarowych:

  • test zgodności chi-kwadrat,
  • test zgodności Kołmogorowa,
  • test normalności Shapiro-Wilka,
  • test serii.

Porównujące własność dwóch populacji:

  • test Kołmogorowa – Smirnowa,
  • test jednorodności chi-kwadrat,
  • test mediany,
  • test serii,
  • test znaków.

Wnioskowanie Bayesowskie

Metodę wnioskowania statystycznego wykorzystującą twierdzenie Bayesa nazywa się wnioskowaniem lub statystyką bayesowską. Polega ona na aktualizacji prawdopodobieństwa subiektywnego hipotez na podstawie dotychczasowego prawdopodobieństwa i nowych danych.

Twierdzenie Bayesa wyraża zależność: „prawdopodobieństwo hipotezy H w świetle danych E, odpowiada prawdopodobieństwu danych E przy założeniu hipotezy H, pomnożonemu przez dotychczasowe prawdopodobieństwo H i podzielonemu przez prawdopodobieństwo danych E”.

Bibliografia

  • Bobowski Z. (2004), Wybrane metody statystyki opisowej w wnioskowania statystycznego, Wydawnictwo WWSZiP, s. 137-157.
  • Domański Cz. i in. (2014), Testy statystyczne w procesie podejmowania decyzji, Wydawnictwo Uniwersytetu Łódzkiego, Łódź, s. 11-28.
  • Kurkiewicz J. (2005), Podstawy statystyki, Oficyna Wydawnicza AFM, Kraków, s 190-203.
  • Smaga, Ł. (2017). Bootstrap methods for multivariate hypothesis testing. Communications in Statistics - Simulation and Computation 46, 7654–7667.
  • Smaga, Ł. (2015). Wald-type statistics using {2}-inverses for hypothesis testing in general factorial designs. Statistics & Probability Letters 107, 215–220.
  • Sobczyk M. (2007), Statystyka, Wydawnictwo Naukowe PWN, Warszawa, s. 146-150..

Autor: Anna Tas