Poziom istotności

Poziom istotności
Polecane artykuły

Poziom istotności W statystyce wartość zmiennej nazywa się statystycznie istotną, jeśli prawdopodobieństwo przypadkowego wystąpienia tej lub nawet bardziej ekstremalnych wartości jest małe. Tutaj skrajność rozumiana jest jako stopień odchylenia statystyk testowych od hipotezy zerowej (I. Gurkov 2005, s.56-57). Różnicę nazywa się statystycznie istotną, jeśli pojawienie się dostępnych danych (lub nawet bardziej ekstremalnych danych) byłoby mało prawdopodobne, zakładając, że różnica ta jest nieobecna. To wyrażenie nie oznacza, że różnica ta powinna być duża, ważna lub znacząca w ogólnym znaczeniu tego słowa (V. Tutubalin 1992, rozdział 1, pkt 7).


W teście hipotezy statystycznej (R. M. Sirkin 2005, s. 271–316;C. M. Borror 2009, s. 418–472) wynik ma znaczenie statystyczne, gdy jest bardzo mało prawdopodobny, biorąc pod uwagę hipotezę zerową (J. L. Myers, A. D. Well, Lorch Jr., F. Robert 2010, s. 65–90). Dokładniej, zdefiniowany poziom istotności badania α, jest prawdopodobieństwem, że badanie odrzuciło hipotezę zerową, biorąc pod uwagę, że było to prawdą (P. Dalgaard 2008, s. 155–56), a wartość p wyniku, jest prawdopodobieństwem uzyskania wyniku w co najmniej tak skrajne, biorąc pod uwagę, że hipoteza zerowa była prawdziwa. W każdym eksperymencie lub obserwacji, która polega na losowaniu próbki z populacji, zawsze istnieje możliwość, że zaobserwowany efekt wystąpiłby sam z powodu błędu próbkowania (E. R. Babbie 2013, s. 185–226; V. Faherty 2008, s. 127–138). Ale jeśli wartość p obserwowanego efektu jest mniejsza niż poziom istotności, badacz może stwierdzić, że efekt odzwierciedla charakterystykę całej populacji, tym samym odrzucając hipotezę zerową (S. McKillup 2006, s. 44–56).

Rola w testowaniu hipotez statystycznych

Istotność statystyczna odgrywa kluczową rolę w testowaniu hipotez statystycznych. Służy do określenia, czy hipoteza zerowa powinna zostać odrzucona, czy zatrzymana. Hipoteza zerowa jest domyślnym założeniem, że nic się nie wydarzyło ani nie zmieniło (K. J. Meier, J. L. Brudney, J. Bohte 2011, s. 189–209). Aby hipoteza zerowa została odrzucona, obserwowany wynik musi być statystycznie istotny, tj. obserwowana wartość p jest mniejsza niż wcześniej określony poziom istotności. Aby ustalić, czy wynik jest statystycznie istotny, badacz oblicza wartość p, która jest prawdopodobieństwem zaobserwowania efektu tej samej wielkości lub bardziej ekstremalnego, biorąc pod uwagę, że hipoteza zerowa jest prawdziwa. (J. L. Devore 2011, s. 300–344). Hipoteza zerowa jest odrzucana, jeśli wartość p jest mniejsza od z góry określonego poziomu α. α nazywa się poziomem istotności i jest to prawdopodobieństwo odrzucenia hipotezy zerowej, biorąc pod uwagę, że jest ona prawdziwa (błąd typu I). Zwykle wynosi ona 5% lub mniej. Na przykład, gdy α jest ustawione na 5%, prawdopodobieństwo warunkowe błędu typu I, biorąc pod uwagę, że hipoteza zerowa jest prawdziwa, wynosi 5% (J. F. Healy 2009, s. 177–205), a statystycznie istotny wynik to taki, w którym zaobserwowana wartość p jest mniejsza niż 5% (S. McKillup 2006, s. 32–38). Podczas pobierania danych z próbki oznacza to, że region odrzucenia zawiera 5% rozkładu próbkowania (D. Health 1995, s. 123–154). Te 5% może być przypisane do jednej strony rozkładu próbkowania, jak w badaniu jednostronnym, lub podzielone na obie strony dystrybucji, jak w teście dwustronnym, z każdym ogonem (lub regionem odrzucenia) zawierającym 2,5% dystrybucja.

Rys. 1 W teście dwustronnym obszar odrzucania dla poziomu istotności α = 0,05 jest podzielony na oba końce rozkładu próbkowania i stanowi 5% powierzchni pod krzywą (białe obszary).

Zastosowanie jednostronnego testu zależy od tego, czy pytanie badawcze lub alternatywna hipoteza określa kierunek, na przykład, czy grupa obiektów jest cięższa, czy też ocena uczniów jest lepsza (J. L. Myers, A. D. Well, Lorch Jr., F. Robert 2010, s. 65–90). Dwu-ogonowy test może być nadal stosowany, ale będzie mniej skuteczny niż test jednostronny, ponieważ region odrzucania dla pojedynczego testu koncentruje się na jednym końcu rozkładu zerowego i jest dwukrotnie większy (5% vs. 2,5%) każdego regionu odrzucenia dla testu dwustronnego. W rezultacie hipoteza zerowa może zostać odrzucona z mniej ekstremalnym wynikiem, jeśli zastosuje się jednostronny test (P. R. Hinton 2010, s. 79–90). Test jednostronny jest tylko silniejszy niż test dwustronny, jeśli określony kierunek alternatywnej hipotezy jest poprawny. Jeśli jednak jest źle, to jednostronny test nie ma mocy.

Bibliografia

Autor: Volodymyr Perets