Poziom istotności
Poziom istotności |
---|
Polecane artykuły |
Poziom istotności W statystyce wartość zmiennej nazywa się statystycznie istotną, jeśli prawdopodobieństwo przypadkowego wystąpienia tej lub nawet bardziej ekstremalnych wartości jest małe. Tutaj skrajność rozumiana jest jako stopień odchylenia statystyk testowych od hipotezy zerowej (I. Gurkov 2005, s.56-57). Różnicę nazywa się statystycznie istotną, jeśli pojawienie się dostępnych danych (lub nawet bardziej ekstremalnych danych) byłoby mało prawdopodobne, zakładając, że różnica ta jest nieobecna. To wyrażenie nie oznacza, że różnica ta powinna być duża, ważna lub znacząca w ogólnym znaczeniu tego słowa (V. Tutubalin 1992, rozdział 1, pkt 7).
W teście hipotezy statystycznej (R. M. Sirkin 2005, s. 271-316;C. M. Borror 2009, s. 418-472) wynik ma znaczenie statystyczne, gdy jest bardzo mało prawdopodobny, biorąc pod uwagę hipotezę zerową (J. L. Myers, A. D. Well, Lorch Jr., F. Robert 2010, s. 65-90). Dokładniej, zdefiniowany poziom istotności badania α, jest prawdopodobieństwem, że badanie odrzuciło hipotezę zerową, biorąc pod uwagę, że było to prawdą (P. Dalgaard 2008, s. 155-56), a wartość p wyniku, jest prawdopodobieństwem uzyskania wyniku w co najmniej tak skrajne, biorąc pod uwagę, że hipoteza zerowa była prawdziwa. W każdym eksperymencie lub obserwacji, która polega na losowaniu próbki z populacji, zawsze istnieje możliwość, że zaobserwowany efekt wystąpiłby sam z powodu błędu próbkowania (E. R. Babbie 2013, s. 185-226; V. Faherty 2008, s. 127-138). Ale jeśli wartość p obserwowanego efektu jest mniejsza niż poziom istotności, badacz może stwierdzić, że efekt odzwierciedla charakterystykę całej populacji, tym samym odrzucając hipotezę zerową (S. McKillup 2006, s. 44-56).
Rola w testowaniu hipotez statystycznych
Istotność statystyczna odgrywa kluczową rolę w testowaniu hipotez statystycznych. Służy do określenia, czy hipoteza zerowa powinna zostać odrzucona, czy zatrzymana. Hipoteza zerowa jest domyślnym założeniem, że nic się nie wydarzyło ani nie zmieniło (K. J. Meier, J. L. Brudney, J. Bohte 2011, s. 189-209). Aby hipoteza zerowa została odrzucona, obserwowany wynik musi być statystycznie istotny, tj. obserwowana wartość p jest mniejsza niż wcześniej określony poziom istotności. Aby ustalić, czy wynik jest statystycznie istotny, badacz oblicza wartość p, która jest prawdopodobieństwem zaobserwowania efektu tej samej wielkości lub bardziej ekstremalnego, biorąc pod uwagę, że hipoteza zerowa jest prawdziwa. (J. L. Devore 2011, s. 300-344). Hipoteza zerowa jest odrzucana, jeśli wartość p jest mniejsza od z góry określonego poziomu α. α nazywa się poziomem istotności i jest to prawdopodobieństwo odrzucenia hipotezy zerowej, biorąc pod uwagę, że jest ona prawdziwa (błąd typu I). Zwykle wynosi ona 5% lub mniej. Na przykład, gdy α jest ustawione na 5%, prawdopodobieństwo warunkowe błędu typu I, biorąc pod uwagę, że hipoteza zerowa jest prawdziwa, wynosi 5% (J. F. Healy 2009, s. 177-205), a statystycznie istotny wynik to taki, w którym zaobserwowana wartość p jest mniejsza niż 5% (S. McKillup 2006, s. 32-38). Podczas pobierania danych z próbki oznacza to, że region odrzucenia zawiera 5% rozkładu próbkowania (D. Health 1995, s. 123-154). Te 5% może być przypisane do jednej strony rozkładu próbkowania, jak w badaniu jednostronnym, lub podzielone na obie strony dystrybucji, jak w teście dwustronnym, z każdym ogonem (lub regionem odrzucenia) zawierającym 2,5% dystrybucja.
Zastosowanie jednostronnego testu zależy od tego, czy pytanie badawcze lub alternatywna hipoteza określa kierunek, na przykład, czy grupa obiektów jest cięższa, czy też ocena uczniów jest lepsza (J. L. Myers, A. D. Well, Lorch Jr., F. Robert 2010, s. 65-90). Dwu-ogonowy test może być nadal stosowany, ale będzie mniej skuteczny niż test jednostronny, ponieważ region odrzucania dla pojedynczego testu koncentruje się na jednym końcu rozkładu zerowego i jest dwukrotnie większy (5% vs. 2,5%) każdego regionu odrzucenia dla testu dwustronnego. W rezultacie hipoteza zerowa może zostać odrzucona z mniej ekstremalnym wynikiem, jeśli zastosuje się jednostronny test (P. R. Hinton 2010, s. 79-90). Test jednostronny jest tylko silniejszy niż test dwustronny, jeśli określony kierunek alternatywnej hipotezy jest poprawny. Jeśli jednak jest źle, to jednostronny test nie ma mocy.
Bibliografia
- Borror C. M. (2009) Statistical decision making, The Certified Quality Engineer Handbook (3rd ed.). Milwaukee, WI: ASQ Quality Press
- Devore J. L (2011) Probability & Statistics for Engineering and the Sciences, Eight Edition
- Faherty V. (2008) Probability and statistical significance, Compassionate Statistics: Applied Quantitative Analysis for Social Services (With exercises and instructions in SPSS) (1st ed.)
- Gurkov I. (2005) Wpływ zintegrowanych struktur zarządzania na rozwój innowacyjności przedsiębiorstw: próba analizy empirycznej
- Health D. (1995) An Introduction To Experimental Design And Statistics For Biology (1st ed.)
- Hinton P. R. (2010) Significance, error, and power, Statistics explained (2nd ed.)
- McKillup S. (2006) Statistics Explained: An Introductory Guide for Life Scientists (1st ed.)
- Meier K. J., Brudney J. L., Bohte J. (2011) Applied Statistics for Public and Nonprofit Administration (3rd ed.)
- Myers J. L., Well A. D., Lorch Jr., Robert F. (2010) Developing fundamentals of hypothesis testing using the binomial distribution
- Sirkin R. M. (2005) Two-sample t tests, Statistics for the Social Sciences (3rd ed.). Thousand Oaks, CA: SAGE Publications
- Tutubalin V. (1992) Teoria prawdopodobieństwa i procesy losowe
Autor: Volodymyr Perets