Poziom istotności
Poziom istotności W statystyce wartość zmiennej nazywa się statystycznie istotną, jeśli prawdopodobieństwo przypadkowego wystąpienia tej lub nawet bardziej ekstremalnych wartości jest małe. Tutaj skrajność rozumiana jest jako stopień odchylenia statystyk testowych od hipotezy zerowej (I. Gurkov 2005, s.56-57). Różnicę nazywa się statystycznie istotną, jeśli pojawienie się dostępnych danych (lub nawet bardziej ekstremalnych danych) byłoby mało prawdopodobne, zakładając, że różnica ta jest nieobecna. To wyrażenie nie oznacza, że różnica ta powinna być duża, ważna lub znacząca w ogólnym znaczeniu tego słowa (V. Tutubalin 1992, rozdział 1, pkt 7).
W teście hipotezy statystycznej (R. M. Sirkin 2005, s. 271-316;C. M. Borror 2009, s. 418-472) wynik ma znaczenie statystyczne, gdy jest bardzo mało prawdopodobny, biorąc pod uwagę hipotezę zerową (J. L. Myers, A. D. Well, Lorch Jr., F. Robert 2010, s. 65-90). Dokładniej, zdefiniowany poziom istotności badania α, jest prawdopodobieństwem, że badanie odrzuciło hipotezę zerową, biorąc pod uwagę, że było to prawdą (P. Dalgaard 2008, s. 155-56), a wartość p wyniku, jest prawdopodobieństwem uzyskania wyniku w co najmniej tak skrajne, biorąc pod uwagę, że hipoteza zerowa była prawdziwa. W każdym eksperymencie lub obserwacji, która polega na losowaniu próbki z populacji, zawsze istnieje możliwość, że zaobserwowany efekt wystąpiłby sam z powodu błędu próbkowania (E. R. Babbie 2013, s. 185-226; V. Faherty 2008, s. 127-138). Ale jeśli wartość p obserwowanego efektu jest mniejsza niż poziom istotności, badacz może stwierdzić, że efekt odzwierciedla charakterystykę całej populacji, tym samym odrzucając hipotezę zerową (S. McKillup 2006, s. 44-56).
Rola w testowaniu hipotez statystycznych
Istotność statystyczna odgrywa kluczową rolę w testowaniu hipotez statystycznych. Służy do określenia, czy hipoteza zerowa powinna zostać odrzucona, czy zatrzymana. Hipoteza zerowa jest domyślnym założeniem, że nic się nie wydarzyło ani nie zmieniło (K. J. Meier, J. L. Brudney, J. Bohte 2011, s. 189-209). Aby hipoteza zerowa została odrzucona, obserwowany wynik musi być statystycznie istotny, tj. obserwowana wartość p jest mniejsza niż wcześniej określony poziom istotności. Aby ustalić, czy wynik jest statystycznie istotny, badacz oblicza wartość p, która jest prawdopodobieństwem zaobserwowania efektu tej samej wielkości lub bardziej ekstremalnego, biorąc pod uwagę, że hipoteza zerowa jest prawdziwa (J. L. Devore 2011, s. 300-344). Hipoteza zerowa jest odrzucana, jeśli wartość p jest mniejsza od z góry określonego poziomu α. α nazywa się poziomem istotności i jest to prawdopodobieństwo odrzucenia hipotezy zerowej, biorąc pod uwagę, że jest ona prawdziwa (błąd typu I). Zwykle wynosi ona 5% lub mniej. Na przykład, gdy α jest ustawione na 5%, prawdopodobieństwo warunkowe błędu typu I, biorąc pod uwagę, że hipoteza zerowa jest prawdziwa, wynosi 5% (J. F. Healy 2009, s. 177-205), a statystycznie istotny wynik to taki, w którym zaobserwowana wartość p jest mniejsza niż 5% (S. McKillup 2006, s. 32-38). Podczas pobierania danych z próbki oznacza to, że region odrzucenia zawiera 5% rozkładu próbkowania (D. Health 1995, s. 123-154). Te 5% może być przypisane do jednej strony rozkładu próbkowania, jak w badaniu jednostronnym, lub podzielone na obie strony dystrybucji, jak w teście dwustronnym, z każdym ogonem (lub regionem odrzucenia) zawierającym 2,5% dystrybucja.
Zastosowanie jednostronnego testu zależy od tego, czy pytanie badawcze lub alternatywna hipoteza określa kierunek, na przykład, czy grupa obiektów jest cięższa, czy też ocena uczniów jest lepsza (J. L. Myers, A. D. Well, Lorch Jr., F. Robert 2010, s. 65-90). Dwu-ogonowy test może być nadal stosowany, ale będzie mniej skuteczny niż test jednostronny, ponieważ region odrzucania dla pojedynczego testu koncentruje się na jednym końcu rozkładu zerowego i jest dwukrotnie większy (5% vs. 2,5%) każdego regionu odrzucenia dla testu dwustronnego. W rezultacie hipoteza zerowa może zostać odrzucona z mniej ekstremalnym wynikiem, jeśli zastosuje się jednostronny test (P. R. Hinton 2010, s. 79-90). Test jednostronny jest tylko silniejszy niż test dwustronny, jeśli określony kierunek alternatywnej hipotezy jest poprawny. Jeśli jednak jest źle, to jednostronny test nie ma mocy.
Poziom istotności w statystyce
Wyjaśnienie poziomu istotności w kontekście statystyki
Poziom istotności jest jednym z kluczowych pojęć w statystyce i odgrywa istotną rolę w procesie wnioskowania statystycznego. Jest to wartość, która określa granicę, przy której podejmujemy decyzję o odrzuceniu lub nieodrzuceniu hipotezy zerowej. Hipoteza zerowa to stwierdzenie, które zakłada, że żadne różnice czy związki nie istnieją między grupami lub zmiennymi.
Poziom istotności jest zwykle oznaczany jako α (alfa) i wyrażany w procentach lub jako ułamek dziesiętny. Najczęściej stosowane wartości to 0,05 (5%) lub 0,01 (1%). Wartość α określa ryzyko popełnienia błędu pierwszego rodzaju, czyli odrzucenia hipotezy zerowej, gdy jest ona prawdziwa. Im niższa wartość α, tym bardziej rygorystyczne kryterium musi spełniać test statystyczny, aby odrzucić hipotezę zerową.
Rola poziomu istotności w testowaniu hipotez
Testowanie hipotez to proces statystyczny, w którym próbujemy zbadać, czy nasze dane są zgodne z hipotezą zerową czy też nie. Poziom istotności odgrywa kluczową rolę w tym procesie, ponieważ pozwala nam określić, czy wyniki naszego testu są wystarczająco "istotne" statystycznie, aby odrzucić hipotezę zerową.
Aby przeprowadzić test hipotez, najpierw formułujemy hipotezę zerową (H0) i hipotezę alternatywną (H1). Hipoteza zerowa zakłada, że nie ma żadnej różnicy czy związku między grupami lub zmiennymi, podczas gdy hipoteza alternatywna sugeruje, że różnica czy związek istnieje.
Następnie przeprowadzamy analizę statystyczną, która generuje statystykę testową. Na podstawie tej statystyki obliczamy wartość p-wartości, która informuje nas o prawdopodobieństwie uzyskania takich lub bardziej ekstremalnych wyników, gdyby hipoteza zerowa była prawdziwa.
Na koniec porównujemy p-wartość z poziomem istotności. Jeśli p-wartość jest mniejsza niż poziom istotności, odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną. W przeciwnym razie, nie mamy podstaw do odrzucenia hipotezy zerowej.
Przykłady zastosowania poziomu istotności w statystyce
Przykłady zastosowania poziomu istotności w statystyce można znaleźć w różnych dziedzinach, takich jak medycyna, psychologia, ekonomia czy nauki społeczne.
Na przykład, w badaniach medycznych poziom istotności może być używany do oceny skuteczności nowego leku w porównaniu z placebo. Jeśli p-wartość jest niższa niż ustalony poziom istotności, możemy uznać, że nowy lek jest skuteczny.
W psychologii, poziom istotności jest stosowany do testowania różnic między grupami eksperymentalnymi i kontrolnymi. Jeśli p-wartość jest niższa niż poziom istotności, możemy wnioskować, że zmienne badane różnią się statystycznie istotnie.
W ekonomii, poziom istotności może być używany do badania wpływu czynników ekonomicznych na zmienne makroekonomiczne. Jeśli p-wartość jest niższa niż poziom istotności, możemy wnioskować, że istnieje statystycznie istotny związek między tymi zmiennymi.
Testowanie hipotez
Definicja testu hipotez
Testowanie hipotez jest jedną z podstawowych metod analizy statystycznej, która pozwala na weryfikację informacji na temat populacji na podstawie dostępnych danych próbkowych. Testowanie hipotez polega na formułowaniu dwóch przeciwstawnych hipotez: hipotezy zerowej (H0) oraz hipotezy alternatywnej (H1).
Hipoteza zerowa opisuje sytuację, w której nie ma żadnych zmian, efektów lub różnic w populacji. Jest to domyślna hipoteza, która jest testowana przez badacza. Hipoteza alternatywna, z drugiej strony, opisuje sytuację, w której występują zmiany, efekty lub różnice w populacji.
Omówienie hipotezy zerowej
Hipoteza zerowa jest sformułowana w taki sposób, aby można było ją poddać testowi statystycznemu. Przykładowo, jeśli badamy skuteczność nowego leku, hipoteza zerowa może brzmieć: "Nowy lek nie ma wpływu na poprawę stanu zdrowia pacjentów". Testowanie tej hipotezy pozwoliłoby nam ocenić, czy nowy lek jest rzeczywiście skuteczny czy też nie.
Ważne jest zrozumienie, że hipoteza zerowa jest testowana na podstawie dostępnych danych próbkowych, ale nie jest ona nigdy udowadniana jako prawdziwa. Wynik testu hipotez może sugerować, że hipoteza zerowa jest mało prawdopodobna, ale nie można jej całkowicie wykluczyć.
Wyjaśnienie wartości p jako miary istotności statystycznej
Wartość p jest miarą istotności statystycznej, która pomaga nam w ocenie wyników testu hipotez. Wartość p określa prawdopodobieństwo wystąpienia obserwowanej różnicy lub efektu, jeśli hipoteza zerowa jest prawdziwa. Im mniejsza wartość p, tym bardziej istotne są uzyskane wyniki.
Jeśli wartość p jest mniejsza niż ustalony wcześniej poziom istotności (najczęściej 0,05 lub 0,01), to odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej. Oznacza to, że istnieją statystycznie istotne różnice lub efekty w populacji. Jeśli wartość p jest większa niż ustalony poziom istotności, to nie ma wystarczających dowodów na odrzucenie hipotezy zerowej.
Przykłady testowania hipotez
Przykłady testowania hipotez można znaleźć w wielu dziedzinach nauki i biznesu. Na przykład, w dziedzinie medycyny może być testowana hipoteza, czy dany lek jest skuteczny w leczeniu konkretnej choroby. W biznesie, hipoteza może dotyczyć wpływu reklamy na wzrost sprzedaży.
Przykładowo, jeśli badamy wpływ reklamy na sprzedaż produktu, hipoteza zerowa może brzmieć: "Reklama nie ma wpływu na wzrost sprzedaży". Przeprowadzenie testu hipotez pozwoliłoby nam ocenić, czy istnieje statystycznie istotna różnica w sprzedaży między grupą, która była narażona na reklamę, a grupą kontrolną, która nie była.
Zastosowanie poziomu istotności w różnych dziedzinach nauki
Różnice w poziomie istotności w zależności od dziedziny
Poziom istotności jest ważnym narzędziem statystycznym, które stosuje się w badaniach naukowych w celu oceny, czy różnice między grupami lub zjawiskami są rzeczywiście istotne. Jednakże, warto zauważyć, że poziom istotności może być różny w zależności od dziedziny nauki. W niektórych dziedzinach nauki, takich jak medycyna, wymaga się wysokiego poziomu istotności, aby potwierdzić skuteczność leków lub procedur medycznych. W innych dziedzinach, takich jak socjologia czy ekonomia, poziom istotności może być nieco niższy, ponieważ badane zależności mogą być bardziej subtelne lub trudniejsze do zmierzenia.
Przykłady zastosowania poziomu istotności
- Medycyna: W badaniach medycznych, poziom istotności jest często stosowany w celu oceny skuteczności leków lub procedur medycznych. Przykładowo, aby potwierdzić, że nowy lek jest skuteczny w leczeniu danej choroby, badacze muszą wykazać, że różnica między grupą otrzymującą lek a grupą kontrolną jest statystycznie istotna na ustalonym poziomie istotności, na przykład poniżej 0,05.
- Socjologia: W badaniach socjologicznych, poziom istotności może być stosowany do badania związków między różnymi czynnikami społecznymi. Na przykład, badacze mogą badać, czy istnieje istotna statystycznie różnica między grupami społecznymi pod względem dochodu, edukacji czy preferencji politycznych. Poziom istotności pozwala na ocenę, czy różnice te są wynikiem przypadkowych zdarzeń czy mają istotne implikacje społeczne.
- Ekonomia: W badaniach ekonomicznych, poziom istotności jest używany w celu oceny skuteczności polityk ekonomicznych czy strategii biznesowych. Na przykład, badacze mogą badać, czy wprowadzenie konkretnej polityki podatkowej miało istotny wpływ na wzrost gospodarczy czy bezrobocie. Poziom istotności pozwala na dokonanie obiektywnej oceny wpływu danej polityki na ekonomię.
Krytyka nadmiernej koncentracji na poziomie istotności w badaniach naukowych
Mimo że poziom istotności jest powszechnie stosowany w badaniach naukowych, istnieje również krytyka dotycząca nadmiernej koncentracji na tym wskaźniku. Niektórzy badacze argumentują, że nadmierne skupienie na poziomie istotności może prowadzić do pominięcia ważnych odkryć naukowych, które nie spełniają tradycyjnych kryteriów statystycznych. Ponadto, stosowanie ustalonego poziomu istotności (np. 0,05) może być arbitralne i nie uwzględniać kontekstu badania.
Krytycy wskazują również na problem tzw. "kryzysu replikacji", czyli trudności w powtarzaniu wyników badań naukowych. Często wynika to z nadużywania poziomu istotności, gdzie badacze mogą manipulować danymi lub selekcjonować tylko te wyniki, które osiągają poziom istotności. W rezultacie, niektóre wyniki nie są replikowalne i trudno jest wyciągać wnioski na ich podstawie.
Poziom istotności — artykuły polecane |
Analiza regresji — ANOVA — Krzywa wzorcowa — Histogram — Rozkład normalny — Próba — Mediana wzór — Schemat Bernoulliego — Test zgodności chi-kwadrat |
Bibliografia
- Borror C. M. (2009) Statistical decision making, The Certified Quality Engineer Handbook (3rd ed.). Milwaukee, WI: ASQ Quality Press
- Devore J. L (2011) Probability & Statistics for Engineering and the Sciences, Eight Edition
- Faherty V. (2008) Probability and statistical significance, Compassionate Statistics: Applied Quantitative Analysis for Social Services (With exercises and instructions in SPSS) (1st ed.)
- Gurkov I. (2005) Wpływ zintegrowanych struktur zarządzania na rozwój innowacyjności przedsiębiorstw: próba analizy empirycznej
- Health D. (1995) An Introduction To Experimental Design And Statistics For Biology (1st ed.)
- Hinton P. R. (2010) Significance, error, and power, Statistics explained (2nd ed.)
- McKillup S. (2006) Statistics Explained: An Introductory Guide for Life Scientists (1st ed.)
- Meier K. J., Brudney J. L., Bohte J. (2011) Applied Statistics for Public and Nonprofit Administration (3rd ed.)
- Myers J. L., Well A. D., Lorch Jr., Robert F. (2010) Developing fundamentals of hypothesis testing using the binomial distribution
- Sirkin R. M. (2005) Two-sample t tests, Statistics for the Social Sciences (3rd ed.). Thousand Oaks, CA: SAGE Publications
- Tutubalin V. (1992), Teoria prawdopodobieństwa i procesy losowe
Autor: Volodymyr Perets