Wnioskowanie statystyczne

Wnioskowanie statystyczne
Polecane artykuły


Wnioskowanie statystyczne (ang. statistical inference) jest jednym z głównych działów statystyki i obejmuje swym zakresem procedury właściwe dla badania częściowego, czyli dotyczy tylko pewnej części populacji generalnej, a wyniki uogólnia się na całą zbiorowość. Objęty badaniem częściowym podzbiór elementów populacji nazywa się próbą. Celem wnioskowania statystycznego jest więc sformułowanie wniosku o parametrze populacyjnym, a nie o statystyce z próby. Tym parametrem może być średnia, mediana, odchylenie standardowe, współczynnik korelacji, lub jakikolwiek inny wskaźnik z licznej grupy parametrów statystycznych. Wyniki otrzymane z próby losowej można uogólnić na całą populację generalną za pomocą rachunku prawdopodobieństwa i opartych na nim modelach probabilistycznych. Rachunek ten stanowi teoretyczną podstawę wnioskowania statystycznego, natomiast kluczowe jest odkrycie, jakie wartości z próby są możliwe i z jakim prawdopodobieństwem mogą się one pojawić.[1][2][3]

Kwestią fundamentalną w badaniu częściowym jest to, aby próba była reprezentatywna, czyli aby jej struktura pod względem badanej cechy była zbliżona do struktury populacji. Nie istnieje jednak metoda, która zagwarantowałaby pełną reprezentatywność próby. Spowodowane jest to faktem, że dopiero badanie częściowe ma dostarczyć informacji o próbie generalnej, wcześniej jest ona nieznana. Istnieją dwa podstawowe warunki, które musi spełniać próba, aby mogła zostać uznana za reprezentatywną:

  • elementy populacji generalnej pobierane są do próby w sposób losowy,
  • próba jest dostatecznie liczna.[4]

Wnioskowanie statystyczne, które oparte jest na modelach probabilistycznych, ale i również analiza statystyczna, odgrywają ogromną rolę w naukach: ekonomicznych, technicznych, rolniczych, medycznych, społecznych oraz wielu innych. W przypadku zjawisk, których nie da się opisać w ściśle deterministyczny sposób, lub co do których przebiegu nie ma się zupełnej pewności, dobrą metodą pozyskania tych informacji jest modelowanie probabilistyczne. Najczęściej jednak pewne parametry przyjętego modelu mają nieznane wartości i muszą być wnioskowane na podstawie posiadanych danych, dokonując stosownej analizy statystycznej. Model probabilistyczny nazywa się wtedy modelem statystycznym. Posłuży on do oceny wiarygodności wyników uzyskiwanych na podstawie zebranych danych.[5]

Wyróżnia się dwie główne metody wnioskowania statystycznego:

Losowy dobór próby

Losowy dobór próby wyróżnia się tym, że zarówno wszystkie poszczególne jednostki populacji generalnej, jak i wyróżnione w danym badaniu grupy (zespoły) elementów mają jednakową szansę, czyli takie samo prawdopodobieństwo, dostania się do próby. Schematem losowania nazywa się specjalny model, który służy do losowego wybory próby z populacji skończonej, czyli takiej, której elementy można ponumerować. Występuje on w wielu wariantach, m.in.:

  • losowanie niezależne (losowanie ze zwracaniem, tzn. że ta sama jednostka może zostać wylosowana wielokrotnie, gdyż po jej pierwszym wylosowaniu wraca do populacji) i zależne (losowanie bez zwracania, tzn. że jednostka raz wylosowana do próby nie bierze udziału w dalszym losowaniu, gdyż nie zostaje ona ponownie włączona w skład populacji),
  • losowanie indywidualne (pobieranie poszczególnych elementów z populacji generalnej do próby) i zespołowe, nazywane również grupowym (pobieranie określonych zespołów, które składają się z więcej niż jednego elementu, np. całe rodziny),
  • losowanie jednostopniowe (stosowane jest jedno stadium, czyli do próby jednostki są pobierane od razu z całej populacji) i wielostopniowe (np. dwustopniowe, cała populacja generalna dzielona jest na duże grupy, tzw. jednostki losowania pierwszego stopnia, te z kolei dzieli się na mniejsze grupy – jednostki losowania drugiego stopnia),
  • losowanie ograniczone (odbywa się z poszczególnych, jednorodnych części populacji nazywanych warstwami) i nieograniczone (dokonuje się od razu z całej populacji).

Losowaniem prostym nazywa się losowanie indywidualne, nieograniczone oraz niezależne, a otrzymaną w ten sposób próbę nazywa się analogicznie, czyli próbą losową prostą, używając niekiedy skróconych pojęć: "próba” czy "próba losowa”.[6]

Zmienne losowe i ich rodzaje

Zmienna losowa stanowi fundamentalne pojęcie w całym wnioskowaniu statystycznym. Termin ten określa jednoznaczne przyporządkowanie wartości liczbowej każdemu elementowi w próbie. Zmienne losowe nazywamy skokowymi lub dyskretnymi, gdy przyjmują skończone lub nieskończone, ale przeliczalne na liczbę wartości. Zmienne losowe określamy mianem ciągłych, gdy ich wartości tworzą przedział ze zbioru liczb rzeczywistych (np. wzrost, wiek, waga). Warto nadmienić, że w metodach statystycznych zmienne losowe ciągłe nie występują w swojej czystej matematycznej postaci, co jest spowodowane pomiarem tego typu zmiennych z określona dokładnością, np. do dwóch miejsc po przecinku.[7]

Rozkłady teoretyczne zmiennych losowych

Rozkłady teoretyczne to skończone lub nieskończone zbiory informacji liczbowych (realizacje zmiennych losowych), występujące z określonym prawdopodobieństwem. Mają one swoje odpowiedniki w statystyce opisowej, są to rozkłady empiryczne, czyli zbiory informacji o wariantach cech i ich częstościach. W statystyce matematycznej najczęściej wykorzystuje się rozkłady:

  • dla zmiennych losowych skokowych: rozkład Poissona i rozkład dwumianowy, nazywany również binomialnym lub Bernoulliego,
  • dla zmiennych losowych ciągłych: rozkład normalny Gaussa-Laplace’a oraz jego różne transformacje, np. rozkład t-Studenta, rozkład chi-kwadrat, rozkład Fishera-Snedecora.[8]

Bibliografia

Przypisy

  1. King B., Minium E. (2009). Statystyka dla psychologów i pedagogów, Wydawnictwo Naukowe PWN, Warszawa, s. 294-296
  2. Koronacki J., Mielniczuk J. (2006). Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych, Wydawnictwo Naukowo-Techniczne, Warszawa, s. 61
  3. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71, 73
  4. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71
  5. Koronacki J., Mielniczuk J. (2006). Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych, Wydawnictwo Naukowo-Techniczne, Warszawa, s. 61-62, 174
  6. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71-73
  7. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 73-74
  8. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 80-81

Autor: Anna Waleczek