Wnioskowanie statystyczne: Różnice pomiędzy wersjami

Z Encyklopedia Zarządzania
m (Czyszczenie tekstu)
m (Czyszczenie tekstu)
Linia 19: Linia 19:
<google>t</google>
<google>t</google>
* elementy populacji generalnej pobierane są do próby w sposób losowy,
* elementy populacji generalnej pobierane są do próby w sposób losowy,
* próba jest dostatecznie liczna.<ref>Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71</ref>
* próba jest dostatecznie liczna<ref>Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71</ref>


Wnioskowanie statystyczne, które oparte jest na modelach probabilistycznych, ale i również [[analiza statystyczna]], odgrywają ogromną rolę w naukach: ekonomicznych, technicznych, rolniczych, medycznych, społecznych oraz wielu innych. W przypadku zjawisk, których nie da się opisać w ściśle deterministyczny sposób, lub co do których przebiegu nie ma się zupełnej pewności, dobrą metodą pozyskania tych informacji jest [[modelowanie]] probabilistyczne. Najczęściej jednak pewne parametry przyjętego modelu mają nieznane wartości i muszą być wnioskowane na podstawie posiadanych danych, dokonując stosownej analizy statystycznej. [[Model]] probabilistyczny nazywa się wtedy modelem statystycznym. Posłuży on do oceny wiarygodności wyników uzyskiwanych na podstawie zebranych danych.<ref>Koronacki J., Mielniczuk J. (2006). ''Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych'', Wydawnictwo Naukowo-Techniczne, Warszawa, s. 61-62, 174</ref>
Wnioskowanie statystyczne, które oparte jest na modelach probabilistycznych, ale i również [[analiza statystyczna]], odgrywają ogromną rolę w naukach: ekonomicznych, technicznych, rolniczych, medycznych, społecznych oraz wielu innych. W przypadku zjawisk, których nie da się opisać w ściśle deterministyczny sposób, lub co do których przebiegu nie ma się zupełnej pewności, dobrą metodą pozyskania tych informacji jest [[modelowanie]] probabilistyczne. Najczęściej jednak pewne parametry przyjętego modelu mają nieznane wartości i muszą być wnioskowane na podstawie posiadanych danych, dokonując stosownej analizy statystycznej. [[Model]] probabilistyczny nazywa się wtedy modelem statystycznym. Posłuży on do oceny wiarygodności wyników uzyskiwanych na podstawie zebranych danych<ref>Koronacki J., Mielniczuk J. (2006). ''Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych'', Wydawnictwo Naukowo-Techniczne, Warszawa, s. 61-62, 174</ref>


Wyróżnia się dwie główne metody wnioskowania statystycznego:
Wyróżnia się dwie główne metody wnioskowania statystycznego:
Linia 34: Linia 34:
* losowanie ograniczone (odbywa się z poszczególnych, jednorodnych części populacji nazywanych warstwami) i nieograniczone (dokonuje się od razu z całej populacji).
* losowanie ograniczone (odbywa się z poszczególnych, jednorodnych części populacji nazywanych warstwami) i nieograniczone (dokonuje się od razu z całej populacji).


'''Losowaniem prostym''' nazywa się losowanie indywidualne, nieograniczone oraz niezależne, a otrzymaną w ten sposób próbę nazywa się analogicznie, czyli '''próbą losową prostą''', używając niekiedy skróconych pojęć: "próba” czy "próba losowa”.<ref>Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71-73</ref>
'''Losowaniem prostym''' nazywa się losowanie indywidualne, nieograniczone oraz niezależne, a otrzymaną w ten sposób próbę nazywa się analogicznie, czyli '''próbą losową prostą''', używając niekiedy skróconych pojęć: "próba" czy "próba losowa".<ref>Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71-73</ref>


==TL;DR==
==TL;DR==
Linia 40: Linia 40:


==Zmienne losowe i ich rodzaje==
==Zmienne losowe i ich rodzaje==
[[Zmienna]] losowa stanowi fundamentalne pojęcie w całym wnioskowaniu statystycznym. Termin ten określa jednoznaczne przyporządkowanie wartości liczbowej każdemu elementowi w próbie. Zmienne losowe nazywamy '''skokowymi''' lub '''dyskretnymi''', gdy przyjmują skończone lub nieskończone, ale przeliczalne na liczbę wartości. Zmienne losowe określamy mianem '''ciągłych''', gdy ich wartości tworzą przedział ze zbioru liczb rzeczywistych (np. wzrost, wiek, waga). Warto nadmienić, że w metodach statystycznych zmienne losowe ciągłe nie występują w swojej czystej matematycznej postaci, co jest spowodowane pomiarem tego typu zmiennych z określona dokładnością, np. do dwóch miejsc po przecinku.<ref>Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 73-74</ref>
[[Zmienna]] losowa stanowi fundamentalne pojęcie w całym wnioskowaniu statystycznym. Termin ten określa jednoznaczne przyporządkowanie wartości liczbowej każdemu elementowi w próbie. Zmienne losowe nazywamy '''skokowymi''' lub '''dyskretnymi''', gdy przyjmują skończone lub nieskończone, ale przeliczalne na liczbę wartości. Zmienne losowe określamy mianem '''ciągłych''', gdy ich wartości tworzą przedział ze zbioru liczb rzeczywistych (np. wzrost, wiek, waga). Warto nadmienić, że w metodach statystycznych zmienne losowe ciągłe nie występują w swojej czystej matematycznej postaci, co jest spowodowane pomiarem tego typu zmiennych z określona dokładnością, np. do dwóch miejsc po przecinku<ref>Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 73-74</ref>


==Rozkłady teoretyczne zmiennych losowych==
==Rozkłady teoretyczne zmiennych losowych==
Linia 46: Linia 46:
W statystyce matematycznej najczęściej wykorzystuje się rozkłady:
W statystyce matematycznej najczęściej wykorzystuje się rozkłady:
* dla zmiennych losowych skokowych: [[rozkład Poissona]] i [[rozkład dwumianowy]], nazywany również binomialnym lub Bernoulliego,
* dla zmiennych losowych skokowych: [[rozkład Poissona]] i [[rozkład dwumianowy]], nazywany również binomialnym lub Bernoulliego,
* dla zmiennych losowych ciągłych: [[rozkład normalny]] Gaussa-Laplace’a oraz jego różne transformacje, np. [[rozkład t-Studenta]], rozkład chi-kwadrat, rozkład Fishera-Snedecora.<ref>Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 80-81</ref>
* dla zmiennych losowych ciągłych: [[rozkład normalny]] Gaussa-Laplace’a oraz jego różne transformacje, np. [[rozkład t-Studenta]], rozkład chi-kwadrat, rozkład Fishera-Snedecora<ref>Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 80-81</ref>


==Przypisy==
==Przypisy==
Linia 53: Linia 53:
==Bibliografia==
==Bibliografia==
<noautolinks>
<noautolinks>
* Jabkowski P. (2007). [https://kb.osu.edu/bitstream/handle/1811/69552/ASK_2007_67_86.pdf?sequence=1 ''Wpływ niezrealizowania części wywiadów na trafność wnioskowania statystycznego w badaniach społecznych: Technika wywiadu kwestionariuszowego oraz telefonicznego w świetle błędów nielosowych''], "ASK: Społeczeństwo. Badania. Metody”, nr 16
* Jabkowski P. (2007). [https://kb.osu.edu/bitstream/handle/1811/69552/ASK_2007_67_86.pdf?sequence=1 ''Wpływ niezrealizowania części wywiadów na trafność wnioskowania statystycznego w badaniach społecznych: Technika wywiadu kwestionariuszowego oraz telefonicznego w świetle błędów nielosowych''], "ASK: Społeczeństwo. Badania. Metody", nr 16
* King B., Minium E. (2009). ''Statystyka dla psychologów i pedagogów'', Wydawnictwo Naukowe PWN, Warszawa
* King B., Minium E. (2009). ''Statystyka dla psychologów i pedagogów'', Wydawnictwo Naukowe PWN, Warszawa
* Koronacki J., Mielniczuk J. (2006). ''Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych'', Wydawnictwo Naukowo-Techniczne, Warszawa
* Koronacki J., Mielniczuk J. (2006). ''Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych'', Wydawnictwo Naukowo-Techniczne, Warszawa
* Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin
* Sobczyk M. (2006). ''Statystyka. Aspekty praktyczne i teoretyczne'', Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin
* Sokołowski A. (2004). [https://media.statsoft.pl/_old_dnn/downloads/naukowe1.pdf ''O niewłaściwym stosowaniu metod statystycznych'']. Materiały szkoleniowe, StatSoft Polska
* Sokołowski A. (2004). [https://media.statsoft.pl/_old_dnn/downloads/naukowe1.pdf ''O niewłaściwym stosowaniu metod statystycznych'']. Materiały szkoleniowe, StatSoft Polska
* Szreder M. (2010). ''Losowe i nielosowe próby w badaniach statystycznych'', "Przegląd Statystyczny”, tom 57, z. 4
* Szreder M. (2010). ''Losowe i nielosowe próby w badaniach statystycznych'', "Przegląd Statystyczny", tom 57, z. 4
* Szreder M. (2010). ''O weryfikacji i falsyfikacji hipotez'', "Przegląd Statystyczny”, tom 57, z. 2-3
* Szreder M. (2010). ''O weryfikacji i falsyfikacji hipotez'', "Przegląd Statystyczny", tom 57, z. 2-3
</noautolinks>
</noautolinks>



Wersja z 17:22, 2 lis 2023

Wnioskowanie statystyczne
Polecane artykuły

Wnioskowanie statystyczne (ang. statistical inference) jest jednym z głównych działów statystyki i obejmuje swym zakresem procedury właściwe dla badania częściowego, czyli dotyczy tylko pewnej części populacji generalnej, a wyniki uogólnia się na całą zbiorowość. Objęty badaniem częściowym podzbiór elementów populacji nazywa się próbą. Celem wnioskowania statystycznego jest więc sformułowanie wniosku o parametrze populacyjnym, a nie o statystyce z próby. Tym parametrem może być średnia, mediana, odchylenie standardowe, współczynnik korelacji, lub jakikolwiek inny wskaźnik z licznej grupy parametrów statystycznych. Wyniki otrzymane z próby losowej można uogólnić na całą populację generalną za pomocą rachunku prawdopodobieństwa i opartych na nim modelach probabilistycznych. Rachunek ten stanowi teoretyczną podstawę wnioskowania statystycznego, natomiast kluczowe jest odkrycie, jakie wartości z próby są możliwe i z jakim prawdopodobieństwem mogą się one pojawić.[1][2][3]

Kwestią fundamentalną w badaniu częściowym jest to, aby próba była reprezentatywna, czyli aby jej struktura pod względem badanej cechy była zbliżona do struktury populacji. Nie istnieje jednak metoda, która zagwarantowałaby pełną reprezentatywność próby. Spowodowane jest to faktem, że dopiero badanie częściowe ma dostarczyć informacji o próbie generalnej, wcześniej jest ona nieznana. Istnieją dwa podstawowe warunki, które musi spełniać próba, aby mogła zostać uznana za reprezentatywną:

  • elementy populacji generalnej pobierane są do próby w sposób losowy,
  • próba jest dostatecznie liczna[4]

Wnioskowanie statystyczne, które oparte jest na modelach probabilistycznych, ale i również analiza statystyczna, odgrywają ogromną rolę w naukach: ekonomicznych, technicznych, rolniczych, medycznych, społecznych oraz wielu innych. W przypadku zjawisk, których nie da się opisać w ściśle deterministyczny sposób, lub co do których przebiegu nie ma się zupełnej pewności, dobrą metodą pozyskania tych informacji jest modelowanie probabilistyczne. Najczęściej jednak pewne parametry przyjętego modelu mają nieznane wartości i muszą być wnioskowane na podstawie posiadanych danych, dokonując stosownej analizy statystycznej. Model probabilistyczny nazywa się wtedy modelem statystycznym. Posłuży on do oceny wiarygodności wyników uzyskiwanych na podstawie zebranych danych[5]

Wyróżnia się dwie główne metody wnioskowania statystycznego:

Losowy dobór próby

Losowy dobór próby wyróżnia się tym, że zarówno wszystkie poszczególne jednostki populacji generalnej, jak i wyróżnione w danym badaniu grupy (zespoły) elementów mają jednakową szansę, czyli takie samo prawdopodobieństwo, dostania się do próby. Schematem losowania nazywa się specjalny model, który służy do losowego wybory próby z populacji skończonej, czyli takiej, której elementy można ponumerować. Występuje on w wielu wariantach, m.in.:

  • losowanie niezależne (losowanie ze zwracaniem, tzn. że ta sama jednostka może zostać wylosowana wielokrotnie, gdyż po jej pierwszym wylosowaniu wraca do populacji) i zależne (losowanie bez zwracania, tzn. że jednostka raz wylosowana do próby nie bierze udziału w dalszym losowaniu, gdyż nie zostaje ona ponownie włączona w skład populacji),
  • losowanie indywidualne (pobieranie poszczególnych elementów z populacji generalnej do próby) i zespołowe, nazywane również grupowym (pobieranie określonych zespołów, które składają się z więcej niż jednego elementu, np. całe rodziny),
  • losowanie jednostopniowe (stosowane jest jedno stadium, czyli do próby jednostki są pobierane od razu z całej populacji) i wielostopniowe (np. dwustopniowe, cała populacja generalna dzielona jest na duże grupy, tzw. jednostki losowania pierwszego stopnia, te z kolei dzieli się na mniejsze grupy - jednostki losowania drugiego stopnia),
  • losowanie ograniczone (odbywa się z poszczególnych, jednorodnych części populacji nazywanych warstwami) i nieograniczone (dokonuje się od razu z całej populacji).

Losowaniem prostym nazywa się losowanie indywidualne, nieograniczone oraz niezależne, a otrzymaną w ten sposób próbę nazywa się analogicznie, czyli próbą losową prostą, używając niekiedy skróconych pojęć: "próba" czy "próba losowa".[6]

TL;DR

Wnioskowanie statystyczne to procedury badania częściowej populacji, które pozwalają uogólnić wyniki na całą populację. Próba musi być reprezentatywna i losowa. Wnioskowanie statystyczne jest używane w wielu dziedzinach nauki. Istnieją dwie główne metody wnioskowania: estymacja parametrów i weryfikacja hipotez. Losowy dobór próby polega na losowym wyborze jednostek z populacji. Zmienne losowe mogą być skokowe lub ciągłe. W statystyce matematycznej używa się różnych rozkładów teoretycznych.

Zmienne losowe i ich rodzaje

Zmienna losowa stanowi fundamentalne pojęcie w całym wnioskowaniu statystycznym. Termin ten określa jednoznaczne przyporządkowanie wartości liczbowej każdemu elementowi w próbie. Zmienne losowe nazywamy skokowymi lub dyskretnymi, gdy przyjmują skończone lub nieskończone, ale przeliczalne na liczbę wartości. Zmienne losowe określamy mianem ciągłych, gdy ich wartości tworzą przedział ze zbioru liczb rzeczywistych (np. wzrost, wiek, waga). Warto nadmienić, że w metodach statystycznych zmienne losowe ciągłe nie występują w swojej czystej matematycznej postaci, co jest spowodowane pomiarem tego typu zmiennych z określona dokładnością, np. do dwóch miejsc po przecinku[7]

Rozkłady teoretyczne zmiennych losowych

Rozkłady teoretyczne to skończone lub nieskończone zbiory informacji liczbowych (realizacje zmiennych losowych), występujące z określonym prawdopodobieństwem. Mają one swoje odpowiedniki w statystyce opisowej, są to rozkłady empiryczne, czyli zbiory informacji o wariantach cech i ich częstościach. W statystyce matematycznej najczęściej wykorzystuje się rozkłady:

Przypisy

  1. King B., Minium E. (2009). Statystyka dla psychologów i pedagogów, Wydawnictwo Naukowe PWN, Warszawa, s. 294-296
  2. Koronacki J., Mielniczuk J. (2006). Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych, Wydawnictwo Naukowo-Techniczne, Warszawa, s. 61
  3. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71, 73
  4. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71
  5. Koronacki J., Mielniczuk J. (2006). Statystyka dla Studentów Kierunków Technicznych i Przyrodniczych, Wydawnictwo Naukowo-Techniczne, Warszawa, s. 61-62, 174
  6. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 71-73
  7. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 73-74
  8. Sobczyk M. (2006). Statystyka. Aspekty praktyczne i teoretyczne, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin, s. 80-81

Bibliografia


Autor: Anna Waleczek