Próba

Z Encyklopedia Zarządzania

Próba statystyczna - jest wybraną określoną, dowolną częścią zbiorowości statystycznej, podzbiorem populacji, będącej przedmiotem badania. Próba podlega bezpośrednio badaniu statystycznemu pod względem wybranej cechy, której wartość, oszacowana na podstawie wyniku badania, uogólniana jest na całą populację generalną.

Przykładem populacji może być cała ludność zamieszkująca dane państwo. Zbadanie każdego elementu tak obszernej grupy, w celu uzyskania wyniku badania jest niemożliwe lub czasochłonne, a także generowałoby zbyt wysokie koszty. Dlatego też konieczne jest zawężenie obszaru badań do próby, która będzie reprezentowała daną populację. Czasami też populacja nie jest ograniczona, tzn. jest nieskończona, bądź też badanie może powodować zniszczenia (np. podczas badań wytrzymałości materiałów), wtedy również nie jest możliwe przeprowadzenia badania na pełnej populacji.

Jeżeli określimy wybrane wartości próbkowe (inaczej: wartości w próbie) jako , ,…,, gdzie jest liczebnością próby, należącej do całej populacji (N), to próbą możemy nazwać zbiór wybranych do obserwacji jednostek: {, , …, }, a także ciąg wyników: (, , …, ). Można również zastosować zapis , , …, , w przypadku, gdy wyniki uporządkowane są w kolejności rosnącej. Zatem oznaczenie pokazuje wartość pierwszej pobranej jednostki próby, natomiast oznacza najmniejszą wartość z pobranej próby.

Najbardziej wiarygodną reprezentatywną próbą wykorzystywaną w badaniach statystycznych jest próba losowa. Jest ona dobierana w taki sposób, by przypadek decydował o przynależności elementu badanej zbiorowości generalnej do próby, tzn. każdy element ma takie samo, różne od zera, prawdopodobieństwo znalezienia się w próbie, jak każdy inny element z badanej populacji.

Przykładem wiarygodnego sposobu doboru próby losowej może być metoda praktykowana przez wiele organizacji, zajmujących się przeprowadzaniem sondaży. Polega ona na procedurze losowego doboru cyfr, które tworzą przypadkowe numery telefonu, należące do członków prób. W ten sposób eliminowane są tendencje w wyborze próby, które mogłyby sprawić, że wynik badania nie obejmie całej populacji, a jedynie jej konkretną część, a tym samym próba nie będzie reprezentatywna. Sposób ten jest jak najbardziej odpowiedni w dzisiejszych czasach, kiedy to każde gospodarstwo domowe posiada minimum jeden telefon. W dawnych czasach jednak telefony mieli tylko ludzie najzamożniejsi, wtedy to metoda ta nie była reprezentatywna, ponieważ obejmowała wyselekcjonowaną subpopulację. Obejmowała wyłącznie próbę złożoną z zamożnych rodzin, eliminując natomiast ludzi biedniejszych.

By próba była reprezentatywna statystycznie (inaczej: probabilistyczna) dla całej populacji, oprócz spełnienia wymogu przynależności do konkretnej populacji, objęcia wyborem jej całości, losowości, bądź (w naukach społecznych) niezależności elementów ze względu na badane cechy, powinna być dostatecznie liczna. Pojęcie to jest umowne i uzależnione od kosztów badania, poziomu ufności i zakładanego błędu statystycznego. Jednak każda próba reprezentatywna nie powinna być selektywna, powinna natomiast odwzorowywać różnorodność populacji.

Odpowiednio dobrana próba reprezentacyjna cechuje się istotnie podobną strukturą jak badana zbiorowość - jej elementy są typowe dla ogółu. Daje to podstawę do uogólniania wyników badania, przeprowadzonego na próbie, na całą populację generalną.

TL;DR

Próba statystyczna to wybrana część populacji, która jest badana w celu uogólnienia wyników na całą populację. Najbardziej wiarygodną próbą jest próba losowa, w której każdy element ma takie samo prawdopodobieństwo znalezienia się w próbie. Próba reprezentatywna odzwierciedla strukturę populacji i umożliwia uogólnianie wyników. Próby niereprezentatywne są mniej wiarygodne i stosuje się je głównie w badaniach jakościowych. Wielkość próby zależy od kosztów badania, poziomu ufności i błędu statystycznego. Dobór próby może być losowy lub nielosowy, w zależności od celu badania.

Próba, a nauki społeczne

Przy przeprowadzaniu badań z zakresu nauk społecznych, często występują sytuacje, które uniemożliwiają pobranie reprezentatywnej próby, bądź dobór takiej próby byłby niewłaściwy, lub zbyt kosztowny. W takim przypadku badający stosuje próby wyselekcjonowane w sposób nielosowy. Mamy wtedy do czynienia z próbami nielosowymi, zwanymi inaczej próbami nieprobabilistycznymi, bądź tendencyjnymi. Ich szczególną cechą jest niereprezentatywność - na podstawie danych i wniosków otrzymanych z tak dobranych prób, nie można dokładnie oszacować parametrów populacyjnych, są one bardziej subiektywne. Z tego też względu, próby nieprobabilistyczne, wykorzystuje się przede wszystkim w badaniach jakościowych.

Wielkość próby

Podstawą do określenia wielkości próby, jest podjęcie decyzji o wartości akceptowalnego błędu pomiaru. To z kolei bezpośrednio powiązane jest z przedziałem ufności, którego szerokość badający również musi określić przed wyznaczeniem wielkości próby. Pojawiające się błędy wpływają na wyniki i wnioski badań. Im większy błąd wystąpi podczas pobierania próby, tym końcowe efekty mogą być bardziej zafałszowane. W badaniach możliwe jest wystąpienie zarówno obciążeń systematycznych, czyli związanych z subiektywnymi informacjami, danymi, jak i obciążeń losowych, czyli nie wynikających z powtarzalnych, systematycznych czynników, takich jak zmiana wyniku badania przeprowadzonego w takich samych warunkach.

Próba musi zostać zwiększona w sytuacji, gdy badający chce mieć wyższy poziom ufności do uzyskanych wyników i uzyskać rzetelniejsze pomiary, o mniejszym ryzyku błędu. Przy czym, w przypadku błędu, czterokrotnie zwiększona próba, zmniejszy ryzyko o połowę. W przypadku przedziału ufności, wielkość błędu uzależniona jest od szerokości przedziału - im jest on węższy, tym wyższe ryzyko popełnionego błędu.

Błąd statystyczny zazwyczaj wyrażany jest za pomocą procentów i określa oczekiwaną wartość zróżnicowania wyników przy wielokrotnym przeprowadzeniu powtórnego sondażu z wykorzystaniem innych prób badawczych o jednakowej liczebności. Minimalną dokładność sondażu, dotyczącego danych kategorycznych możemy oszacować poprzez działanie matematyczne, które wyznacza wzór: gdzie oznacza liczebność próby.

Należy zatem podzielić liczbę 1 przez pierwiastek kwadratowy z liczby osób należących do próby. Tak na przykład przy próbie losowej liczącej 2000 osób minimalna dokładność będzie wynosić około 0,022, czyli 2,2%.

W sytuacji, gdy badający wnioskuje o populacji pod względem kilku parametrów, ważne jest zorientowanie się, czy wyznaczona, odpowiednia wielkość próby dla jednej zmiennej, spełni wymagania kolejnej.

W stosunku do badań ilościowych, badania jakościowe wymagają mniejszej próby. Uzależnione jest to zarówno od charakteru badania, jak i wymagań badającego[1].

Zobacz też: Estymator.

Dobór próby

Metod pobierania próby jest wiele, a wybór odpowiednich, uzależniony jest od wymogów badania, jego charakteru i rodzaju zbiorowości generalnej, której dotyczy. Aby przeprowadzić dobór próby reprezentatywnej, potrzebna jest pewna wiedza o populacji. Często niesie to za sobą koszty, ale dzięki temu zyskuje się możliwość estymacji wybranych cech, poprzez znajomość prawdopodobieństwa dostania się wybranego elementu populacji do próby.

W przypadku, gdy pełna lista elementów populacji jest niedostępna, koszt doboru probabilistycznej próby zbyt wysoki, bądź badanie nie wymaga doboru losowego, wykorzystuje się metody doboru niereprezentacyjnego. Należy wtedy zwrócić uwagę na mniejszą miarodajność wyników z próby - nie wszystkie wnioski będą adekwatne do całej populacji, za to możliwe jest określenie przypuszczalnej tendencji badanych cech. Ponadto próba probabilistyczna nie musi być liczna, a sam dobór - rygorystyczny.

Sposoby doboru próby są następujące:

Próba reprezentatywna

Zobacz: Pobieranie próby.

Próba niereprezentatywna

  • Próba okolicznościowa
  • Dobór celowy (arbitralny)
  • Metoda kuli śnieżnej
  • Dobór kwotowy
  • Dobór informatorów

Próba okolicznościowa jest tworzona przez dobór osób łatwo dostępnych dla badającego. Może to być np. pierwsze 200 osób, które badacz spotka na ulicy i które wyrażą zgodę na przeprowadzenie wywiadu. Tak dobrana próba jest mocno okrojona pod względem reprezentatywności, z powodu ograniczonej ilości potencjalnych badanych.

Dobór celowy (dający próbę celową, zwaną też próbą ekspercką) opiera się na subiektywnych odczuciach badającego. Badacz stara się, za pomocą swojej intuicji i doświadczenia, pobrać próbę tak, by była ona reprezentatywna dla całej populacji. W związku z tak subiektywnym doborem, trudne jest oszacowanie prawdopodobieństwa zakwalifikowania się dowolnego elementu ze zbiorowości generalnej do próby badanej.

Innym przykładem doboru celowego, jest wybranie osób "odbiegających od normy". W tej sytuacji przebadanie próby o cechach wyłamujących się z ogólnego wzorca badanej zbiorowości, może istotnie wspomóc zrozumienie procesów zachodzących w populacji generalnej.

Metoda kuli śnieżnej używana jest głównie w sytuacji, gdy badana jest wąska populacja, bez dostępu do listy wszystkich, należących do niej, elementów [2]. W tym celu, od przebadanych już osób, badający uzyskuje informacje pomagające odszukać kolejne osoby, należące do tej samej populacji. Proces ten trwa do czasu, gdy wielkość próby jest satysfakcjonująca.

Dobór kwotowy polega na dobraniu jednostek próby tak, by ustalone wcześniej parametry rozkładały się w próbie w taki sam sposób, jak w badanej populacji - próba i populacja są strukturalnie maksymalnie do siebie podobne pod względem wybranych zmiennych [3]. Dobór kwotowy tworzy próbę kwotową, rzadziej zwaną próbą udziałową.

Metoda ta jest praco - i czasochłonna, a sam badający musi wykazać się bardzo dobrą znajomością struktury zbiorowości generalnej. Dobór kwotowy cechuje się ponadto względną kontrolą nad próbą - badający może nie wziąć pod uwagę wszystkich parametrów istotnych w danym badaniu, co będzie miało zasadniczy wpływ na odwzorowanie próby.

Dobór informatorów stosowany jest w sytuacji, gdy badana populacja jest zamknięta na osoby "z zewnątrz" oraz posiada pewne układy społeczne, które badający chce zrozumieć. Próbą z takiej zbiorowości są osoby chętne do współpracy, które kompetentnie mogą wypowiedzieć się o populacji generalnej, czy badanym zjawisku. Ważnym jest, by osoby te nie zajmowały marginalnej pozycji w badanej zbiorowości, jednakże, biorąc po uwagę chęć informatora do współpracy z badającym, cechy tej nie można zminimalizować do zera.

Można również wyodrębnić schematy doboru próby. Do losowych schematów zaliczamy:

  • schemat losowania warstwowego (stratyfikacyjnego) - czyli dokonywanie oddzielnych losowań w każdej z podzielonych warstw populacji, które możliwie jak najbardziej różnią się między sobą, np. losowania przeprowadzane w różnych warstwach, podzielonych ze względu na przedział wiekowy,
  • schemat doboru wielostopniowego - czyli podzielenie populacji na coraz to mniejsze grupy i etapowe losowanie, doprowadzające od jednostek pierwszego stopnia do podstawowych badanych jednostek, np. grupowanie populacji na klasy szkolne, a następnie losowanie konkretnych uczniów,
  • schemat doboru systematycznego - czyli losowanie z uporządkowanej grupy kolejnych jednostek, tak samo od siebie oddalonych, np. losowanie co 5 pacjenta poradni cukrzycowej,
  • schemat doboru z wykorzystaniem tablic liczb losowych - czyli odczytywanie kolejnych liczb, mieszczących się w liczebności populacji, z tablicy liczb losowych.

Wśród schematów nielosowych możemy natomiast wyróżnić:

  • schemat doboru jednostek typowych - czyli dobór osobników populacji uważanych za jednostki typowe,
  • schemat doboru proporcjonalnego - czyli wybór określonych liczbowo segmentów, które odpowiadają proporcjom struktury populacji,
  • schemat doboru na zasadzie eliminacji - czyli eliminacja z populacji jednostek uznanych za nietypowe.


Próbaartykuły polecane
Skala nominalnaBadanie panelowePoziom istotnościHistogramModel ekonometrycznyPomiarAnaliza przyczynowaTypologiaBłąd pomiaru

Przypisy

  1. W przypadku, gdy decyzje podjęte na podstawie wyników badania, są kluczowe, lub badanie ma wiele parametrów od siebie zależnych, wymagana jest większa próba, zaś w sytuacji, gdy są to badania "zamknięte" lub laboratoryjne, nie wymagające pod-prób, ewentualnie eksperymentalne, to takie badania nie wymagają zwiększonej próby.
  2. Na przykład badanie zbiorowości bezdomnych, czy nielegalnych imigrantów.
  3. Na przykład w sytuacji, gdy jednym z wybranych parametrów jest płeć, a stosunek kobiet do mężczyzn w populacji wynosi 3:2, to próba dobierana jest tak, by również charakteryzowała się takim stosunkiem płci. Dotyczy to wszystkich wybranych parametrów i zależności pomiędzy nimi.

Bibliografia

  • Babbie E. (2004), Badania społeczne w praktyce, Wydawnictwo Naukowe PWN, Warszawa
  • Chybalski F. (2017), O uogólnianiu wyników analiz ilościowych w naukach o zarządzaniu, Zeszyty naukowe Politechniki Łódzkiej nr 1214
  • Czakon W. (2014), Kryteria oceny rygoru metodologicznego badań w naukach o zarządzaniu, Organizacja i kierowanie nr 1161
  • Frankfort-Nachmias C., Nachmias D. (2001), Metody badawcze w naukach społecznych, Zysk i S-ka Wydawnictwo, Poznań
  • Greń J. (1982), Statystyka Matematyczna. Modele i Zadania, PWN, Warszawa
  • Jóźwiak J., Podgórski J. (2012), Statystyka od podstaw, Polskie Wydawnictwo Ekonomiczne, Warszawa
  • Kot S., Jakubowski J., Sokołowski A. (2011), Statystyka, Difin, Warszawa
  • Ostasiewicz S., Rusnak Z., Siedlecka U. (2006), Statystyka. Elementy Teorii i Zadania, Wydawnictwo Akademii Ekonomicznej im. Oskara Langego we Wrocławiu, Wrocław
  • Ostasiewicz W. (2011), Badania statystyczne, Oficyna, Warszawa
  • Rumsey D. (2016), Statystyka dla bystrzaków, Helion, Gliwice


Autor: Karolina Bednarska, Kinga Michnik