Co to jest próba statystyczna?

Z populacją statystyczną jest jak z gulaszem. Żeby poznać smak, nie trzeba zjeść od razu całego garnka. Wystarczy dobrze zamieszać, nabrać na łyżkę i już wiemy, czy jest odpowiednio doprawiony. A w jaki sposób badać populację, nie analizując każdej jednostki? Pomoże w tym odpowiednio dobrana próba statystyczna.

No tak. Tylko z tym gulaszem jest łatwo. Biorę łychę, mieszam dokładnie i zakładam, że to co nabiorę jest charakterystyczne dla całej reszty. W przypadku populacji statystycznej nie jest to aż tak proste. Są jednak sposoby – łatwiejsze i trudniejsze, żeby taką reprezentatywną „łyżkę” populacji sobie nabrać i na jej podstawie wyciągać wnioski o wszystkich jednostkach. Podzbiór populacji, który za pomocą jakiejś metody sobie wybraliśmy i będziemy badać, nazywany jest próbą statystyczną.

Już ponad rok temu pisałam o tym, co to dokładnie jest populacja statystyczna. Wyjaśniałam, co oznacza pojęcie jednostki i cechy statystycznej. Jeśli ktoś ma jakiekolwiek wątpliwości na ten temat, to zapraszam do przeczytania tekstu „Co my właściwie badamy?„.
Podawałam tam kilka przykładów populacji i jednostek statystycznych:
Jeśli populacją będą wszyscy Polacy, to każdy pojedynczy mieszkaniec Polski jest jednostką statystyczną.
Jeśli populacja to pracownicy mojej firmy, to każdy pracownik jest jednostką statystyczną.
Populacją statystyczną mogą też być książki na półce w moim pokoju i wtedy każda z książek jest jednostką statystyczną.

Oczywiście, przeprowadzając badania wspomnianych populacji, można zebrać dane odnośnie każdej jednostki i poddać je analizie. I jeśli mamy do czynienia z małą firmą, to w ten sposób właśnie pracodawca będzie badać swoich pracowników. Jeśli mam mały księgozbiór, to też łatwo będzie zająć się każdą książką z osobna. Przy większej biblioteczce, sytuacja może zacząć się komplikować. Zwłaszcza gdy chcemy badać, ile czasu zajmuje nam przeciętnie przeczytanie jednej posiadanej książki albo przyszły nam do głowy inne czasochłonne pomysły. A już w przypadku wszystkich mieszkańców Polski, odpytywanie każdego obywatela zaczyna się robić dużo bardziej kłopotliwe. Na przykład sondaże przedwyborcze. Gdyby każdy Polak miał być przepytany w sondażu, na kogo chce zagłosować, to po co jeszcze robić wybory?

A sytuacja może być jeszcze bardziej skomplikowana. Jeśli jestem producentem zapałek i chcę sprawdzić, ile czasu potrzebuje jedna zapałka, żeby się spalić do połowy, to testując wszystkie zapałki z mojej populacji miałabym niezwykle dokładne dane, ale odnośnie populacji już nieistniejącej (spalonej). Podobnie gdybym testowała wytrzymałość jajek, smak czekolady czy odporność zabawek. W sytuacji kiedy badana jednostka oznacza zniszczoną jednostkę, nie ma mowy o badaniu całej populacji. Musimy wybrać próbkę i na jej podstawie oszacować wnioski dla całej reszty.

Próbkę staramy się dobrać tak, żeby jak najlepiej odzwierciedlała badaną populację. Czyli analizując naszą biblioteczkę domową, nie możemy sięgnąć po książki wyłącznie z półki dziecięcej. Robiąc sondaż przedwyborczy, nie należy przepytywać tylko mieszkańców stolicy albo małej wioski. Taka próba statystyczna nie byłaby reprezentatywna i oszacowane parametry całej populacji byłyby po prostu błędne. Co więc zrobić? Najlepiej jest sporządzić listę wszystkich jednostek w populacji i wylosować określoną liczbę elementów (im większa ta liczba, tym wyższy koszt badania, ale równocześnie większe prawdopodobieńśtwo dokładnego wyniku). Chociażby można na karteczkach spisać tytuły wszystkich posiadanych książek, wrzucić karteczki do kapelusza, dobrze wymieszać i znaleźć kogoś chętnego do wyciągania. Za pomocą listy wszystkich numerów PESEL można wybierać Polaków do ankiet.

Metod doboru próby statystycznej jest bardzo dużo. O niektórych z nich postaram się opowiedzieć. Dzisiaj natomiast chciałabym, żebyście zapamiętali, że nie trzeba analizować całej populacji, żeby wyciągnąć wnioski – tak jak nie trzeba zjeść całego garnka gulaszu, żeby zapoznać się z jego smakiem.


Wszystkich zainteresowanych tematem statystyki zapraszam na mojego Facebooka.


mapa myśli: próba statystyczna

mapa myśli: próba statystyczna

Please follow and like us: