Wstęp
Podstawowe pojęcia
- Statystyka
- Nauka poświęcona metodom badania (analizowania) zjawisk
masowych. Statystyka opisowa polega na systematyzowaniu obserwowanych cech ilościowych i
jakościowych oraz przedstawianiu wyników w postaci zestawien tabelarycznych,
wykresow, itp. Statystyka matematyczna jest działem matematyki stosowanej opartym
na rachunku prawdopodobieństwa; zajmuje się badaniem zbiorów na podstawie znajomości
własności ich części.
- Populacja
- Inaczej zbiorowość statystyczna. Jest to zbiór obiektów z wyróżnionymi cechami. Obiektem może być drzewo, człowiek, region, województwo,
a także pomiar. Wyróżnioną cechą może być ta, która klasyfikuje obiekt do populacji oraz ta, ze względu na którą badamy populację.
Populacja może być nieskończona.
- Próba
- Część populacji. Próba reprezentuje populację, gdy jest odpowiednio pobrana: na przykład
jest pobrana całkowicie losowo i wtedy nazywamy ją próbą prostą.
Liczbę wylosowanych elementów (obiektów) nazywamy rozmiarem próby.
- Cecha
- Właściwość obiektu należącego do populacji: na przykład wiek kobiety. Wygodnie jest klasyfikować cechy na ilościowe (mierzalne), np. waga,
wzrost, dochód, liczba monet, oraz jakościowe (niemierzalne), np. jakość, kolor, płeć. Cechy ilościowe dzieli się na ciągłe, np. waga,
wzrost, oraz skokowe (dyskretne), np. ilość monet, liczba kończyn, liczba dni.
- Cecha losowa
- Właściwość obiektu, który został wylosowany z populacji: na przykład wiek wylosowanej kobiety. Do opisu
cech losowych służą zmienne losowe. Na początek dobrze jest zapoznać się z rozkładem dwumianowym oraz
normalnym (przykłady)
Parametry populacji
Populację charakteryzuje się za pomocą parametrów badanej cechy. Parametrem może być
mediana, średnia, kwartyl i wiele innych.
- Mediana
- Mediana badanej cechy to wartość, która dzieli populację na dwie części. Połowa
obiektów w populacji ma cechę o wartości poniżej mediany, a połowa powyżej.
- Kwartyl dolny
- Kwartyl dolny badanej cechy to wartość, która dzieli populację w stosunku 1:3.
Jedna czwarta obiektów w populacji ma cechę o wartości poniżej kwartyla dolnego,
a pozostałe trzy czwarte powyżej.
- Kwartyl górny
- Kwartyl górny badanej cechy to wartość, która dzieli populację w stosunku 3:1.
Trzy czwarte obiektów w populacji ma cechę o wartości poniżej kwartyla dolnego,
a pozostała jedna trzecia powyżej.
Wnioskowanie statystyczne
- Cel wnioskowania
-
Celem wnioskowania statystycznego jest uogólnienie wniosków z próby na populację.
- Rodzaje wnioskowania
-
W zależności od przyjętego modelu statystycznego wyróżniamy wnioskowanie parametryczne
oraz nieparametryczne. Przypuśćmy, że zaobserwowaliśmy wynik "x" eksperymentu. Ten wynik traktujemy
jako realizację pewnej zmiennej losowej "X". Rozkład prawdopodobieństwa "F" zmiennej losowej "X" nie jest znany.
Dzięki pewnej wiedzy na temat sposobu przeprowadzenia eksperymentu możemy jedynie wskazać, że "F" należy do
pewnej rodziny rozkładów "M". O rodzinie "M" powiemy, że jest ona naszym modelem (statystycznym) eksperymentu,
a nasze zadanie polega na odgadnięciu "prawdziwego F". Jeżeli każdy element "F" rodziny "M" może być reprezentowany
przez parametr (liczbę rzeczywistą lub wektor liczb rzeczywistych), o modelu "M" powiemy, że jest parametryczny,
w przeciwnym przypadku powiemy, że jest nieparametryczny (przykład).