Wstęp

Podstawowe pojęcia

Statystyka
Nauka poświęcona metodom badania (analizowania) zjawisk masowych. Statystyka opisowa polega na systematyzowaniu obserwowanych cech ilościowych i jakościowych oraz przedstawianiu wyników w postaci zestawien tabelarycznych, wykresow, itp. Statystyka matematyczna jest działem matematyki stosowanej opartym na rachunku prawdopodobieństwa; zajmuje się badaniem zbiorów na podstawie znajomości własności ich części.
Populacja
Inaczej zbiorowość statystyczna. Jest to zbiór obiektów z wyróżnionymi cechami. Obiektem może być drzewo, człowiek, region, województwo, a także pomiar. Wyróżnioną cechą może być ta, która klasyfikuje obiekt do populacji oraz ta, ze względu na którą badamy populację. Populacja może być nieskończona.
Próba
Część populacji. Próba reprezentuje populację, gdy jest odpowiednio pobrana: na przykład jest pobrana całkowicie losowo i wtedy nazywamy ją próbą prostą. Liczbę wylosowanych elementów (obiektów) nazywamy rozmiarem próby.
Cecha
Właściwość obiektu należącego do populacji: na przykład wiek kobiety. Wygodnie jest klasyfikować cechy na ilościowe (mierzalne), np. waga, wzrost, dochód, liczba monet, oraz jakościowe (niemierzalne), np. jakość, kolor, płeć. Cechy ilościowe dzieli się na ciągłe, np. waga, wzrost, oraz skokowe (dyskretne), np. ilość monet, liczba kończyn, liczba dni.
Cecha losowa
Właściwość obiektu, który został wylosowany z populacji: na przykład wiek wylosowanej kobiety. Do opisu cech losowych służą zmienne losowe. Na początek dobrze jest zapoznać się z rozkładem dwumianowym oraz normalnym (przykłady)

Parametry populacji

Populację charakteryzuje się za pomocą parametrów badanej cechy. Parametrem może być mediana, średnia, kwartyl i wiele innych.

Mediana
Mediana badanej cechy to wartość, która dzieli populację na dwie części. Połowa obiektów w populacji ma cechę o wartości poniżej mediany, a połowa powyżej.
Kwartyl dolny
Kwartyl dolny badanej cechy to wartość, która dzieli populację w stosunku 1:3. Jedna czwarta obiektów w populacji ma cechę o wartości poniżej kwartyla dolnego, a pozostałe trzy czwarte powyżej.
Kwartyl górny
Kwartyl górny badanej cechy to wartość, która dzieli populację w stosunku 3:1. Trzy czwarte obiektów w populacji ma cechę o wartości poniżej kwartyla dolnego, a pozostała jedna trzecia powyżej.

Wnioskowanie statystyczne

Cel wnioskowania
Celem wnioskowania statystycznego jest uogólnienie wniosków z próby na populację.
Rodzaje wnioskowania
W zależności od przyjętego modelu statystycznego wyróżniamy wnioskowanie parametryczne oraz nieparametryczne. Przypuśćmy, że zaobserwowaliśmy wynik "x" eksperymentu. Ten wynik traktujemy jako realizację pewnej zmiennej losowej "X". Rozkład prawdopodobieństwa "F" zmiennej losowej "X" nie jest znany. Dzięki pewnej wiedzy na temat sposobu przeprowadzenia eksperymentu możemy jedynie wskazać, że "F" należy do pewnej rodziny rozkładów "M". O rodzinie "M" powiemy, że jest ona naszym modelem (statystycznym) eksperymentu, a nasze zadanie polega na odgadnięciu "prawdziwego F". Jeżeli każdy element "F" rodziny "M" może być reprezentowany przez parametr (liczbę rzeczywistą lub wektor liczb rzeczywistych), o modelu "M" powiemy, że jest parametryczny, w przeciwnym przypadku powiemy, że jest nieparametryczny (przykład).