Statystyka to
nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy
danych opisujących zjawiska masowe.
Duża część
dziedzin wiedzy zajmuje się obserwacją otaczającego nas świata lub też posługuje się
eksperymentem dla potwierdzenia swoich
teorii. Takie badanie przebiega zazwyczaj według schematu: zebranie dużej ilości
danych, ich analiza i interpretacja. Badaczowi potrzebny jest wtedy zestaw narzędzi - sprawdzonych metod, które umożliwią mu operowanie na dużych zbiorach danych. Tworzeniem i rozwijaniem takich użytecznych narzędzi zajmuje się właśnie statystyka.
Początki statystyki
Swoje początki statystyka wywodzi z tradycji dokonywania spisów powszechnych, czyli zbierania informacji na temat ludności. Ślady pierwszego spisu można znaleźć w
Księdze Liczb, kiedy to
Mojżesz wyprowadzał lud
Izraela z
Egiptu. Spisy powszechne były stosunkowo systematycznie przeprowadzane na terenie starożytnego
Rzymu. Z pewnością posiadanie informacji na temat stanu ludności ułatwiało rozpoznawanie trendów i odpowiednie planowanie. Do ok. połowy
XIX wieku termin
statystyka oznaczał
podany w tabelarycznej formie zbiór danych na temat stanu państwa. Można przypuszczać, że w pewnym momencie posiadanie podstawowych danych stało się niewystarczające, szczególnie przy coraz szybciej rozwijającej się gospodarce światowej. Konieczne stało się nie tylko ulepszanie metod pozyskiwania danych, ale również ich opisu i analizy. Zbiegło się to w czasie z szybkim rozwojem metod
matematycznych, szczególnie
teorii prawdopodobieństwa.
Dlaczego w statystyce mamy do czynienia z losowością
Już pierwszy rzut oka na podstawowe metody statystyczne pozwala nam zorientować się, że nieodłącznym ich atrybutem jest losowość. Przede wszystkim wynika to z losowej natury badanych wielkości. Na przykład wzrost człowieka jest uwarunkowany ogromną ilością czynników, takich jak
genetyka,
dieta, środowisko, przy czym niektóre z nich również mają losową naturę. Zgodnie z zasadami
mechaniki kwantowej na pewnym poziomie obserwacji wszystkie zjawiska mają charakter losowy.
Ważniejszy jest jednak fakt, że czasami nie mamy możliwości lub środków do tego, aby przebadać całą
populację. Badanie wzrostu wszystkich ludzi tylko po to, aby wyznaczyć średni wzrost ludzi w Polsce z
ekonomicznego punktu widzenia nie ma sensu (patrz
Badanie statystyczne), lepiej byłoby przebadać losowo wybraną grupę osób, zakładając, że reszta populacji nie wyróżnia się szczególnie wysokim lub niskim wzrostem. W tym wypadku, oszczędzając na samym badaniu, świadomie skazujemy się na niepewność.
Jak widać, losowość zjawisk jest niejako wpisana w definicję metod statystycznych. Dlatego właśnie statystykę łączy bardzo ścisły związek z
teorią prawdopodobieństwa, działem
matematyki dzięki któremu jesteśmy w stanie poradzić sobie z niepewnością.
Metody statystyczne
Celem analizy statystycznej jest pozyskanie jak największej wiedzy z tego, co jesteśmy w stanie zaobserwować. Dlatego powinniśmy:
- # Zaplanować badanie
- # Podsumować zbiór danych z obserwacji, podkreślając tendencje, ale rezygnując ze szczegółów
- # Uzgodnić, jaką wiedzę o badanym zjawisku dostarczają nam dane
Poszczególne punkty odpowiadają działom statystyki:
- # Metoda reprezentacyjna
- # Statystyka opisowa
- # Wnioskowanie statystyczne
Istnieje również wiele metod służących analizie danych statystycznych:
Statystyka stosowana
Statystyka jest stosowana w wielu dziedzinach wiedzy, w niektórych z nich tak intensywnie, że doczekała się własnej terminologii i wyspecjalizowanych metod. Z czasem wytworzyły się dziedziny z pogranicza statystyki i innych nauk. Należą do nich: