Czytaj więcej"/> Drukuj
Odchylenie standardowe - klasyczna miara zmienności, obok średniej arytmetycznej najczęściej stosowane pojęcie statystyczne.
Odchylenie standardowe wartości cechy w populacji oznaczamy tradycyjnie przez σ (małe greckie sigma) i definiujemy jako pierwiastek kwadratowy z wariancji. Dla skończonych populacji obliczamy je ze wzoru:
\[\sigma=\sqrt{\frac{\sum_{i=1}^N{(x_i-\mu)^2}}{N}} \]

gdzie \[x_i \] to kolejne wartości cechy w populacji, \[\mu \] to wartość oczekiwana, N to liczba elementów w populacji.
Odchylenie standardowe w populacji można estymować odchyleniem standardowym z próby losowej, oznaczanym przez s. Odpowiedni wzór ma postać:
\[s = \sqrt{\frac{\sum_{i=1}^n{(x_i-\overline{x})^2}}{n-1}} \]
gdzie \[x_i \] to kolejne wartości cechy elementów próby losowej, \[\overline{x} \] to średnia arytmetyczna z próby, zaś n to liczba elementów w próbie.
Odchylenie standardowe ma szereg własności, które powodują, że jest to miara bardzo przydatna w statystyce opisowej. Przede wszystkim jest ono wyrażone w tych samych jednostkach co wartości cechy, np. jeśli badamy wzrost ludzi w cm, to odchylenie standardowe również wyraża się w cm.
W praktyce często zakłada się, że dane podlegają rozkładowi normalnemu. Jeśli to założenie jest uzasadnione, wówczas prawdziwe są poniższe stwierdzenia: Ostatnie stwierdzenie jest również znane jako reguła trzech sigm.
W ogólnym przypadku, gdy rozkład cech nie jest znany, prawdziwa jest nierówność Czebyszewa: dla danego \[k>1 \] prawdopodobieństwo, że wartość losowo wybranej cechy różni się od wartości oczekiwanej o więcej niż \[\pm k\sigma \] wynosi co najwyżej \[1/k^2 \]. Na przykład poza przedziałem \[\langle\mu-2\sigma,\mu+2\sigma\rangle \] leży co najwyżej 25% wartości cechy.
Materiał wydrukowany z portalu zgapa.pl dnia 2020-10-24 22:26:38