Wykres funkcji gęstości
Wykres dystrybuanty
Charakterysyka

Typ rozkładu: ciągły
Wartość oczekiwana: \[\mu \]
Wariancja: \[\sigma^2 \]
Moda: \[\mu \]
Mediana: \[\mu \]
Skośność: 0
Kurtoza: 0

Rozkład normalny jest niezwykle ważnym rozkładem prawdopodobieństwa w wielu dziedzinach. Nazywa się go także rozkładem Gaussa, w szczególności w fizyce i inżynierii. W zasadzie jest to rodzina nieskończenie wielu rozkładów, definiowanych dwoma parametrami: średnią (odpowiada za położenie rozkładu) i odchyleniem standardowym (skala). Standardowy rozkład normalny to rozkład normalny ze średnią zero i odchyleniem standardowym jeden. Ponieważ wykres funkcji gęstości rozkładu normalnego przypomina dzwon, często nazywa się go krzywą dzwonową.

Historia

Rozkład normalny został po raz pierwszy przedstawiony przez de Moivre'a w artykule w 1773 (przedrukowany w drugim wydaniu Doktryny szans 1738) w kontekście aproksymacji niektórych rozkładów dwumianowych dla dużych n. Wyniki tych badań zostały rozwinięte przez Laplace'a w książce Analityczna teoria prawdopodobieństwa (1812) i teraz są nazywane twierdzeniem de Moivre'a-Laplace'a.
Laplace użył rozkładu normalnego w analizie błędów pojawiających się w eksperymentach. Ważna w teorii prawdopodobieństwa Metoda najmniejszych kwadratów została wprowadzona przez Legendre'a w 1805. Gauss, który twierdził, że używał tej metody od 1794, uzasadnił ją silnie w 1809 dzięki założeniu o normalnym rozkładzie błędów.
Nazwa krzywa dzwonowa pochodzi od Joufretta, który użył terminu powierzchnia dzwonowa w 1872 dla dwuwymiarowego rozkładu normalnego z niezależnymi składnikami. Nazwa rozkład normalny została wymyślona jednocześnie przez Charlesa S. Peirce'a, Francisa Galtona i Wilhelma Lexisa około roku 1875. Ta terminologia nie jest najlepsza, gdyż sugeruje, że wszystko ma rozkład normalny (patrz Rozkład normalny#Występowanie).
Fakt, że rozkład ten jest nazywany normalnym albo Gaussa, zamiast de Moivre'a, jest przykładem działania prawa Stingera.

Definicja rozkładu normalnego

Funkcja gęstości (wykres na górze), która mówi jak prawdopodobna jest każda wartość zmiennej losowej. Równoważnymi sposobami zdefiniowania rozkładu normalnego są: momenty, kumulanty, funkcja charakterystyczna, funkcja tworząca momenty i funkcja tworząca kumulanty. Wszystkie kumulanty rozkładu normalnego wynoszą 0 oprócz pierwszych dwóch.

Funkcja gęstości

Funkcja gęstości dla rozkładu normalnego ze średnią μ i odchyleniem standardowym σ (równoważnie: wariancją σ2) jest przykładem funkcji Gaussa.
\[f(x) = {1 \over \sigma\sqrt{2\pi} } e^{ \frac {-(x-\mu )^2} {2\sigma^2} } \]

(
\[f(x) = {1 \over \sqrt{2\pi} }\,e^{-{x^2 \over 2}} \]

Obrazek u góry artykułu przedstawia wykres funkcji gęstości rozkładu normalnego dla μ = 0 i kilku różnych wartości σ.
We wszystkich rozkładach normalnych funkcja gęstości jest symetryczna względem wartości średniej rozkładu. Około 68% pola pod wykresem krzywej znajduje się w odległości jednego odchylenia standardowego od średniej, około 95,5% w odległości dwóch odchyleń standardowych i około 99,7% w odległości trzech (reguła trzech sigm). Punkt przegięcia krzywej znajduje się w odległości jednego odchylenia standardowego od średniej.

Dystrybuanta

Dystrybuanta jest definiowana jako prawdopodobieństwo tego, że zmienna X ma wartości mniejsze od x i w kategoriach funkcji gęstości wyrażana jest wzorem:
\[P(X \le x) = \int_{-\infty}^x \frac{1}{\sigma\sqrt{2\pi}} e^{-(u-\mu)^2 \over (2\sigma^2)}\,du \]

Aby uzyskać wzór na dystrybuantę standardowego rozkładu normalnego, tradycyjnie oznaczaną jako Φ, wystarczy podstawić pod ogólny wzór wartości μ = 0 i σ = 1,
\[\Phi(z) = \int_{-\infty}^z {1 \over \sqrt{2\pi} }\,e^{-{x^2 \over 2}}\,dx \]

Dystrybuanta standardowego rozkładu normalnego może być wyrażona poprzez specjalną funkcję, tzw. funkcję błędu jako:
\[\Phi(z) = \frac{1}{2} \left(1+\operatorname{erf}\,\frac{z}{\sqrt{2}}\right) \]

Ten wykres pokazuje dystrybuantę rozkładu normalnego dla wartości zmiennej z od -4 do +4.
Na tym wykresie widzimy, że prawdopodobieństwo zdarzenia, że zmienna losowa o rozkładzie normalnym przyjmie wartość mniejszą niż 0,25 wynosi około 0,60.

Funkcja charakterystyczna

Funkcję charakterystyczną definiuje się jako wartość oczekiwaną \[e^{itX} \].
\[\phi_X(t)=E\left[1]=\int_{-\infty}^{\infty} \frac{1} {\sigma\sqrt{2\pi}}\,e^{-{(x-\mu )^2 \over 2\sigma^2}}\,e^{itx}\,dx = e^{i\mu t-\sigma^2 t^2 \over 2} \]

co otrzymujemy przez rozwinięcie kwadratu w wykładniku.

Własności

  1. Jeśli X ~ N(μ, σ2) i a i bliczbami rzeczywistymi, to aX + b ~ N(aμ + b, (aσ)2).
  2. Jeśli X1 ~ N(μ1, σ12) i X2 ~ N(μ2, σ22), i X1 i X2niezależne, to X1 + X2 ~ N(μ1 + μ2, σ12 + σ22).
  3. Jeśli X1, ..., Xnniezależnymi zmiennymi losowymi o standardowym rozkładzie normalnym, to X12 + ... + Xn2 ma rozkład chi-kwadrat z n stopniami swobody.

Wartości wybranych miar rozkładu

Standaryzowanie zmiennych losowych o rozkładzie normalnym

Konsekwencją własności 1 jest możliwość przekształcenia wszystkich zmiennych losowych o rozkładzie normalnym do standardowego rozkładu normalnego.
Jeśli X ma rozkład normalny ze średnią μ i wariancją σ2, wtedy:
\[Z = \frac{X - \mu}{\sigma} \]

Z jest zmienną losową o standardowym rozkładzie normalnym N(0, 1). Ważną konsekwencją jest postać dystrybuanty:
\[P(X \le x) = \Phi\left(\frac{x-\mu}{\sigma}\right) = \frac{1}{2} \left(1+\mbox{erf}\,\left(\frac{x-\mu}{\sigma\sqrt{2}}\right)\right) \]

Odwrotnie, jeśli Z jest zmienną losową o standardowym rozkładzie normalnym, to:
\[X=\sigma Z+\mu \, \]

jest zmienną o rozkładzie normalnym ze średnią μ i wariancją σ2.
Standardowy rozkład normalny został stablicowany i inne rozkłady normalne są prostymi transformacjami rozkładu standardowego. W ten sposób możemy używać tablic dystrybuanty rozkładu normalnego do wyznaczenia wartości dystrybuanty rozkładu normalnego o dowolnych parametrach.

Generowanie zmiennych losowych o rozkładzie normalnym

W symulacjach komputerowych zdarza się, że potrzebujemy wygenerować wartości zmiennej losowej o rozkładzie normalnym. Istnieje kilka metod, najprostszą z nich jest odwrócenie dystrybuanty standardowego rozkładu normalnego. Są jednak metody bardziej wydajne, jedną z nich jest transformacja Boxa-Mullera, w której dwie zmienne losowe o rozkładzie jednostajnym (prostym do wygenerowania - patrz generator liczb losowych) są transformowane na zmienne o rozkładzie normalnym.
Transformacja Boxa-Mullera jest kosekwencją własności 3 i faktu, że rozkład chi-kwadrat z dwoma stopniami swobody jest rozkładem wykładniczym (łatwym do wygenerowania).

Centralne twierdzenie graniczne

Jedną z najważniejszych własności rozkładu normalnego jest fakt, że, przy pewnych założeniach, rozkład sumy dużej liczby zmiennych losowych jest w przybliżeniu normalny. Jest to tak zwane centralne twierdzenie graniczne.
W praktyce twierdzenie to ma zastosowanie jeśli chcemy użyć rozkładu normalnego jako przybliżenia dla innych rozkładów.
  • Rozkład dwumianowy z parametrami n i p jest w przybliżeniu normalny dla dużych n i p nie leżących zbyt bliko 1 lub 0. Przybliżony rozkład ma średnią równą μ = np i odchylenie standardowe σ = (n p (1 - p))1/2.
  • Rozkład Poissona z parametrem λ jest w przybliżeniu normalny dla dużych wartości λ. Przybliżony rozkład normalny ma średnią μ = λ i odchylenie standardowe σ = √λ.
Dokładność przybliżenia tych rozkładów zależy od celu użycia przybliżenia i tempa zbieżności do rozkłądu normalnego. Zazwyczaj takie przybliżenia są mniej dokładne w ogonach rozkładów.

Nieskończona podzielność

Rozkład normalny należy do rozkładów mających własność nieskończonej podzielności.

Natężenie źródła światła

Natężenie światła z pojedynczego źródła zmienia się w czasie i zazwyczaj zakłada się, że ma rozkład normalny. Jednak zgodnie z mechaniką kwantową światło jest strumieniem fotonów. Zwykłe źródło światła, świecące dzięki termicznej emisji, powinno świecić w krótkich przedziałach czasu zgodnie z rozkładem Poissona lub rozkładem Bosego-Einsteina. W dłuższym przedziale czasowym (dłuższym niż czas koherencji) dodawanie się do siebie niezależnych zmiennych prowadzi w przybliżeniu do rozkładu normalnego. Natężenie światła lasera, który jest zjawiskiem kwantowym, ma dokładnie rozkład normalny.

Błędy pomiaru

Wielokrotne powtarzanie tego samego pomiaru daje wyniki rozrzucone wokół określonej wartości. Jeśli wyeliminujemy wszystkie większe przyczyny błędów, zakłada się, że pozostałe mniejsze błędy muszą być rezultatem dodawania się do siebie dużej liczby niezależnych czynników, co daje w efekcie rozkład normalny. Odchylenia od rozkładu normalnego rozumiane są jako wskazówka, że zostały pominięte błędy systematyczne. To stwierdzenie jest centralnym 'założeniem teorii błędów.
Publikacja wraz ze zdjęciami jest udostępniona w Encyklopedii "Zgapedia" części portalu zgapa.pl. Treść objęta jest licencją GNU FDL Wolnej Dokumentacji w wersji 1.3 lub dowolnej pózniejszej opublikowanej przez Free Software Foundation i została ona opracowana na podstawie Wikipedii, tutaj możesz znaleźć artykuł źródłowy oraz autorów. Warunki użytkowania Encyklopedii znajdziesz na tej stronie.
Prezentowane filmy poczhodzą z serwisu YouTube, portal zgapa.pl nie jest ich autorem i nie ponosi odpowiedzialności za ich treści.