Współczynnik korelacji liniowej Pearsona określa poziom zależności liniowej między zmiennymi losowymi. Niech \[x \] i \[y \] będą zmiennymi losowymi o ciągłych rozkładach. \[x_i, y_i \] oznaczają wartości prób losowych tych zmiennych (\[i=1, 2, ..., n \]), natomiast \[\overline{x}, \overline{y} \] - wartości średnie z tych prób, tj. \[\overline{x} = \frac{1}{n}\sum_{i=1}^n x_i, \overline{y} = \frac{1}{n}\sum_{i=1}^n y_i \].
Wówczas współczynnik korelacji liniowej definiuje się następująco:
\[r_{xy} = \frac{\sum_{i=1}^n (x_i - \overline{x})(y_i - \overline{y})}{\sqrt{\sum_{i=1}^n (x_i - \overline{x})^2} \sqrt{\sum_{i=1}^n (y_i - \overline{y})^2}}, \]
\[r_{xy} \in 1. \]
Innymi słowy współczynnik korelacji liniowej dwóch zmiennych jest ilorazem kowariancji i iloczynu odchyleń standardowych tych zmiennych:
\[r_{XY} = \frac{\mathrm{cov}(X, Y)}{\sigma_X\sigma_Y} \]
Współczynnik korelacji można określić również dla zmiennych losowych o dyskretnych rozkładach. Trzymając się poprzedniej notacji dla średnich wartości zmiennych, dostajemy postać
\[r_{XY} = \frac{\mathrm{cov}(X, Y)}{\sigma_X\sigma_Y} = \frac{\left(\sum_{i=1}^n\sum_{j=1}^mP(X=x_i,Y=y_j)x_iy_j\right) - \overline{X}\;\overline{Y} }{\sqrt{\left(\sum_{i=1}^nP(X=x_i)x_i^2\right)-\overline{X}^2 }\sqrt{\left(\sum_{i=1}^mP(Y=y_i)y_i^2\right) -\overline{Y}^2} } \]
Im większa wartość współczynnika, tym większa jest zależność liniowa między zmiennymi. \[r_{xy} = 0 \] oznacza brak korelacji, \[r_{xy} = 1 \] oznacza maksymalną korelację, natomiast \[r_{xy} = -1 \] oznacza korelację ujemną, tzn. jeżeli zmienna \[x \] rośnie, to \[y \] maleje i na odwrót.
Współczynnik korelacji liniowej można traktować jako znormalizowaną kowariancję. Korelacja przyjmuje zawsze wartości w zakresie \[1 \], co pozwala uniezależnić analizę od dziedziny badanych zmiennych.
Ograniczenia stosowalności: podatny na obserwacje skrajne.
Publikacja wraz ze zdjęciami jest udostępniona w Encyklopedii "Zgapedia" części portalu zgapa.pl. Treść objęta jest licencją GNU FDL Wolnej Dokumentacji w wersji 1.3 lub dowolnej pózniejszej opublikowanej przez Free Software Foundation i została ona opracowana na podstawie Wikipedii, tutaj możesz znaleźć artykuł źródłowy oraz autorów. Warunki użytkowania Encyklopedii znajdziesz na tej stronie.