Wzór na współczynnik korelacji r-Pearsona ma postać:
\(r(x,y) = \dfrac{cov(x,y)}{\sigma_x * \sigma_y}\)
przy czym
\(cov(x,y) = E(x * y) - (E(x) *E(y))\)
gdzie:
\(r(x,y)\) - współczynnik korelacji r-Pearsona pomiędzy zmiennymi x i y
\(cov(x,y)\) - kowariancja pomiędzy zmiennymi x i y
\(\sigma\) - odchylenie standardowe z populacji
\(E\) - wartość oczekiwana
Aby obliczyć współczynnik korelacji pomiędzy dwiema zmiennymi należy obliczyć najpierw kowariancję pomiędzy nimi \(cov(x,y)\) a uzyskany wynik podzielić przez iloczyn odchyleń standardowych dla obu zmiennych.
Przykład obliczenia współczynnika korelacji r-Pearsona:
Chcąc zbadać związek (korelację r-Pearsona) pomiędzy parą zmiennych musimy każdej obserwacji przyporządkować wyniki na obu zmiennych. Zbadamy związek pomiędzy wiekiem i wagą u 6 badanych osób.
Tabela. Wyniki wzrostu i wagi dla przebadanych osób
Osoba | Wiek | Waga |
1 | 18 | 78 |
2 | 18 | 77 |
3 | 21 | 98 |
4 | 19 | 110 |
5 | 16 | 80 |
6 | 17 | 69 |
Na początku musimy obliczyć kowariancję, wyliczamy iloczyn pomiędzy wynikami jednej i drugiej zmiennej
Tabela. Wyliczenie kowariancji dla dwóch zmiennych
Osoba | Wiek | Waga | Iloczyn |
1 | 18 | 78 | 1404 |
2 | 18 | 77 | 1386 |
3 | 21 | 98 | 2058 |
4 | 19 | 110 | 2090 |
5 | 16 | 80 | 1280 |
6 | 17 | 69 | 1173 |
Wartość oczekiwana \(E\) liczymy jak średnią | 18,17 | 85,33 | 1565,17 |
Następnie obliczamy iloczyn wartości oczekiwanych dwóch zmiennych (NIE! wartość oczekiwaną iloczynów - to już mamy w tabeli)
18,17 * 85,33 = 1550,22
Kowariancja = 1565,17 - 1550,22 = 14,91 - \(cox(X,Y)\)
Następnie musimy obliczyć odchylenie standardowe dla jednej i drugiej zmiennej (korzystając ze wzoru na odchylenie standardowe z populacji, bez korekty - 1).
Odchylenie standardowe dla wieku = 1,572
Odchylenie standardowe dla wagi = 14,067
Iloczyn odchyleń standardowych = 1,572 * 14,067 = 22,118
Na końcu dzielimy wynik kowariancji przez iloczyn odchyleń standardowych
= 14,91 / 22,118 = 0,676 - \(r(x,y)\)
Istotność uzyskanego współczynnika możemy określić korzystając z tablic - Tablica rozkładu istotności współczynnika korelacji r-Pearsona
Liczba stopni swobody w naszym przykładzie wynosi: 6 - 2 = 4, czyli liczba obserwacji minus 2.
Wzór na współczynnik korelacji r-Pearsona - jak stosować w praktyce?