Eszkola

Wzór na współczynnik korelacji r-Pearsona wzór

Wzór na współczynnik korelacji r-Pearsona ma postać:


\(r(x,y) = \dfrac{cov(x,y)}{\sigma_x * \sigma_y}\)

przy czym

\(cov(x,y) = E(x * y) - (E(x) *E(y))\)


gdzie:

\(r(x,y)\) - współczynnik korelacji r-Pearsona pomiędzy zmiennymi x i y

\(cov(x,y)\) - kowariancja pomiędzy zmiennymi x i y

\(\sigma\) - odchylenie standardowe z populacji

\(E\) - wartość oczekiwana

 
Aby obliczyć współczynnik korelacji pomiędzy dwiema zmiennymi należy obliczyć najpierw kowariancję pomiędzy nimi \(cov(x,y)\) a uzyskany wynik podzielić przez iloczyn odchyleń standardowych dla obu zmiennych.

Przykład obliczenia współczynnika korelacji r-Pearsona:

Chcąc zbadać związek (korelację r-Pearsona) pomiędzy parą zmiennych musimy każdej obserwacji przyporządkować wyniki na obu zmiennych. Zbadamy związek pomiędzy wiekiem i wagą u 6 badanych osób.

Tabela. Wyniki wzrostu i wagi dla przebadanych osób

Osoba Wiek Waga
1 18 78
2 18 77
3 21 98
4 19 110
5 16 80
6 17 69


Na początku musimy obliczyć kowariancję, wyliczamy iloczyn pomiędzy wynikami jednej i drugiej zmiennej

Tabela. Wyliczenie kowariancji dla dwóch zmiennych

 

Osoba Wiek Waga Iloczyn
1 18 78 1404
2 18 77 1386
3 21 98 2058
4 19 110 2090
5 16 80 1280
6 17 69 1173
Wartość oczekiwana \(E\) liczymy jak średnią 18,17 85,33 1565,17


Następnie obliczamy iloczyn wartości oczekiwanych dwóch zmiennych (NIE! wartość oczekiwaną iloczynów - to już mamy w tabeli)

18,17 * 85,33 = 1550,22

Kowariancja = 1565,17 - 1550,22 = 14,91 - \(cox(X,Y)\)

Następnie musimy obliczyć odchylenie standardowe dla jednej i drugiej zmiennej (korzystając ze wzoru na odchylenie standardowe z populacji, bez korekty - 1).

Odchylenie standardowe dla wieku = 1,572
Odchylenie standardowe dla wagi = 14,067
Iloczyn odchyleń standardowych = 1,572 * 14,067 =  22,118

Na końcu dzielimy wynik kowariancji przez iloczyn odchyleń standardowych

= 14,91 / 22,118 = 0,676 - \(r(x,y)\)

Istotność uzyskanego współczynnika możemy określić korzystając z tablic - Tablica rozkładu istotności współczynnika korelacji r-Pearsona

Liczba stopni swobody w naszym przykładzie wynosi: 6 - 2 = 4, czyli liczba obserwacji minus 2.

 

 

 

 

 

Wzór na współczynnik korelacji r-Pearsona - jak stosować w praktyce?