Eszkola

Rangowanie obserwacji - opis

Przydatne kalkulatory i narzędzia

Rangowanie obserwacji polega na przydzieleniu poszczególnym obserwacjom odpowiedniej rangi. Zabieg ten wykonujemy w celu nadania wartości poszczególnym obserwacjom, niezależnie od ich jednostki. Ewentualne znaczne dysproporcje pomiędzy kolejnymi wynikami przy ich rangowaniu ulegają redukcji do stałej wartości różnicy pomiędzy nimi. Główną ideą rangowania jest uszeregowanie obserwacji od najniższej do najwyższej, czyli nadanie rankingu obserwacjom, niezależnie od wielkości różnicy pomiędzy nimi.

Sposób rangowania. Najczęściej rangowanie zaczyna się od 1 do n (liczba obserwacji do porangowania). Na wstępie musimy uszeregować nasze obserwacje od najniższej do najwyższej. Kolejnym rangom przypisywane są kolejne wartości od 1 do n. W przypadku, gdy mamy dwie lub więcej takich samych obserwacji (o tej samej wartości) musimy nadać tym obserwacjom tzw. rangi wiązane. Dokonujemy tego w ten sposób, że dodajemy do siebie wartości poszczególnych rang, gdybyśmy kolejno mieli je tym obserwacjom nadawać. Uzyskaną sumę dzielimy przez liczbę takich samych obserwacji. Kolejnej obserwacji (po wystąpieniu sytuacji z takimi samymi obserwacjami) nadajemy kolejną (której nie uwzględnialiśmy we wcześniejszych obliczeniach rang wiązanych) rangę.

Przykład - bez rang wiązanych

Chcemy porangować wiek badanych osób w naszym badaniu: 33, 44, 21, 76, 45, 28, 55, 54
Na wstępie musimy uszeregować zebrane wyniki od najniższej do najwyższej wartości

Wiek - dane surowe Wiek - rangi
21 1
28 2
33 3
44 4
45 5
54 6
55 7
76 8

Najpierw uszeregowaliśmy obserwacje następnie przydzieliliśmy im kolejne rangi z zakresu od 1 do n (n = 8, bo 8 obserwacji)

Przykład - z rangami wiązanymi

Chcemy porangować wiek badanych osób w naszym badaniu: 33, 44, 21, 55, 44, 28, 55, 54, 55, 65
Na wstępie musimy uszeregować zebrane wyniki od najniszej do najwyższej wartości

Wiek - dane surowe Wiek - rangi
21 1
28 2
33 3
44 4,5
44 4,5
54 6
55 8
55 8
55 8
65 10

Dla obserwacji 44 lata występującej dwukrotnie powinniśmy przypisać rangę 4 i 5, zatem sumujemy ją i dzielimy przez 2 (ponieważ dwie obserwacje takie same), czyli każdej z nich przypisujemy wartość 4,5. Kolejnej osobie (wiek = 54 lata) nadajemy już rangę 6, ponieważ 4 i 5 użyliśmy wcześniej. Dalej mamy sytuację z 3 takimi samymi obserwacjami. Zatem powinniśmy im nadać rangi 7, 8, 9... ale musimy nadać im wspólna rangę, ponieważ są to te same obserwacje, czyli: 7+8+9 = 24 / 3 = 8, czyli każdej z obserwacji nadajemy rangę 8. Kolejnej obserwacji nadajemy kolejną rangę, 10, ponieważ 7, 8 i 9 użyliśmy wcześniej.

Rangowanie obserwacji najczęściej wymagane jest przy analizach wykorzystujących testy nieparametryczne, takie jak np: test U Manna-Whitneya, korelacja rho-Spearmana czy test Kruskala-Wallisa. Rangowanie ma na celu zniwelowanie zbyt znacznych dysproporcji (a przede wszystkim nierównych dysproporcji) pomiędzy kolejnymi wynikami. Dla przykładu - załóżmy, że zbadaliśmy wiek pięciu osób i uzyskaliśmy wyniki: 20, 22, 25, 28 i 59. Jak można zauważyć, ostatnia wartość znacznie odbiega od pozostałych. Różnica pomiędzy nią a innymi jest na tyle znaczna (w porównaniu do średniej różnicy pomiędzy pozostałymi 4 wartościami), że zniekształcałaby znacząco obliczane wyniki.  Rangowanie zatem wykorzystywane jest najczęściej do rozkładów obserwacji/ wyników z obserwacjami odstającymi lub/i dla rozkładów nie zbliżonych do rozkładu normalnego.

Oczywiście należy mieć na uwadze fakt, że rangowanie eliminuje znaczą część informacji, jakie zostały zebrane w badaniu. Różnica pomiędzy kolejnymi obserwacjami (wielkość tej różnicy) może stanowić bardzo ważną informację, którą to przy rangowaniu eliminujemy (nie bierzemy jej pod uwagę). Rangowanie, jak przedstawiono na przykładach powyżej, nadaje kolejne, o stałej różnicy rangi kolejnym obserwacjom.



Rangowanie obserwacji Wasze opinie