TABELE WIELODZELCZE TESTY NIEPARAMETRYCZNE

1 TABELE WIELODZELCZE TESTY NIEPARAMETRYCZNEStatystyka dl...
Author: Lidia Urbańska
0 downloads 1 Views

1 TABELE WIELODZELCZE TESTY NIEPARAMETRYCZNEStatystyka dla II roku GI Rok akademicki 2012/2013 Wykłady 9 i 10 TABELE WIELODZELCZE TESTY NIEPARAMETRYCZNE

2 Zmienne jakościowe (kategoryzujące)Stosujemy je wówczas gdy dane chcemy zgrupować w rozłączne kategorie, np. płeć, typ gleby, wykształcenie itd. Każdy element próby jest sklasyfikowany ze względu na podane kryterium Podział może obejmować dwie lub więcej grup

3 Wielokrotne odpowiedziZmienne tego typu spotykamy najczęściej przy analizie danych pochodzących z ankiet lub badań opinii publicznej Respondenci muszą odpowiedzieć na kilka pytań a odpowiedzi wybrać z listy dostępnych opcji Zazwyczaj chcemy odpowiedzi podsumować i podać odsetki z badanej grupy wybierających na dane pytanie określoną odpowiedź

4 Wielokrotne dychotomieZmienne tego typu spotykamy najczęściej również przy analizie danych pochodzących z ankiet lub badań opinii publicznej Respondenci muszą odpowiedzieć na kilka pytań, a odpowiedzi mogą mieć charakter tylko TAK/NIE (1/0) Przy opisywaniu takich chcielibyśmy zestawienie jak poprzednio, to jest dla procenty dla każdego pytania w stosunku do liczby odpowiedzi i w stosunku do liczby ankietowanych

5 Cele analizy Oprócz prostego, tabelarycznego, zestawienia wyników celem jest również ocena zależności pomiędzy zmiennymi tego typu, na przykład: Czy dana roślina wykazuje istotne przywiązanie do określonego typu gleby? Czy kontakt z osobą palącą papierosy zwiększa ryzyko zachorowania na raka płuc? Czy poziom wykształcenia (płeć, miejsce zamieszkania) ma wpływ na poparcie określonej partii politycznej?

6 Tabela wielodzielcza Przedstawia rozkład obserwacji ze względu na kilka cech jednocześnie Zakładamy, że dysponujemy n obserwacjami dla jakościowej cechy X (posiadającej kategorie X1, X2, …, Xk) i jakościowej cechy Y (o kategoriach Y1, Y2, …, Yp). Wówczas tabela wielodzielcza przedstawia się następująco:

7 Rozkład brzegowy cechy Y Rozkład brzegowy cechy XTabela wielodzielcza X/Y Y1 Y2 Yp X1 n11 n12 n1p Rozkład brzegowy cechy Y X2 n21 n22 n2p Xk nk1 nk2 nkp Rozkład brzegowy cechy X

8 Tabela wielodzielcza Liczebności nij określają liczbę elementów próby, dla których cecha X ma wariant Xi i jednocześnie cecha Y – wariant Yj Tabela wielodzielcza pokazuje więc określony łączny rozkład obu cech Liczebności w ostatnim wierszu i w ostatniej kolumnie nazywamy empirycznymi rozkładami brzegowymi, odpowiednio cechy Y i cechy X

9 Przykład 1 Chcemy ocenić wpływ używek (papierosy, kawa, alkohol) na pewną chorobę po zebraniu danych ich używania w 90 osobowej grupie Początkowy fragment danych Zastosowano podział na cztery kategorie: Nigdy – nie używano nigdy, Niewiele – używano w niewielkich ilościach Średnio – używano w średnich ilościach Dużo – używano w dużych ilościach W badaniach brano również pod uwagę płeć respondentów. Lp. Kawa Papierosy Alkohol Płeć 1 Nigdy Dużo Niewiele M 2 3 Średnio K 4 5 6 7 8 9 10 11 12 13 14 15

10 Przykład 1 cd. Zliczając otrzymane dane dla papierosów i płci, otrzymamy następującą tabelę dwudzielczą: Płeć Papieros Nigdy Papieros Niewiele Papieros Średnio Papieros Dużo Kobieta 11 8 6 5 30 Mężczyzna 4 28 24 60 15 12 34 29 90 W tabeli wytłuszczono rozkłady brzegowe Z tabeli widać wyraźną przewagę mężczyzn w grupie palących duże lub średnie ilości papierosów Z kolei, w analizowanej grupie, trzykrotnie więcej kobiet niż mężczyzn nigdy nie paliło Tabele tego typu są także przedstawiane w postaci względnej (procentowej): względem jednej lub drugiej cechy, bądź całkowitej liczby przypadków

11 Testowanie niezależności cechNastępny etap analizy statystycznej tak zebranych danych, to próba weryfikacji hipotezy, że dwie jakościowe cechy w populacji są niezależne Najczęściej stosowanym do tego celu narzędziem jest test 2 Został on opracowany przez Karla Pearsona w 1900 roku i jest metodą, dzięki której można się upewnić, czy dane zawarte w tabeli wielodzielczej potwierdzają występowanie związku między dwiema zmiennymi Test 2 polega na porównaniu częstości zaobserwowanych z częstościami oczekiwanymi przy założeniu prawdziwości hipotezy zerowej (o braku związku pomiędzy tymi dwoma zmiennymi) Częstości oczekiwane obliczamy, wykorzystując częstości marginalne (z tablicy wielodzielczej) według następującego wzoru: E (częstość oczekiwana) = _____________________________ (suma całkowita) (suma wiersza)(suma kolumny)

12 Testowanie niezależności cechDla tabeli wielodzielczej dotyczącej wpływu używek częstości oczekiwane wyrażają się wzorem: Wówczas hipotezę zerową orzekającą, że cechy X i Y są niezależne możemy zweryfikować testem 2

13 Testowanie niezależności cechWeryfikacja hipotezy zerowej H0: cechy X i Y są niezależne Wobec hipotezy alternatywnej: H1: cechy X i Y są zależne Weryfikacja hipotezy: Do weryfikacji hipotezy stosujemy statystykę: gdzie: E – oczekiwana częstość komórki O – obserwowana częstość komórki Przy założeniu prawdziwości hipotezy zerowej statystyka ta ma asymptotyczny rozkład 2 o s = (k-1)(p-1) stopniach swobody

14 Przykład 2 Badano zależność pomiędzy ilością wypalanych papierosów, a wystąpieniem pewnych niekorzystnych zmian w płucach w grupie 1500 osób. Zebrane dane przedstawiono w postaci tabeli: Niepalący Palący mało Palący duże ilości Suma Zmiany występują 51 250 560 861 Zmian nie ma 370 210 59 639 421 460 619 1500 Przykładowe obliczenie wartości oczekiwanej dla E11. Zgodnie z definicją:

15 Przykład 2 cd. Wyniki obliczeń wszystkich wartości oczekiwanych dla pozostałych komórek tabeli: Niepalący Palący mało Palący duże ilości Suma Zmiany występują 51 (241,654) 250 (264,04) 560 (353,306) 861 Zmian nie ma 370 (179,346) 210 (195,96) 59 (263,694) 639 421 460 619 1500 Wartość statystyki 2 wynosi: Wartość krytyczna odczytana z tablic dla poziomu istotności =0,001 wynosi 2 = 13,817. Na tej podstawie można odrzucić hipotezę zerową (2 > 2 ), i stwierdzić, że na poziomie istotności =0,001 istnieje zależność pomiędzy ilością wypalanych dziennie papierosów, a występowaniem niekorzystnych zmian w płucach.

16 Przykład 2 cd. Wysokie wartości obliczonej statystyki 2 zazwyczaj oznaczają duże różnice między częstościami obserwowanymi a oczekiwanymi i jest to potwierdzenie istnienia zależności Przeciwnie – mała wartość 2 (zwłaszcza bliska 0) wskazuje na brak powiązania

17 Statystyka 2 dla tablic 22Dla tablic dwudzielczych postaci: Wartość statystyki 2 wyznacza się według prostszego, praktycznego wzoru:

18 Ciśnienie niepodwyższone Ciśnienie podwyższonePrzykład 3 W próbie liczącej 100 mężczyzn w wieku lat zbadano częstość występowania choroby wieńcowej i podwyższonego ciśnienia tętniczego. Chcemy ocenić, czy choroba wieńcowa współistnieje z podwyższonymi wartościami ciśnienia tętniczego Ciśnienie niepodwyższone Ciśnienie podwyższone Razem Choroba wieńcowa nie występuje 37 17 54 Choroba wieńcowa występuje 8 38 46 45 55 100 Obliczając 2 według podanego wzoru stosowanego do tabel 22 otrzymujemy 2 = 26,23. Dla poziomu istotności  = 0,001 wartość krytyczna wynosi 2 =15,139. Ponieważ 2  2 …

19 Test 2 z poprawką YatesaStosujemy ją do analizy tabel 2  2, jeżeli 20 < N < 40 i którakolwiek z liczebności oczekiwanych jest mniejsza od 5 gdzie N to liczebność całej próby

20 Siła powiązania między zmiennymi jakościowymiStatystyka 2 umożliwia sprawdzenie, czy dwie zmienne wykazują związek Oprócz tego zazwyczaj istotne jest określenie jak silne jest to powiązanie Samej wartości 2 jako pomiaru siły związku nie możemy stosować, ponieważ zleży ona od liczebności grupy (N) i rośnie wraz z jej wzrostem Zaproponowano jednakże szereg wskaźników siły związku będących pochodną 2

21 Siła powiązania między zmiennymi jakościowymiWspółczynnik  Yule’a. Jest miarą korelacji między dwiema zmiennymi jakościowymi w tabeli 2  2. Przyjmuje wartości od 0 (brak powiązania między zmiennymi) do 1 (całkowite powiązanie między zmiennymi)

22 Siła powiązania między zmiennymi jakościowymiWspółczynnik V -Cramera. Jest miarą korelacji między zmiennymi jakościowymi w tabelach wielodzielczych. Przyjmuje wartości od 0 (brak powiązania między zmiennymi) do 1 (całkowite powiązanie między zmiennymi) gdzie k i p to wymiary tablicy wielodzielczej

23 Siła powiązania między zmiennymi jakościowymiWspółczynnik kontyngencji Pearsona „C” Gdy zmienne są niezależne, wówczas C = 0. Jego maksymalna wartość jest zawsze mniejsza od 1 i zależy od liczby wierszy i kolumn Przykładowo dla tabeli 3  3 jego wartość wynosi 0,816. Ogranicza to zastosowanie C Pearsona do tablic kwadratowych

24 Istotność zmian danych jakościowychCzęsto dysponujemy dwiema tablicami częstości danych jakościowych: przed zajściem zdarzenia, które jak podejrzewamy mogło mieć istotny wpływ na rozkład częstości, i po jego nastąpieniu Możemy to zapisać w tabeli 2  2 w sposób następujący: Litery oznaczają: A – liczbę obiektów, u których po zdarzeniu doszło do zmiany wyniku z „+” na „-” D – liczbę obiektów, u których doszło do zmiany wyniku z „-” na „+” B i C – liczba obiektów u których nie stwierdzono zmiany wyniku Po oddziaływaniu Suma - + Przed oddziaływaniem A B A + B C D C + D A + C B + D N

25 Istotność zmian danych jakościowychDo oceny istotności zmian zestawionych w tabeli według podanego wzorca stosuje się test McNemara Schemat testu: H0: pod wpływem oddziaływania (zjawiska) nie doszło do zmian częstości wstępowania obiektów (osób) z cechą „+” H1: częstość występowania obiektów (osób) z cechą „+” uległa istotnej zmianie pod wpływem oddziaływania (zjawiska) Weryfikacja hipotezy. Do weryfikacji hipotezy stosujemy statystykę: Przy założeniu hipotezy zerowej statystyka ta ma w przybliżeniu rozkład 2 z jednym stopniem swobody

26 Istotność zmian danych jakościowych - przykładZ obszaru poletka eksperymentalnego pobrano 195 próbek gleby w celu określenia występowania pewnego gatunku szkodliwego nicienia atakującego korzenie buraka, i stwierdzono że był on obecny w 103 próbkach W sezonie wegetacyjnym na glebę aplikowano pestycyd, który jak przypuszczano powinien wpłynąć na ograniczenie populacji szkodnika Po sezonie w tych samych miejscach pobrano ponownie próby gleby i stwierdzono, że nicień występował w 47 z nich, z czego w 39 przypadkach był on w tym samym miejscu także poprzednio

27 Istotność zmian danych jakościowychPo zestawieniu danych w tabeli: Po oddziaływaniu Suma - + Przed oddziaływaniem 8 84 92 39 64 103 47 148 195 możemy dokonać obliczeń: Ponieważ 2 = 42,014 > 2 = 6,64 na poziomie istotności 0,01, stwierdzamy, że odrzucamy hipotezę zerową, a zatem stosowanie pestycydu miało istotny wpływ na ograniczenie populacji szkodliwego nicienia

28 Testy parametryczne vs. nieparametryczneUżycie testów parametrycznych jest ograniczone określonymi założeniami: zmienne mierzalne zmienne mające rozkład normalny, zmienne o zbliżonej zmienności (równej wariancji W przypadku niespełnienia ww. warunków wnioski uzyskane na podstawie testów parametrycznych nie są całkowicie poprawne lub tracą swoją wiarygodność Testy parametryczne są też bezużyteczne w przypadku danych jakościowych i danych uporządkowanych We wszystkich tych wypadkach stosujemy testy nieparametryczne

29 Testy nieparametryczneTesty nieparametryczne nie zależą od kształtu rozkładu zmiennej oraz od pewnych parametrów rozkładu populacji Wzory do ich obliczania są proste, a same obliczenia nie zajmują dużo czasu Stosujemy je we wszystkich wymienionych wyżej przypadkach ograniczających (wykluczających) użycie testów parametrycznych oraz do grup o małej liczebności (< 30) Moc testów nieparametrycznych jest jednak niższa niż moc testów parametrycznych, i dlatego stosujemy je tylko wtedy (!!!) kiedy nie powinniśmy stosować testów parametrycznych

30 Grupy testów nieparametrycznychTesty dla dwóch niezależnych próbek (odpowiedniki testu t- Studenta dla zmiennych niepowiązanych): test serii Walda- Wolfowitza, test U Manna-Whitneya, test Kołgomorowa- Smirnowa Testy dla dwóch zależnych próbek (nieparametryczne odpowiedniki testu t-Studenta dla zmiennych powiązanych): test znaków, test kolejności par Wilcoxona, test McNemara Testy dla n próbek (nieparametryczne odpowiedniki analizy wariancji): test Kruskala-Wallisa, test Friedmana, test Q Cochrana Korelacje nieparametryczne: R Spearmana, Tau Kendalla, test 2 Testy zgodności: test 2, test Kołmogorowa-Smirnowa

31 Typy testów nieparametrycznych

32 Testy losowości Weryfikują hipotezę, że dobór jednostek do próby był jednakowy

33 Test serii Stevensa 1. Ho: Dobór jednostek do próby jest losowyH1:Dobór jednostek do próby nie jest losowy 2. Procedura testowa: 2a. Wyznaczamy na podstawie uporządkowanych danych medianę 2b. Danym nieuporządkowanym przyporządkowujemy następujące oznaczenia: A gdy x B gdy x>Me 0 gdy x=Me (zera pomijamy w dalszej analizie) Statystyką testową jest liczba serii (k)

34 Test serii Stevensa cd. Seria – ciąg identycznych symboli (A lub B)np. AAAA B A BB k=4 AAA 0 A BBB 0 AA k=3

35 Test serii Stevensa cd. 3. Ustalamy poziom istotności4. Obszar krytyczny testu jest zawsze dwustronny. Odczytujemy z tablic rozkładu liczby serii wartości krytyczne Podejmujemy decyzję

36 Test serii Stevensa Przykład 1:Wylosowano 12 spółek i zbadano cenę ich akcji (w zł). Otrzymano następujące wyniki: 74,5 191,0 55,5 5,15 36,4 35,0 46,0 10,9 7,35 6, ,5 26,0. Czy dobór spółek do próby był losowy? Wysuniętą hipotezę zweryfikuj na poziomie istotności 0,05.

37 Test serii Stevensa Przykład 1: RozwiązanieHo: dobór jednostek do próby jest losowy H1:Dobór jednostek do próby nie jest losowy Wyznaczamy medianę: Poz. Me=(n+1)/2=6,5 Me=35,7 Danym pierwotnym przypisujemy litery A, B, 0 kolejnym obserwacjom

38 Test serii Stevensa Przykład 1: RozwiązanieObliczamy liczbę serii: k=8 Poziom istotności 0,05 Odczytujemy wartości krytyczne:

39 Test serii Stevensa Przykład 1: RozwiązaniePorównujemy wartość statystyki z próby z wartościami krytycznymi: 3 10 8 Brak podstaw do odrzucenia hipotezy zerowej, która mówi, że dobór jednostek do próby był losowy.

40 Test znaków dla prób zależnychJednym z najprostszych testów nieparametrycznych jest także test znaków Stanowi on nieparametryczną alternatywę testu t dla prób zależnych Najczęściej test stosowany jest wówczas, kiedy mierzymy jakąś cechę badanych obiektów dwukrotnie: „przed i po” Jedynym założeniem wymaganym do zastosowania tego testu jest przyjęcie, iż rozkład zmiennej w populacji z której pobrano próbę jest ciągły.

41 Test znaków – przykład 1 W kursie prowadzonym w szkole policyjnej uczestniczy 15 słuchaczy. Celem kursu jest podniesienie umiejętności prowadzenia przesłuchań i identyfikacji podejrzanych w trakcie śledztwa. Celem oceny efektywności kursu umiejętności uczestników poddano ocenie: raz przed jego rozpoczęciem, a drugi – po zakończeniu. Poziom umiejętności prowadzenia przesłuchań i identyfikacji podejrzanych w trakcie śledztwa był punktowany w skali od 1 do 100.

42 Test znaków – przykład 1 Słuchacz Ocena – p0 Ocena - przedZnak różnicy 1 93 76 + 2 70 72 - 3 81 75 4 65 68 5 79 6 54 brak różnicy 7 94 88 8 91 9 77 10 57 11 95 86 12 89 87 13 78 14 80 15 Znak różnicy otrzymuje się odejmując ocenę umiejętności słuchacza po wysłuchaniu kursu od oceny wystawionej przed kursem Jeśli różnica jest dodatnia zaznaczamy to znakiem „+”, jeśli ujemna – znakiem „-” Jeśli oceny są identyczne nie wprowadzamy żadnych oznaczeń; te wyniki nie są uwzględniane w teście Do przeprowadzenia testu znaków należy policzyć proporcję x znaków plus („+”) do wszystkich znaków. Pary w których nie było różnicy ignorujemy.

43 Test znaków – przykład 1 Ile jest w tabeli znaków „+”  10Ile jest w tabeli znaków „+” i „-”  12 Proporcja znaków „+” wynosi …

44 Test znaków – przykład 1 W proporcja znaków plus w próbce 15 słuchaczy kursu wynosi x; ta sama, nieznana, proporcja wśród całej populacji policjantów prowadzących śledztwa wynosi p Hipoteza zerowa testu H0: p = 0,5 (rozkłady wyników ocen umiejętności słuchaczy przed kursem i po jego wysłuchaniu są takie same) Hipoteza zerowa zakłada, że wysłuchanie kursu nie wpływa w sposób istotny na umiejętności prowadzenia przesłuchań i identyfikacji podejrzanych w trakcie śledztwa. W konsekwencji, oczekiwane liczby znaków plus i minus powinny być zbliżone. Oznacza to że proporcja znaków plus powinna być zbliżona do 0,5. Celem kursu było jednakże zwiększenie umiejętności słuchaczy. Dlatego też hipoteza alternatywna stanowi: H1: p > 0,5 (wyniki ocen umiejętności słuchaczy po kursie są wyższe niż przed jego rozpoczęciem)

45 Test znaków – przykład 1 Do przetestowania hipotezy zerowej H0: p = 0,5 względem hipotezy alternatywnej H1: p > 0,5 wykorzystywany jest test proporcji. Zakładamy, że liczebność próby jest dostatecznie duża żeby można zastosować przybliżenie rozkładu dwumianowego rozkładem normalnym. W zastosowaniach praktycznych można takie założenie przyjąć, jeśli suma wszystkich znaków plus i minus jest większa lub równa 12 (n  12) Jeśli całkowita suma znaków plus i minus jest większa lub równa 12, to wówczas statystyka x z próby (proporcja znaków plus) ma rozkład w przybliżeniu normalny, ze średnią równą p i odchyleniem standardowym wynoszącym

46 Test znaków – przykład 1 Zakładając prawdziwość hipotezy H0: p = 0,5 uznajemy, że proporcja p znaków plus wynosi 0,5. Dlatego też wartość z odpowiadająca statystyce x z próby wynosi: gdzie n to sumaryczna liczba znaków plus i minus, a x to suma plusów podzielona przez n. Dla przykładu słuchaczy kursu policyjnego stwierdzono, że x  0,833, a n wynosi 12. Wartość z odpowiadająca x = 0,833 wynosi zatem:

47 Test znaków – przykład 1 Do znalezienia wartości P testu znaków wykorzystujemy tablicę standaryzowanego rozkładu normalnego. Ponieważ wykonujemy test jednostronny, a konkretnie prawostronny wartością P jest powierzchnia pod krzywą na prawo wyliczonej statystyki testowej z = 2,31 . Wartość P dla statystyki testowej z próby z wynoszącej 2,31 została przedstawiona na rycinie obok. P(z > 2,31) = 0,0104

48 Test znaków – przykład 1 Organizator kursu założył 5% poziom istotności testu oceniającego skuteczność szkolenia. Ponieważ wartość P wynosząca 0,0104 jest mniejsza niż  = 0,05 musimy odrzucić hipotezę H0, że szkolenie nie zmienia umiejętności policjantów do prowadzenia przesłuchań i identyfikacji podejrzanych. Zamiast tego, na 5% poziomie istotności stwierdzamy istotność różnic.

49 Test sumy rang (test Manna-Whitneya)Test znaków może być użyty jedynie wtedy jeśli dysponujemy parami wartości pochodzących z zależnych prób (najczęściej sytuacje „przed i po”) W sytuacjach kiedy dokonujemy poboru niezależnych prób losowych z dwóch populacji, musimy do testowania istotności różnic pomiędzy średnimi prób, skorzystać z innej metody nieparametrycznej . Metoda ta nazywa się testem sum rang – popularnie zwana jest także testem Manna-Whitneya. Test ten może być użyty wówczas kiedy nie jesteśmy w stanie zweryfikować założenia, że próby zostały pobrane z populacji posiadających rozkład normalny

50 Test sumy rang - przykładW trakcie głębokiego nurkowania z użyciem akwalungu w wyniku podwyższonego ciśnienia dochodzi do rozpuszczania we krwi azotu. Po powrocie na powierzchnię nurek musi przejść czasochłonną procedurę dekompresji, czekając w specjalnej komorze na moment, w którym poziom azotu we krwi spadnie do normalnego. Fizjologowie opiekujący się grupą nurków Marynarki Wojennej opracowali lek, który podany godzinę przed nurkowaniem, skraca czas potrzebny na dekompresję. Do testowania skuteczności leku zgłosiło się 23 nurków. Podzielono ich na dwie grupy. Pierwszej, liczącej 11 osób, podawano lek, drugiej – 12 osobowej – placebo. Obie grupy pracowały na tej samej głębokości, wykonując zbliżone zadania i przebywały w wodzie tak samo długo. Po powrocie na powierzchnię u każdego nurka zmierzono czas spadku stężenia N we krwi do normalnego poziomu.

51 Test sumy rang - przykładTab. Czas dekompresji 23 nurków Marynarki Wojennej w minutach Grupa A: lek 41 56 64 42 50 70 44 57 63 65 52 Średni czas = 54,91 min Grupa B: placebo 66 43 72 62 55 80 74 75 77 78 47 60 Średni czas = 65,75 min Średnie czasy dekompresji w badanych grupach wynosiły 54,91 min. dla biorących lek i 65,75 min. dla zażywających placebo Do oceny czy różnice te są istotne statystycznie zostanie test sumy rang. Pierwszym etapem procedury jest połączenie obu prób w porządku według rosnącego czasu dekompresji i przypisanie kolejnym wartościom numeru porządkowego czyli rangi. Tak uporządkowane dane zawierające czasy dekompresji, oznaczenia grup i rangi zestawiono w tabeli.

52 Test sumy rang - przykładTab. Szereg rosnących czasów dekompresji z rangami. Czas Grupa Ranga 41 A 1 63 13 42 2 64 14 43 B 3 65 15 44 4 66 16 47 5 70 17 50 6 72 18 52 7 74 19 55 8 75 20 56 9 77 21 57 10 78 22 60 11 80 23 62 12

53 Test sumy rang - przykładDrugim etapem jest obliczenie sumy rang R dla obiektów należących do próby o mniejszej liczebności. Grupa A składała się z 11 nurków, a grupa B z 12. Zatem próbą o mniejszej liczebności jest grupa A. Suma rang dla A oznaczona jako R wynosi: R = = 98 Niech n1 oznacza liczebność próby mniejszej, a n2 – próby większej. W podanym przykładzie n1 = 11 a n2 = 12. R jest sumą rang obiektów należących do mniejszej próby. Jeśli obie próby mają tą samą liczebność to wtedy oczywiście n1 = n2 a R może być sumą rang dowolnej z nich (ale nie obu). Kiedy zarówno n1 jak i n2 są dostatecznie duże (każdy większy niż 10) wiadomo że R ma w przybliżeniu rozkład normalny ze średnią i odchyleniem standardowym równymi:

54 Test sumy rang - przykładW analizowanym problemie, dotyczącym skuteczności leku zmniejszającego czas dekompresji obliczenia R i R dały następujące wyniki: Ponieważ n1 = 11 a n2 = 12, to znaczy analizowane próby są dostatecznie duże, aby założenie o możliwości aproksymacji R rozkładem normalnym mogło zostać przyjęte. Można zatem, przy użyciu poniższego wzoru, obliczyć statystykę z z próby:

55 Test sumy rang - przykładUżywając testu sumy rang hipoteza zerowa zakłada, że analizowane rozkłady są identyczne, podczas gdy hipoteza alternatywna stwierdza, że się między sobą różnią. Hipotezy mają zostać zweryfikowane na poziomie istotności  = 0,05 (5%) Do znalezienia wartości P odpowiadającej z = - 2,09 wykorzystujemy tablicę standaryzowanego rozkładu normalnego i ustalenie, że wykonujemy test dwustronny. Powierzchnia pod krzywą rozkładu normalnego na lewo od wartości -2,09 wynosi 0,0183. W sytuacji testu dwustronnego mamy zatem wartość P wynoszącą 2 ∙ 0,0183 = 0,0366 Ponieważ wartość P jest mniejsza od  = 0,05, zatem odrzucamy hipotezę H0. Na poziomie istotności 5% posiadamy dostateczne dowody, że zażywanie leku zmienia (de facto zmniejsza) czas potrzebny na dekompresję nurka.

56 Test sumy rang Jak postępujemy, kiedy w analizowanych danych występują identyczne wartości, a zatem i rangi są identyczne? Identycznym wartościom nadajemy średnie rangi!