1 Testy nieparametrycznedr hab. Dariusz Piwczyński
2 Ograniczenia testów parametrycznychTestów parametrycznych nie stosujemy, gdy zmienne mają charakter jakościowy czy też uporządkowany.
3 Zastosowanie testów nieparametrycznychTesty nieparametryczne wykorzystujemy w sytuacji, gdy nie są spełnione założenia wymagane przez testy parametryczne, jak: zmienne mierzalne, posiadające rozkład zgodny normalnym. Stosujemy, gdy transformacja danych nie przynosi efektów, np. w zakresie normalizacji rozkładu.
4 Testy nieparametryczne a rozkład zmiennejTesty nieparametryczne nie zależą od rozkładu zmiennej, od pewnych parametrów rozkładu populacji. Na ogół obliczenia są proste i nie zajmują wiele czasu.
5 Analiza rang Testy nieparametryczne pod względem rachunkowym oparte są na analizie rang (lokat). Dane w porównywanych grupach porządkujemy rosnąco lub malejąco. Rachunki matematyczne wykonujemy na rangach.
6 Moc testów Niestety, siła testów nieparametrycznych (1-β) jest niższa niż siła testów parametrycznych –testy nieparametryczne stosujemy tylko wtedy, gdy nie są spełnione założenia, jakich wymagają testy parametryczne. W odniesieniu do dużych populacji n > 100 zamiast testów nieparametrycznych możemy stosować testy parametryczne, mimo że sama zmienna nie posiada rozkładu normalnego. Jest to możliwe ze względu na fakt, że rozkład średnich z tych prób ulega normalizacji.
7 Statystyczna analiza
8 Statystyczna analiza
9 Statystyka opisowa Średnia geometryczna Mediana Dominanta RozstępOdstęp międzykwartylowy
10 Porównania grup – dobór testu
11 Doświadczenie niezależne – 2 grupyTest U Mann-Whitney Test ten jest najmocniejszą nieparametryczną alternatywą dla testu t. Założenia testu: cecha posiada rozkład typu ciągłego, ale może być rozpatrywana również w skali porządkowej.
12 Test U Mann-Whitney Porównujemy poziom ocenianych wskaźników ścieków zmierzony w czasie zimy i wiosny. Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT stwierdzony zimą i wiosną jest taki sam: H0: F(x) = G(x); H1: F(x) ≠ G(x) F(x), G(x) – dystrybuanta ChZT zimą i wiosną
13 Test U – porównujemy pory rokuPorządkujemy rosnąco dane obydwu grup. Poczynając od wartości najmniejszej przypisujemy im rangi.
14 Rangi wiązane Rangi wiązane to sytuacja, w której sąsiednie, uporządkowane wcześniej wartości zmiennej są takie same.
15 Rangi wiązane W tej sytuacji przyporządkowujemy im tzw. rangi wiązane, które powstają w wyniku obliczenia średnie arytmetycznej z numerów nadawanych kolejnym powtórzeniom tej samej wartości. (8 + 9)/2 = 8,5
16 Kolejność obliczeń Ustalamy liczebności porówny-wanych grupObliczamy sumę rang dla obydwu grup: R1 i R2. Ustalamy liczebności porówny-wanych grup
17 Wzór R1, R2 – suma rang przyznanych 1 i 2 grupie;n1, n2 – liczebność grupy 1 i 2.
18 Wzór R1, R2 – suma rang przyznanych 1 i 2 grupie;n1, n2 – liczebność grupy 1 i 2.
19 Wartości krytyczne Obliczone wartości U i Z porównujemy z odpowiednimi wartościami krytycznymi z tabel statystycznych.
20 Wyniki U = 92 z = -2,897 |-2,897| porównujemy z wartością u/2=1,96 (=0,05) Ze względu na fakt, iż obliczona wartość z jest większa niż 1,96, odrzucamy hipotezę zerową. Wnioskujemy zatem, że poziom CHZT zmierzony zimą różni się statystycznie od poziomu zarejestrowanego wiosną. Otrzymany wynik jest również większy niż u/2 odczytane przy =0,01. Wnioskujemy zatem, że między badanymi grupami różnica jest wysoko istotna.
21 Test U n1 i n2 > 20
22 SAS EG, Test U Mann Whitney
23 SAS EG, Test U Mann Whitney
24 SAS EG, U Mann Whitney, WYNIKI
25 Doświadczenie niezależne, k > 2Test Kruskal-Wallis Test mediany
26 Kruskal-Wallis Weryfikujemy hipotezę zerową zakładającą, iż rozkład ChZT w k populacjach jest taki sam: H0: F1(x) = F2(x) =... = Fk(x) H1: F1(x) ≠ F2(x) ≠ ...≠ Fk(x) F1(x), F2(x), Fk(x) – dystrybuanty rozpatrywanych populacji. Program SAS: Kruskal-Wallis Test Chi-kwadrat Stopień swobody Pr > Chi-kwadrat Wartość testu Kruskal-Wallis wynosi 8,4354. Obliczone prawdopodobieństwo (p < 0,0147) pozwala odrzucić H0. Wyniki analizy pozwalają stwierdzić, że pora roku wpływa statystycznie istotnie na poziom badanego wskaźnika.
27 Kruskal-Wallis n = n1 + n2 + … + nk – liczebność poszczególnych grup;Ti (i = 1, 2, … k) – suma rang w każdej grupie oddzielnie
28 Test mediany Test mediany jest mniej dokładną wersją K-W. Obliczenia wykonywane są w oparciu o tablicę kontyngencji 2. H0 : mediany są takie same w obu próbach, czyli około połowy wszystkich przypadkach w każdej z grup przypada powyżej, a druga poniżej wspólnej mediany. H1 : mediany nie są takie same.
29 SAS EG, test K-W i mediany
30 SAS EG, test K-W
31 SAS EG, test mediany
32 Statistica, test K-W i mediany
33 Doświadczenie zależne, k =2Test kolejności par Wilcoxona Test znaków
34 Test znaków Test znaków jest nieparametrycznym odpowiednikiem testu t dla zmiennych zależnych. W teście tym brane jest pod uwagę ile razy wartości pierwszej zmiennej przewyższają wartości drugiej zmiennej i odwrotnie.
35 Test kolejności par Wilcoxona
36 Doświadczenia dwugrupowe zależne w SASW SAS konieczne jest wcześniejsze przygotowanie kolumny będącej różnicą jednej i drugiej serii danych!
37 SAS EG, Test znaków i kolejności par Wilcoxona
38 SAS EG, Test znaków i kolejności par Wilcoxona
39 SAS EG, Test znaków i kolejności par Wilcoxonatest kolejności par Wilcoxona
40 Doświadczenia zależne, k > 2Test Friedmana
41 Test Friedmana
42 Test Friedmana
43 Test Friedmana