1 Zofia Hanusz i Joanna Tarasińska Uniwersytet Przyrodniczy w LubliniePorównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym Zofia Hanusz i Joanna Tarasińska Uniwersytet Przyrodniczy w Lublinie WISŁA 2010
2 Testy do badania p - wymiarowej normalnościp=2 (T. Ledwina, T. Inglot, M. Bogdan) p2 Metody analityczne: - uogólniające test Shapiro-Wilka (Srivastava, Royston, Srivastava & Hui), uogólniające testy oparte na kurtozie i skośności (Mardia, Small, Malkovich, Afifi) oparte na funkcji charakterystycznej (Arcones) Metody graficzne: Q-Q P-P
3 Tematyka badań Propozycja testu do badania wielowymiarowej normalności, opartego na teście Shapiro-Wilka Rozważenie wielowymiarowego liniowego modelu obserwacji Porównanie testu z dwoma innymi testami także opartymi na teście Shapiro-Wilka zaproponowanymi przez Srivastavę i Hui Porównanie poziomu istotności i mocy powyższych testów z testem Henze-Zirklera
4 Model H0: reszty Poziom istotności MocMPII(0) – jednostajny na elipsie MPVII(2) – wielowymiarowy t Mieszanina rozkładów normalnych
5 Test Shapiro-Wilka - niezależne zmienne losowe o tym samym rozkładzieStatystyka Shapiro-Wilka (Shapiro, Wilk, 1965) : Wartości z tablic - wartości uporządkowane
6 Shapiro i Wilk (1968) zaproponowali przekształcenieg, d, e – stałe z tablic zależne od n. Małe wartości statystyki wskazują brak normalności zmiennych.
7 Adaptacja statystyki G(W) do zmiennych wielowymiarowychSrivastava i Hui (1987) zaproponowali uogólnienie testu Shapiro – Wilka, wykorzystując składowe główne.
8 W(i) są asymptotycznie niezależneNiech W(i) są asymptotycznie niezależne Srivastava i Hui (1987) do testowania H0 zaproponowali Duże wartości M1 świadczą o braku normalności.
9 Srivastava i Hui (1987) zaproponowali także statystykęktóra przy prawdziwości hipotezy H0 ma przybliżony rozkład: Test odrzuca normalność dla małych M2 .
10 Nasza propozycja: Gi są asymptotycznie niezależneLewy „ogon” rozkładu normalnego standardowego wskazuje na brak normalności.
11 Rozbieżności
12 ai z Tablicy Shapiro-Wilka ai według Roystona
13 MPII(0) – jednostajny na elipsieai według Roystona ai z Tablicy Shapiro-Wilka
14 ai z Tablicy Shapiro-Wilkaai według Roystona ai z Tablicy Shapiro-Wilka
15 MPVII – wielowymiarowy tai według Roystona ai z Tablicy Shapiro-Wilka
16 ai z Tablicy Shapiro-Wilkaai według Roystona ai z Tablicy Shapiro-Wilka
17 Mieszanina rozkładów normalnychai według Roystona ai z Tablicy Shapiro-Wilka
18 ai z Tablicy Shapiro-Wilkaai według Roystona ai z Tablicy Shapiro-Wilka
19
20 Empiryczny poziom istotności dla różnych liczebności (a=0,05)
21 Moc dla różnych liczebności (a=0,05)MPII MPVII Mieszanina
22 Wnioski − Test Henze-Zirklera najlepiej zachowuje poziom istotnościW testach bazujących na wartościach obliczanych według Roystona (1992), test Henze-Zirklera okazał się lepszy od trzech pozostałych dla MPII i MPVII Dla MPII test oparty na średniej statystyk G(W) wykazywał się wyższą mocą niż M1 i M2 Małą moc wszystkich testów uzyskano dla mieszaniny rozkładów normalnym dla danych o niskiej korelacji
23 Literatura Hanusz Z., Tarasińska J. (2009). Simulation study for a test of multivariate normality based on Shapiro-Wilk’s statistic. Colloquium Biometricum 39, Johnson M.E.(1987). Multivariate Statistical Simulation, J. Wiley and Sons. Royston P. (1992). Approximation the Shapiro-Wilk W- test for non-normality, Statistics and Computing 2, Shapiro S.S., Wilk M.B. (1965). An analysis of variance test for normality (complete samples). Biometrika 52, Shapiro S.S., Wilk M.B. (1968). Approximations for the null distribution of the W statistic. Technometrics 10, Srivastava M.S., Hui T.K. (1987). On assessing multivariate normality based on Shapiro-Wilk W statistic. Statistics & Probability Letters 5,