1 Wielowymiarowa analiza danych oparta na modelach gradacyjnychZ implementacją w programie GradeStat1 E. Pleszczyńska, E. Jarochowska, W. Szczesny Instytut Podstaw Informatyki PAN Artykuł częściowo finansowany z projektu badawczego nr 3T11CO5328 przyznanego przez Ministerstwo Nauki i Informatyzacji
2 We point out that models based on probability theory, and the statistical techniques derived from them, have limited applicability, at least in exploratory multivariate situations. Jan de Leeuw
3 Plan referatu Czym jest Gradacyjna Analiza Danych?Przykład analizy – dane ekonomiczno-gospodarcze Wykrywanie elementów odstających Odwracanie zwrotu zmiennych Schematy gradacyjnego przetwarzania danych w teraźniejszości i przyszłości
4 Gradacyjna Analiza DanychParom rozkładów przyporządkowuje się zmienną „lilipucią” reprezentującą koncentrację jednego rozkładu względem drugiego Para rozkładów Krzywa koncentracji
5 Implementacja w GradeStatGCA (ang. grade correspondence analysis) Analiza skupień (GCCA) Wykrywanie elementów odstających Wizualizacja: mapy nadreprezentacji
6
7 Przykład analizy gradacyjnejDane Europejskiego Biura Statystycznego 25 krajów UE Zmienne ekonomiczne mierzone na różnych skalach absolutnych: dzietność, zużycie energii, inflacja, przewidywana dlugość życia etc.
8 Macierz danych
9 Mapa nadreprezentacji po GCA
10 Mapy odstępstw od regularnościPrzed odwróceniem zwrotu zmiennych Po odwróceniu zwrotu zmiennych 11, 12, 13 i 14
11 Mapy wskaźników korelacjiPrzed odwróceniem zwrotu zmiennych Po odwróceniu zwrotu zmiennych 11, 12, 13, 14
12 Krzywe koncentracji
13 Schematy gradacyjnego przetwarzania danychDla pary zmiennych: Pomiar asymetrii, spłaszczenia i nierówności Krzywa koncentracji Krzywa maks. koncentracji Dla tablicy m×k: HGCA. Pomiar asymetrii, spłaszczenia i nierówności. Powierzchnia koncentracji Powierzchnia maks. koncentracji
14 Literatura Kowalczyk T., Pleszczyńska E., Ruland F. (red.), Grade Models and Methods for Data Analysis with Applications for the Analysis of Data Populations. Berlin, Springer-Verlag, 2004. Książyk J., Matyja O., Pleszczyńska E., Wiech M. (red.), Analiza danych medycznych i demograficznych przy użyciu programu GradeStat, Warszawa, IPI PAN i Instytut „Pomnik – Centrum Zdrowia Dziecka”, 2005.
15 http://gradestat.ipipan.waw.pl Zapraszamy na stronę programu:GradeStat do pobrania Samouczek programu Przykłady zastosowania