1 Analiza przeżycia
2 Analiza przeżycia Czym zajmuje się analiza przeżycia?Jest to analiza czasu trwania, zaprojektowana do analizy tzw. danych uciętych Obserwacja jest nazywana uciętą jeżeli zdarzenie jeszcze nie nastąpiło i nie mamy wiedzy czy nastąpi czy też nie
3 Analiza przeżycia Jest to inaczej analiza czasu trwaniaDefiniujemy dwa zdarzenia: pierwsze musi nastąpić wcześniej niż drugie np. narodziny i śmierć każde może nastąpić tylko raz (np. śmierć) lub za moment kończący przeżycie przyjmujemy pierwsze wystąpienie zdarzenia (np. przerzut nowotworu) Zmienną losową jest czas jaki upływa pomiędzy zdarzeniami
4 Analiza przeżycia Cechą charakterystyczną danych jest występowanie obserwacji: uciętych – obiektów u których zdarzenie nie nastąpiło w analizowanym czasie, w związku z tym nie mamy pełnej informacji Np. zgon nie nastąpił lub nastąpił z innych przyczyn kompletnych – obiektów u których zdarzenie nastąpiło Konieczne jest precyzyjne zdefiniowanie tzw. Punktu końcowego czyli zdarzenia kończącego przeżycie
5 Cenzurowanie Przykład: Badamy czas życia pacjenta po przeszczepieBrak cenzurowania: Znana jest data przeszczepu i data śmierci pacjenta Cenzurowanie prawostronne: Znana jest data przeszczepu, ale chory pozostaje przy życiu do zakończenia badania Cenzurowanie lewostronne: Nie jest znany czas operacji przeszczepu A B C Czas trwania badania Czas
6 Tablice trwania życia Jest jedną z najstarszych metod analizy danych dotyczących przeżycia Rozkład czasu życia dzielimy na pewną liczbę przedziałów Dla każdego przedziału możemy wyliczyć liczbę i proporcję przypadków lub obiektów, które: weszły do danego przedziału żywe wymarły w danym przedziale utraconych lub uciętych w danym przedziale Stosowane powszechnie w demografii. W statystyce medycznej używana jest funkcja przeżycia.
7 Funkcja przeżycia, a funkcja ryzykaFunkcja przeżycia - podaje prawdopodobieństwo, że osoba przeżyje dłużej niż pewien przyjęty czas t czyli dożyła co najmniej do czasu t Przewaga metody nad tablicą trwania życia to brak grupowania danych w przedziały Funkcja hazardu (ryzyka) - przeciwnie do funkcji przeżycia skupia się na wystąpieniu niekorzystnego zdarzenia. Wartość funkcji hazardu w momencie t traktujemy jako chwilowy potencjał pojawiającego się zdarzenia pod warunkiem, że osoba dożyła do czasu t
8 Dane do analizy przeżyciaCzas przeżycia Zmienna wskaźnikowa 2 10 1 50 90 stan pacjenta na końcu okresu przeżycia 0 – zdarzenie kończące przeżycie nie nastąpiło (informacja ucięta) 1 – zdarzenie kończące przeżycie nastąpiło (informacja kompletna) Czas przeżycia w jednostkach (latach, miesiącach, dniach,…)
9 Analiza przeżycia w R Funkcja Surv: Tworzy obiekt klasy survivalArgumenty: Wektor czasu Wektor wartości logicznych lub identyfikatorów określający, które pomiary są cenzurowane Obiekty cenzurowane, czyli takie dla których informacja nie jest kompletna (zdarzenie nie wystąpiło = 0) zaznaczone są plusem
10 Analiza przeżycia w R Dane: Surv(nowa) Obiekt klasy Surv()
11 Estymator Kaplana-MeieraJest jednym z estymatorów dystrybuanty funkcji przeżycia Pozwala na przedstawienie graficzne krzywej przeżycia oraz porównanie tej krzywej dla różnych grup wyróżnionych zmienną jakościową Polega na mnożeniu prawdopodobieństw warunkowych przeżycia wg wzoru: Gdzie: – symbol iloczynu di – liczba zdarzeń (zgonów) w okresie ti ni – liczba narażonych w okresie
12 Estymator Kaplana-MeieraFunkcja survfit() surv_dane = Surv(dane) model = survfit(surv_dane~1) Obiekt klasy Surv Może wskazywać na zmienną jakościową, wtedy krzywa przeżycia będzie wyznaczona dla każdego poziomu danej zmiennej np. model = survfit(surv_dane~plec) Obiekt klasy survfit, dla którego dostępne są funkcje: summary() – wartości krzywej przeżycia we wskazanych punktach określonych argumentem times plot() – rysuje krzywą przeżycia
13 Analiza przeżycia w R Model Gdzie: - symbol iloczynudi – liczba zdarzeń (zgonów) w okresie ti ni – liczba narażonych w okresie tj
14 Analiza przeżycia w R Obliczenia:
15 Estymator Kaplana-MeieraPrzykład liczenia estymatora Kaplana-Meiera Źródło: M. Stevenson, I. EpiCentre. An Introduction to Survival Analysis. 2007 za Urbaniec A Analiza przeżycia, teoria i przykład zastosowania w badaniu długości życia pacjentek z rakiem piersi
16 Analiza przeżycia w R Krzywa przeżycia Kaplana Meyera wraz z przedziałem ufności 95% przedział ufności Funkcja przeżycia
17 Analiza przeżycia w R Analiza przeżycia w rozbiciu na poziomy zmiennej jakościowej
18 Model proporcjonalnego hazardu coxaPojęcie hazardu proporcjonalnego wprowadził w 1972 David Cox Pozwala na opisanie krzywej przeżycia (funkcji hazardu) za pomocą zmiennych objaśniających jakościowych i ilościowych Funkcja hazardu zadana jest wzorem: f(t) – funkcja przeżycia (funkcja gęstości) P(t) – dystrybuanta przeżycia Interpretacja hazardu (ryzyka) w chwili t: Prawdopodobieństwo przeżycia w chwili t pod warunkiem dożycia do tej chwili. Jest to równe ryzyku śmierci na jakie narażone są osoby, które dożyły do chwili t
19 Model proporcjonalnego hazardu coxaCechy charakterystyczne modelu: Założenie proporcjonalności: zakładamy, że stosunek ryzyk dla dwóch przypadków nie zależy od czasu, a interpretacja parametrów modelu oparta jest na zmianach hazardu pod wpływem zmian wartości predykatorów Istnieje log-liniowa zależność między zmiennymi niezależnymi, a funkcją hazardu Wyraz wolny nie jest estymowany Brak założonej postaci dla funkcji przeżycia pozwala na szerokie stosowanie metody
20 Przykład Prawdopodobieństwo przeżycia 100 lat w populacji Europy zachodniej jest niewielkie, ale większe od prawdopodobieństwa przeżycia 110 lat S(100 lat) > S(110 lat) Ryzyko śmierci (umieralność opisana funkcją hazardu) jest podobne dla 100 latków oraz 110 latków h(100 lat) h(110 lat)
21 Model proporcjonalnego hazardu CoxaWymaga weryfikacji założeń modelu: Istotność statystyczna poszczególnych zmiennych w modelu (istotność ilorazu szans) – test Walda Jakość zbudowanego modelu AIC oraz BIC Pseudo R2 – wartości od 0 do 1 łatwa interpretacja, wrażliwy na ilość zmiennych modelu Założenie proporcjonalności hazardu - sprawdzamy poprzez analizę reszt, najczęstsze są metody graficzne
22 Model coxa w R exp(coef) – iloraz hazardu: HR = 1: Brak efektuHR < 1: Obniżenie ryzyka HR > 1: Wzrost ryzyka
23 Weryfikacja założeń Brak symetrycznego wzoru reszt oznacza spełnienie założeń proporcjonalności dla badanej zmiennej Reszty Schönfelda - Dla każdej zmiennej niezależnej suma reszt Schoenfeld'a i ich wartość oczekiwana to 0
24 Źródła Sokołowski A Jak rozumieć i wykonać analizę przeżycia. Materiały StatSoft Polska. Biecek P Przewodnik po pakiecie R. Oficyna wydawnicza GIS. Harańczyk G Model proporcjonalnego hazardu coxa. Materiały StatSoft Polska. Strona internetowa:
25 Dziękuję za uwagę