Dr Wioleta Drobik-Czwarno

1 Dr Wioleta Drobik-CzwarnoWykład 1 ...
Author: Zuzanna Kowalska
0 downloads 3 Views

1 Dr Wioleta Drobik-CzwarnoWykład 1

2 Sprawy organizacyjne Konsultacje: czwartek 12-14, pokój 33, Katedra Genetyki Wykład – 30 h (15 x 2 h w tygodniu) Ćwiczenia – 15 h (od listopada) Zaliczenie przedmiotu: Wykłady - Egzamin % Ćwiczenia - Projekt i jego prezentacja - 60 % implementacja wybranego modelu za pomocą skryptu opracowanie wybranego zagadnienia z wykorzystaniem udostępnionych danych i analiza statystyczna

3 Tematyka wykładów i ćwiczeńModele matematyczne dla przykładowych zjawisk ekologicznych, ewolucyjnych, demograficznych, epidemiologicznych oraz zakres ich stosowania Narzędzia do modelowania i ocena jakości wyników: Środowisko R, podstawy programowania Statystyka: regresja, analiza wariancji, testy nieparametryczne Techniki prezentowania wyników naukowych

4 Dlaczego biomatematyka?

5 Dlaczego biomatematyka?

6 Zastosowanie modeli matematycznych w naukach biologicznychŚwiat opiera się na szeregu nie liniowych, dynamicznych procesów – do ich opisu wykorzystujemy matematykę Jaka będzie liczebność populacji ludzkiej w przyszłości? (demografia, ekologia) Jak rozprzestrzeniają się choroby zakaźne? (epidemiologia) Jak działają mięśnie? (fizjologia) Jaka jest zależność pomiędzy stężeniem glukozy, a insuliny? (medycyna) Dlaczego zebra ma paski, a lampart cętki? (wzory w przyrodzie) Jak działa mózg? (neurologia) Jak przebiega rozwój zarodkowy? (embriologia) Jaką strukturę genetyczną będzie miała populacja w przyszłości? (genetyka)

7 Rozwój Populacji

8 Rozwój Populacji W jakim stopniu populacja rysia zależy od populacji zającowatych?

9 Wzory w przyrodzie W latach 50-tych XX wieku Alan Turing zaproponował jak wykorzystać matematykę do studiowania wzorów pojawiających się w przyrodzie W latach 80-tych XX wieku teoria ta została rozwinięta przez Jamesa Murraya Równania matematyczne opisujące powstawanie wzorów Program komputerowy, który rozwiązywał równania Wykorzystanie grafiki komputerowej Fraktale Struktury w których dowolnie mały fragment wygląda jak fragment powiększony

10 Wzrost nowotworów Modele matematyczne są wykorzystywane do przewidywania wzrostu nowotworów oraz skuteczności terapii (Benzekry i wsp., 2014)

11 Epidemiologia S → I → R S = s(t) – liczba osobników podatnychI = i(t) – osobniki zainfekowane (chorują i roznoszą infekcje) R = r(t) – liczba osobników ozdrowiałych (wyzdrowieli i nabyli odporność)

12 Genetyka populacji Prawo Hardy’ego i Weinberga pozwala wyznaczyć frekwencję genotypów na podstawie frekwencji alleli

13 Co to jest Model? Reprezentacja badanego zjawiska, czyli substytut rzeczywistości, celowo uproszczony, potraktowany wycinkowo z pominięciem szczegółów i cech nieistotnych

14 Model matematyczny Opis rzeczywistości w języku matematyki i logiki formalnej, który składa się z: Symboli, parametrów Relacji matematycznych Zasad operowania powyższymi

15 Model matematyczny Dwuskładnikowa struktura modeluTeoretyczny opis danego zjawiska na podstawie bieżącej wiedzy Struktura matematyczna Niezbędne składniki: Zbiór parametrów modelu Wartości wyznaczane na podstawie eksperymentów i obserwacji Zbiór zmiennych niewiadomych, których wartości są wyznaczane przez model

16 Dlaczego matematyka? Matematyka jest precyzyjna – wymaga formułowania koncepcji oraz założeń w jednoznaczny sposób Matematyka jest zwięzła – jedno równanie mówi więcej niż 1000 słów Matematyka jest uniwersalna – te same techniki mogą być zastosowanie na różnych skalach Matematyka jest dojrzałą dziedziną, ale cały czas aktualną – szeroki zestaw narzędzi był opracowywany przez stulecia Matematyka jest językiem dobrze zrozumiałym dla komputerów

17 Do czego potrzebny jest Model?Eksperymenty są często skoncentrowane na jednym aspekcie większej całości Nasze zrozumienie zjawiska jest fragmentaryczne Trudno jest zaobserwować jak działa cały system

18 Do czego potrzebny jest Model?Eksperymenty są często skoncentrowane na jednym aspekcie większej całości Nasze zrozumienie zjawiska jest fragmentaryczne Trudno jest zaobserwować jak działa cały system

19 Do czego potrzebny jest Model?Bardzo często cechy, które możemy obserwować i mierzyć nie są tymi najbardziej informatywnymi

20 Do czego potrzebny jest Model?Bardzo często cechy, które możemy obserwować i mierzyć nie są tymi najbardziej informatywnymi Grafika: „Mały książe” Antoine de Saint-Exupéry

21 Do czego potrzebny jest Model?Daje możliwość weryfikacji czy prawidłowo interpretujemy procesy zachodzące w przyrodzie Umożliwia poznanie struktury skomplikowanych systemów biologicznych oraz interakcji pomiędzy ich poszczególnymi elementami Modele pełnią istotną rolę w praktyce poprzez: Umożliwienie zrozumienia uwarunkowań skomplikowanych zjawisk Przewidywanie przyszłości Przewidywanie skutków naszej interwencji

22 Do czego potrzebny jest Model?Umożliwia połączenie fragmentarycznych informacji w jeden zrozumiały system na przykład połączenie wyników eksperymentów in-vivo i in-vitro Jak jest związek pomiędzy uwarunkowaniami biologicznymi, genetyką a obserowanymi cechami? Umożliwia testowanie hipotez, które są trudne do przetestowania empirycznie Umożliwia predykcję oraz generowanie nowych hipotez badawczych do dalszych eksperymentów

23 Nawet najlepszy model jest tylko przybliżeniem rzeczywistościModel matematyczny Największe wyzwanie … wyodrębnienie jedynie najważniejszych elementów z bardzo złożonego układu rzeczywistego Nawet najlepszy model jest tylko przybliżeniem rzeczywistości Nie ma i nie może być jednego, idealnego modelu dla danego fragmentu rzeczywistości Wpływ na to w jakim stopniu model oddaje rzeczywistość ma przede wszystkim: Niepewność parametrów Niepewność warunków brzegowych Problemy związane ze skalą czasową lub przestrzenną

24 Ograniczenia modelowania matematycznegoBrak szczegółowej wiedzy ilościowej na temat zjawiska Brak dostępnych danych / metod umożliwiających oszacowanie parametrów Jak uwzględnić losowość pojawiającą się w układach biologicznych?

25 Proces modelowania ma charakter iteracyjny i multidyscyplinarnyJak powstaje Model matematyczny Dane uzyskane na podstawie modelu Dane eksperymentalne Rozwiązanie i weryfikacja modelu Problem badawczy Helen M. Byrne (2010), Nature Reviews Cancer Sformułowanie modelu matematycznego Proces modelowania ma charakter iteracyjny i multidyscyplinarny

26 Jak powstaje Model matematycznyNajważniejsze kroki: Budowa modelu Predykcja oraz analiza Walidacja Aplikacja Podobne kropi podejmowane są przy planowaniu eksperymentów: Zaplanowanie eksperymentu Wygenerowanie danych Analiza wygenerowanych danych Walidacja odkryć Aplikacja w praktyce

27 Krok 1: Budowanie modeluPrecyzyjne zdefiniowanie celów jakim służyć ma model Co chcemy osiągnąć? Wybranie najważniejszych składowych Jak duże uproszczenie jest konieczne? Brzytwa Ockhama – w wyjaśnieniu zjawisk należy dążyć do prostoty. Wybieramy takie wyjaśnienie, które opiera się na jak najmniejszej licznie pojęć i założeń.

28 Krok 1: Budowanie modeluPrecyzujemy założenia Oparte na dotychczasowej wiedzy oraz naszej wierze Uwaga! Błędne założenia doprowadzą do błędnych wniosków! Isaac Newton: Masa jest stałą – mechanika klasyczna Albert Einstein: Masa jest zmienną – teoria względności

29 Krok 1: Budowanie modeluTworzymy graficzny schemat modelu Wizualna reprezentacja założeń Zmienne oraz relacje pomiędzy nimi Bardzo ważne dla złożonych modeli! Przykład modelu dla PRRS (Zespół rozrodczo-oddechowy świń) autor: Andrea Doeschl-Wilson Zapisanie równań matematycznych

30 Krok 2: Predykcja oraz analizaJak rozwiązać równania z naszego modelu? Analitycznie Korzystamy wyłącznie z matematyki Możliwe tylko dla prostych równań Otrzymujemy jedno, konkretne rozwiązanie oraz dobre zrozumienie modelu Numerycznie Z wykorzystaniem komputera Wymaga użycie algorytmów, które szacują rozwiązanie - otrzymane rozwiązanie jest przybliżone

31 Krok 2: Predykcja oraz analizaJakie dane wyjściowe są dla nas najważniejsze Brak wstępnych założeń może prowadzić do wygenerowania zbyt dużej ilości danych. Jak dobrać odpowiednie parametry na wejściu? Korzystamy z dostępnej literatury Korzystamy z istniejących danych i szacujemy parametry (wnioskowanie statystyczne) Nie zawsze można wyznaczyć pojedynczą wartość Duża ilość dostępnych metod – jak wybrać tą właściwą?

32 Krok 2: Predykcja oraz analizaOpracowujemy wiele możliwych scenariuszy (różne parametry wejściowe): Realne – realizacja celu naszej analizy, weryfikacja hipotezy badawczej Ekstremalne – testowanie ograniczeń naszego modelu

33 Krok ten bardzo często prowadzi do przebudowy modelu !!!Krok 2: Predykcja oraz analiza Analiza modelu Powinna prowadzić do lepszego zrozumienia modelu Składa się na nią analiza jakościowa i ilościowa Jakie typy odpowiedzi są generowanie przez model? Czy wyglądają realistycznie? Jak zmiana poszczególnych parametrów wpływa na zachowanie modelu? Jak wrażliwy jest model na wartości wejściowe parametrów? Jak stabilne są predykcje na podstawie modelu w zależności od małych zmian wartości wejściowych lub założeń? Krok ten bardzo często prowadzi do przebudowy modelu !!!

34 Porównanie tego co model przewiduje z rzeczywistościąKrok 3: Walidacja modelu Porównanie tego co model przewiduje z rzeczywistością „Model powinien być tak prosty, jak to tylko możliwe, ale nie prostszy” Albert Einstein Szczególne wyzwania w biologii ze względu na stopień złożoności układów biologicznych i ich zmienność

35 Krok 3: Walidacja modeluW najlepszym wypadku: porównanie predykcji z modelu do danych ekspreymentalnych Do walidacji musimy użyć niezależnych danych, które nie były wykorzystane wprocesie tworzenia modelu Jeżeli nie ma możliwości zdobycia niezależnych danych, na początki dzielimy dane na część treningową (budujemy model) oraz walidacyjną.

36 Krok 3: Walidacja modeluWygenerowanie danych, które mogą być bezpośrednie porównane z danymi empirycznymi jest kluczowe dla prawidłowej weryfikacji modelu Teoria grawitacji Newtona, która nie uwzględnia efektu zakrzywienia czasoprzestrzeni przez rozmieszczone w niej ciała Teoria względności Einsteina pozwoliła wyjaśnić odchylenia w ruchu planety merkury oraz promieni świetlnych z odległych gwiazd

37 Krok 3: Walidacja modeluZasada falsyfikowalności Każdy model lub teoria w naukach przyrodniczych powinny być tak sformułowane, aby choćby teoretycznie możliwe było ich obalenie, czyli falsyfikacja Wystarczy aby wyniki choć jednego eksperymentu były niezgodne z przewidywaniami aby nie uznać modelu za poprawny! Statystyka jako narzędzie do weryfikacji modelu Pozwala przyjąć lub odrzucić model z pewnym prawdopodobieństwem na podstawie zgodności między przewidywaniami a wynikami eksperymentu

38 Krok 3: Walidacja modeluJeżeli predykcje modelu znacznie odbiegają od rzeczywistości, należy zidentyfikować prawdopodobne przyczyny: Naturalna zmienność w populacji, środowisku, błędy w pomiarach Jeżeli zmienność nie wykracza poza granice normy (statystyka) model jest akceptowalny Błędy przy tworzeniu modelu: Zły dobór lub nieprawidłowo dobrane wartości parametrów Nieprawidłowo dobrane równania matematyczne Rada: Przebudować model. Nie wszystkie istotne zmienne zostały uwzględnione w modelu Rada: zwiększamy złożoność modelu

39 Klasyfikacja Modeli Istnieje wiele typów modeli matematycznychPrzynależność modelu do kategorii umożliwia powiedzenie więcej na temat ich celu, zakresu, oraz wykorzystywanych technik matematycznych Przykłady klasyfikacji: Empiryczne vs mechaniczne Deterministyczne vs stochastyczne Statyczne vs dynamiczne Liniowe vs nieliniowe Dyskretne vs ciągłe Model systems vs model molekularny

40 Model empiryczny vs mechanistycznyModele empiryczne (statystyczne) Model opracowywany na podstawie danych eksperymentalnych – zaczynany od danych Nie jest wymagana wstępna wiedza Cel: opis wzorów oraz zależności obserwowanych w danych Model mechanistyczny Model opracowywany na podstawie hipotezy badawczej – zaczynany od obserwacji, teorii Cel: zrozumienie mechanizmów stojących za obserwowanym zjawiskiem Wymagana jest wstępna wiedza na temat systemu Dane empiryczne wykorzystywane są w celu parametryzacji, walidacji modelu

41 Wielkość wyjściowa jest wyznaczona z pewnym prawdopodobieństwemModel deterministyczny Wielkość wyjściowa jest jednoznacznie przypisana do wielkości wejściowej za pomocą określonej zależności funkcyjnej Określa stany wybranego układu w czasie Nie uwzględnia losowego rozrzutu wartości zmiennych Model stochastyczny (probabilistyczny) Wielkość wyjściowa jest wyznaczona z pewnym prawdopodobieństwem Określa prawdopodobieństwo, że dany układ znajdzie się w danym stanie

42 Model deterministyczny a stochastyczny

43 Model symulacyjny: Nie jest to typ modelu matematycznego Realizacja programu symuluje przebieg rzeczywistego procesu – termin odnosi się do implementacji modelu matematycznego poprzez np. symulację komputerową Nie jest reprezentowany przez jedną określoną strukturę matematyczną, ale algorytm i zbudowany na jego podstawie program, którego elementy skonstruowane są na podstawie modeli matematycznych

44 Literatura Matematyka dla biologów Wrzosek Dariusz. Wydawnictwo Uniwersytetu Warszawskiego. Warszawa. Modelowanie matematyczne w biologii i medycynie Foryś Urszula, Poleszczuk Jan. Uniwersytet Warszawski. Mathematical Biology Murray J.D.,Third Edition. Springer.