Komputerowa analiza sieci genowych

1 Komputerowa analiza sieci genowychAgnieszka Marmołowska...
Author: Tobiasz Kosewski
0 downloads 2 Views

1 Komputerowa analiza sieci genowychAgnieszka Marmołowska Jacek Ławrynowicz Promotor: prof. Krzysztof Giaro

2 Geneza Projektu Projekt grupowy Klient Cel projektuInstytut oceanologii PAN w Sopocie Cel projektu Stworzyć aplikację umożliwiającą analizę wyewoluowanych zbiorów populacji sieci genowych

3 Produkty projektu Aplikacja z graficznym interfejsem Aplikacja testowaDokumentacja Opis aplikacji Wyniki analizy na rzeczywistych danych

4 Sieć genowa Zbiór segmentów DNA komórki, które oddziałują ze sobą i innymi elementami komórki. Pokazuje w jakim stopniu geny są transkrybowane na mRNA. Ogólnie mRNA „tworzą” białka.

5 Sieć genowa - funkcje białkaBiałka strukturalne – budowa komórki Enzym – np. trawienne Czynnik transkrypcyjny – aktywuje inny gen – łącząc się z promotorem zapoczątkowuje produkcję innego białka.

6 Sieć genowa jako graf Węzły – zbiór segmentów DNA (węzeł lub porty)Krawędzie – połączenie segmentów DNA czynnikiem transmisyjnym Populacje, zbiory populacji

7 Parametry sieci Omawiane parametry mają znaczenie w różnych sieciach (www, sieci społeczne...) Interesują nas własności sieci genowych

8 Rozkład stopni wierzchołkówWzór Outgoing distribution Ingoing distribution

9 Średnica Ścieżka charakterystycznaNajkrótsza ścieżka między parą wierzchołków - Średnica - Ścieżka charakterystyczna - Dla sieci genowych Przykład: 1000 genów, 4000 połączeń – ścieżka charakterystyczna = 3.3

10 Degree Centrality WzórPrzykład: 21% białek o było ważnych, 62% białek o było ważnych Związek między degree centrality a ważnością białek nie jest prosty

11 Closeness Centrality WzórPrzykład: wierzchołki o najwyższej wartości closeness centrality odpowiadają za komunikację komórka-komórka

12 Betweeness CentralityWzór gdzie: ilość ścieżek między u i v - ilość ścieżek między u i v przechodzących przez w Przykład: średnia wartość Cb dla ważnych protein jest o około 80% wyższa niż dla protein nieważnych. Istnieje związek między betweenes i degree centrality.

13 Architektura programu3 poziomy analizy Graf Populacja Zbiór populacji

14 Metodologia Lekka przystowowana do dwuosobowego zespołuWymagania w postaci przypadków użycia Testy jednostkowe Peer programming przystowowana do dwuosobowego zespołu

15 Wykorzystane technologieWydajność Życzenie klienta Qt GUI Boost Google Test Framework

16 Boost Graph Wiele przydanych algorytmów Generyczna Mało przyjaznaBFS, DFS Dijkstra, Bellman-Ford Fruchterman-Reingold Itd.. Generyczna Mało przyjazna

17 Nasza klasa grafu Reprezentacja w postaci listy sąsiedztwaNiezmienne identyfikatory elementów Edytowalny Szybka iteracja Posiada adapter dla Boost Graph Library Podgrafy

18 Parametry (WIP) Identyfikowany przez nazwę (string) Skarar lub wektorOpisuje sieć, populację lub zbiór populacji Mozliwość zrównoleglania obliczeń

19 Format pliku GraphML Kompletny Popularny RozszerzalnyPorty Wiele grafow w jednym pliku Podgrafy Popularny Rozszerzalny Czytelny dla człowieka

20 Format pliku - przykład yellow green blue red 1.0 1.0 2.0

21 Obecny status projektuAlpha  Wczytywanie sieci z pliku Wyswietlanie kilku patrametrów Strona projektu

22

23 Kierunki rozwoju Parametry Tabele Wykresy Wizualizacja

24 Bibliografia Mason, O. & Verwoerd, M. Graph theory and networks in biology. Systems Biology, IET 1, (2007)