Metody analizy zależności filogenetycznych

1 Metody analizy zależności filogenetycznych ...
Author: Weronika Kłosiński
0 downloads 3 Views

1 Metody analizy zależności filogenetycznych

2 Metoda UPGMA (Unweighted Pair Group Method with Arthmatic Mean)dij A B C D E 2 4 6 F 8 Macierz odległości miedzy 6 OTU Wybieramy parę o najmniejszej odległości, czyli A i B (różnią się dwiema substytucjami) A B 1 Punkt rozgałęzienia sytuujemy w odległości równej dAB/2, czyli 1substytucja

3 Kalkulacja nowej macierzy odległości (traktujemy parę AB jako osobny OTU stanowiący całość):Drugi cykl : Znajdujemy nową parę o najmniejszej odległości (DE) dij AB C D E 4 6 F 8 D E 2 dij AB C DE 4 6 F 8

4 dij AB,C DE 6 F 8 dij ABC, DE F 8 1 Czwarta iteracja A B 1 A B 2 C 2 CTrzecia iteracja dij AB,C DE 6 F 8 A B 1 C 2 A B 1 C 2 D E dij ABC, DE F 8

5 Ostatni krok-przyłączanie OTU F i ukorzenianie drzewaB 1 C 2 D E Midpoint rooting – teoretyczny wspólny przodek powinien być równoodległy od wszystkich OTU, czyli ; d(ABCDE,F)/2 = 8/2 =4 1 ROOT 4 F

6 Założenia i ograniczenia metody UPGMAJednakowe tempo mutacji wzdłuż wszystkich gałęzi drzewa Są spełnione założenia „three point conditions”; Dla każdych trzech taksonów A,B, C prawdziwy jest warunek że: dAC<=max(dAB,dBC) Analiza skupień działa dobrze tylko jeżeli dane są ultrameryczne

7 Metoda NJ (Neighbor Joining)OTU – operational taxonomic unit Pair of neighbors- para sąsiadów – dwie jednostki taksonomiczne połączone jednym wewnętrznym węzłem na nieukorzenionym bifurkacyjnym drzewie filogenetycznym 5 Para sąsiadów Względem węzła A 1 4 1,2, Para sąsiadów względem węzła B A C D E B 2 6 F 7 3 8

8 Macierz odległości dij A B C D E 5 4 7 10 6 9 F 8 11 30 42 32 38 34N OTU = A,B,C,D,E,F Elementy macierzy (dij ) -odległości między OTU liczone jako liczba różnic między każda parą dopasowanych sekwencji (np. liczba substytucji zaobserwowanych między sekwencja A i B) Net divergence- r i– suma odległości miedzy OTU i-tym a wszystkimi pozostałymi OTU Kalkulacja nowej macierzy odległości wg formuły: dij A B C D E 5 4 7 10 6 9 F 8 11 R(X) 30 42 32 38 34

9 Nowa macierz odległościMij A B C D E -13 -11.5 -10 -10.5 F -11 A B C D E F 1 wspólny węzeł Drzewko wyjściowe- star tree Wybieramy 1 z dwóch par o minimalnej wartości Mij

10 Dodawanie węzła U C D E 3 6 7 5 F 8 9 A E SAU U BKalkulujemy odległości między węzłem U a pozostałymi OUTu F C D

11 Iteracja powtórzenie całej procedury dla NOTU=N-1=5i macierzy odległości ; Liczymy r(X) i nową macierz Mij wyznaczamy parę OTU o minimalnej wartości Mij wstawiamy kolejny węzeł W U C D E 3 6 7 5 F 8 9

12 Metoda FM (Fitch-Margoliash)B C - 22 39 41 Algebraiczna kalkulacja długości gałęzi a+b=22 a+c=39 b+c=41 a=10 b-=12 c=29 A a c C b B

13 A B C D E - 22 39 41 43 18 20 10 A B C DE - 22 39 40 41 42 19

14 - 10 32.7 34.7 D E ABC sr E i ABC = 34.7 = e + m 10=d+eśrednia odległość między D i ABC= 32.7 =d+m, gdzie m=g+[(c+2f+a+b)/2] E i ABC = 34.7 = e + m 10=d+e układ trzech równań z trzema niewiadomymi – wyliczamy m, d i e D E ABC sr - 10 32.7 34.7 A B D E a b c e d f g C ( )/3 ( )/3

15 SSQ suma kwadratów odchyleńAverage percent standard deviation