Struktury molekularne

1 Struktury molekularneBioinformatyczne metody wizualizac...
Author: Czcibor Wydra
0 downloads 0 Views

1 Struktury molekularneBioinformatyczne metody wizualizacji, formaty plików, przewidywanie struktur biomolekuł (na przykładzie białek). Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

2 Struktury molekuł Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

3 Przykładowe formaty plikówWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

4 Model struktury pierwszorzędowej białkaPlik w formacie FASTA >gi| |gb|AAD | cytochrome b [Elephas maximus maximus] LCLYTHIGRNIYYGSYLYSETWNTGIMLLLITMATAFMGYVLPWGQMSFWGATVITNLFSAIPYIGTNLV EWIWGGFSVDKATLNRFFAFHFILPFTMVALAGVHLTFLHETGSNNPLGLTSDSDKIPFHPYYTIKDFLG LLILILLLLLLALLSPDMLGDPDNHMPADPLNTPLHIKPEWYFLFAYAILRSVPNKLGGVLALFLSIVIL GLMPFLHTSKHRSMMLRPLSQALFWTLTMDLLTLTWIGSQPVEYPYTIIGQMASILYFSIILAFLPIAGX IENY >nazwa_sekwencji_1 sekWENCJAdanEGObiaLKAlubniCInukLEOTYDOWEJ >nazwa_sekwencji_2 kolEJNAsekWENCJAdowOLNEGOwybRANEGOBIALKAlubniciDNA >kolejna itd Kryteria formatu FASTA: Tylko sekwencja lub sekwencja z opisem Opis danej sekwencji w oddzielnej linijce (powyżej) i poprzedzony znakiem „>” Sekwencja TYLKO z dozwolonych znaków dowolnej wielkości Każda linijka sekwencji maksymalnie do 80 znaków Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

5 Dozwolone symbole w formacie FASTAA --> adenosine M --> A C (amino) C --> cytidine S --> G C (strong) G --> guanine W --> A T (weak) T --> thymidine B --> G T C U --> uridine D --> G A T R --> G A (purine) H --> A C T Y --> T C (pyrimidine) V --> G C A K --> G T (keto) N --> A G C T (any) - gap of indeterminate length For those programs that use amino acid query sequences (BLASTP and TBLASTN), the accepted amino acid codes are: A alanine P proline B aspartate or asparagine Q glutamine C cystine R arginine D aspartate S serine E glutamate T threonine F phenylalanine U selenocysteine G glycine V valine H histidine W tryptophan I isoleucine Y tyrosine K lysine Z glutamate or glutamine L leucine X any M methionine * translation stop Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

6 Format FASTA >gi| |gb|AAT | cytochrome c oxidase subunit III [Homo sapiens] MTHQSHAYHMVKPSPWPLTGALSALLMTSGLAMWFHFHSMTLLMLGLLTNTLTMYQWWRDVTRESTYQGH HTPPVQKGLRYGMILFITSEVFFFAGFFWAFYHSSLAPTPQLGGHWPPTGITPLNPLEVPLLNTSVLLAS GVSITWAHHSLMENNRNQMIQALLITILLGLYFTLLQASEYFESPFTISDGIYGSTFFVATGFHGLHVII GSTFLTICFIRQLMFHFTSKHHFGFEAAAWYWHFVDVVWLFLYVSIYWWGS 1 mthqshayhm vkpspwpltg alsallmtsg lamwfhfhsm tllmlglltn tltmyqwwrd 61 vtrestyqgh htppvqkglr ygmilfitse vfffagffwa fyhsslaptp qlgghwpptg 121 itplnplevp llntsvllas gvsitwahhs lmennrnqmi qallitillg lyftllqase 181 yfespftisd giygstffva tgfhglhvii gstflticfi rqlmfhftsk hhfgfeaaaw 241 ywhfvdvvwl flyvsiywwg s Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

7 Model struktury drugorzędowej białka>plik FASTA sekwencji i struktury drugorzedowej fragmentu hemoglobiny SSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTN CCCHHHHHHHHCPCCCCCCCCEEEEECCCHHHHHHHHHCEEECCCCPCCC Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

8 Struktury drugorzędoweHelisy prawoskrętna lewoskrętna 3-turn helix (3/10 helix). Min length 3 residues (G) 4-turn helix (alpha helix). Min length 4 residues (H) 5-turn helix (pi helix). Min length 5 residues (I) Beta-kartki (E) równoległe anty-równoległe PSI-loop Zwroty (spinki) stabilizowane wiązaniami wodorowymi (3, 4 lub 5 turn) (T) Nitka – struktura dowolna, nieokreślona (C) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

9 Struktury przestrzenne molekułWiązanie peptydowe Kąty torsyjne Dozwolone kąty i Ramachandran Plot Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

10 Modele struktur trzecio- i czwartorzędowych białekWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

11 Struktura plików formatu PDBPDB ID i nazwy modeli: 3INS.pdb 1OCC.pdb 1HBB.pdb 1HBS_B.pdb Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

12 Struktura plików formatu PDBAtom | Grupa | koordynaty |inne parametry Atom nr pierw. aa nr X Y Z współcz. rodz ATOM 1 N GLU E N ATOM 2 CA GLU E C ATOM 3 C GLU E C ATOM 2238 CE LYS E C ATOM 2239 NZ LYS E N ATOM 2240 N ALA E N ATOM 2241 CA ALA E C Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

13 przewidywanie Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

14 Profil hydrofobowościSkale hydrofobowości Analiza pozycji w sekwencji Analiza regionów sekwencji profil Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

15 Metody przewidywania struktury drugorzędowej białekGOR-I Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

16 Metody przewidywania struktury drugorzędowej białekGOR-I Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

17 Regiony transmembranoweWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

18 Regiony transmembranoweThe prediction of transmembranous regions is either based on the hydrophobicity method (Kyte & Doolittle, 1982) or on more specific method such as the positive inside rule (Von Heijne, 1992). The method is based on the positive inside rule that indicates that the cytoplasmic side of a membrane is rather positively charged whereas the external side is rather negatively charged. The hydrophobicvity scale is : Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

19 Regiony transmembranoweThe hydrophobicity of segments is first measured by calculating the weighted sum on a 21 AA trapezoid sliding window with a central, 11 AA rectangular section and 2 flanking wedge-like sections each 5AA long.  The cytoplasmic regions (In) are predicted using the positive-inside rule and the periplasmic regions (Out) of bacterial inner membrane proteins. Thus the formulae is: Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

20 Otrzymywanie modeli struktury białekMetody laboratoryjne NMR, X-ray Teoretyczne przewidywanie struktury Ab initio protein modelling Comparative protein modelling modelowanie homologiczne threading (nawlekanie) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

21 NMR Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

22 X-RAY Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

23 Metody przewidywania struktury przestrzennej białek in silico1. Ab initio (de novo) symulacje: - Minimalizacja energii (EM), - dynamika molekularna (MD), - Monte Carlo GHIKLSYTVNEQNLKPERFFYTSAVAIL 2. comparative / homology modeling GHIKLSYTVNEQNLKPERFFYTSAVAIL THEESEQTEN-CESALIGN--NICELY ||| ||| || || ||||| |||||| THE—SEQ-EN-CE-ALIGNEDNICELY Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

24 Minimalizacja EnergiiWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

25 Minimalizacja EnergiiWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

26 Algorytm „lejkowy” The energy surface of a folding funnel from experimental data for the folding of lysozyme. The axes are defined as follows: E represents the energy of the system, Q is defined as the proportion of native contacts formed, and P is a measure of the available conformational space. Three pathways are shown corresponding to (yellow) fast folding, (green) slow folding pathway that crosses the high energy barrier, and (red) slow folding pathway which returns to a less folded state before following the pathway for fast folding (reproduced from Dobson et al., 1998).[2] Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

27 Protein folding Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

28 Modelowanie homologiczne1. Odnalezienie modeli białek homologicznych o sekwencji podobnej co najmniej 20-25% Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

29 Modelowanie homologiczne2. Najlepsze zestawienie sekwencji homologicznych + Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

30 Modelowanie homologiczne3. Threading - nawlekanie Template Target Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

31 Modelowanie homologiczne4. Optymalizacja modelu / projektu Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

32 wizualizacja Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

33 Podstawowe elementy w wizualizacji molekularnejPunkty i linie (druty) (points and wires) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

34 Podstawowe elementy w wizualizacji molekularnejKule i pręty (słomki, rurki) (balls and sticks) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

35 Podstawowe elementy w wizualizacji molekularnejSfery i powierzchnie (spheres and surfaces) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

36 Podstawowe elementy w wizualizacji molekularnejSfery i powierzchnie (spheres and surfaces) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

37 Podstawowe elementy w wizualizacji molekularnejWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

38 Podstawowe elementy w wizualizacji molekularnejWstążki i nici (ribbons and coils) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

39 Podstawowe kolory w wizualizacji molekularnejatomy C O N P S H Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

40 Podstawowe kolory w wizualizacji molekularnejŁadunki (charges) + - Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

41 Podstawowe typy wizualizacji molekularnejwireframe (obraz szkieletowy) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

42 Podstawowe typy wizualizacji molekularnejbackbone (kręgosłup) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

43 Podstawowe typy wizualizacji molekularnejsticks (pręty, rurki -wiązania chemiczne) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

44 Podstawowe typy wizualizacji molekularnejball and sticks (kulki i pręty – atomy i wiązania) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

45 Podstawowe typy wizualizacji molekularnejribbons i cartoon (wstążki – wzajemne ułożenie powierzchni wiązań peptydowych) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

46 Podstawowe typy wizualizacji molekularnejwstążki Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

47 Podstawowe typy wizualizacji molekularnejspacefill (kule / sfery oddziaływać sił Van der Waalsa - VDW) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

48 Podstawowe typy wizualizacji molekularnejsfery VDW Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

49 molecular surface (powierzchnia molekularna) accessible surface area (powierzchnia dostępu)Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

50 Molecular vs. Accessible areaWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

51 Podstawowe typy wizualizacji molekularnejmolecular surface (powierzchnia molekularna) accessible surface area (powierzchnia dostępu) electrostatic surface area (powierzchnia elektrostatyczna) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

52 Programy do wizualizacji, renderingu i modelowaniaRasMol Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

53 Programy do wizualizacji i renderinguWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

54 Programy do wizualizacji, renderingu i modelowaniaSPDBV Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

55 Ray tracing (śledzenia promienia) – jedna z technik renderinguWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

56 Programy do wizualizacji i renderinguPovRay Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

57 Wizualizacja wektorowaWstęp do bioinformatyki Wykład 3 Biotechnologia UWM

58 Wizualizacja renderowana (OpenGL)Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

59 Wizualizacja renderowana (ray-tracing)Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

60 Ray-tracing Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM

61 Programy do wizualizacji, renderingu i modelowaniaCn3D Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM