1 Struktury molekularneBioinformatyczne metody wizualizacji, formaty plików, przewidywanie struktur biomolekuł (na przykładzie białek). Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
2 Struktury molekuł Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
3 Przykładowe formaty plikówWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
4 Model struktury pierwszorzędowej białkaPlik w formacie FASTA >gi| |gb|AAD | cytochrome b [Elephas maximus maximus] LCLYTHIGRNIYYGSYLYSETWNTGIMLLLITMATAFMGYVLPWGQMSFWGATVITNLFSAIPYIGTNLV EWIWGGFSVDKATLNRFFAFHFILPFTMVALAGVHLTFLHETGSNNPLGLTSDSDKIPFHPYYTIKDFLG LLILILLLLLLALLSPDMLGDPDNHMPADPLNTPLHIKPEWYFLFAYAILRSVPNKLGGVLALFLSIVIL GLMPFLHTSKHRSMMLRPLSQALFWTLTMDLLTLTWIGSQPVEYPYTIIGQMASILYFSIILAFLPIAGX IENY >nazwa_sekwencji_1 sekWENCJAdanEGObiaLKAlubniCInukLEOTYDOWEJ >nazwa_sekwencji_2 kolEJNAsekWENCJAdowOLNEGOwybRANEGOBIALKAlubniciDNA >kolejna itd Kryteria formatu FASTA: Tylko sekwencja lub sekwencja z opisem Opis danej sekwencji w oddzielnej linijce (powyżej) i poprzedzony znakiem „>” Sekwencja TYLKO z dozwolonych znaków dowolnej wielkości Każda linijka sekwencji maksymalnie do 80 znaków Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
5 Dozwolone symbole w formacie FASTAA --> adenosine M --> A C (amino) C --> cytidine S --> G C (strong) G --> guanine W --> A T (weak) T --> thymidine B --> G T C U --> uridine D --> G A T R --> G A (purine) H --> A C T Y --> T C (pyrimidine) V --> G C A K --> G T (keto) N --> A G C T (any) - gap of indeterminate length For those programs that use amino acid query sequences (BLASTP and TBLASTN), the accepted amino acid codes are: A alanine P proline B aspartate or asparagine Q glutamine C cystine R arginine D aspartate S serine E glutamate T threonine F phenylalanine U selenocysteine G glycine V valine H histidine W tryptophan I isoleucine Y tyrosine K lysine Z glutamate or glutamine L leucine X any M methionine * translation stop Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
6 Format FASTA >gi| |gb|AAT | cytochrome c oxidase subunit III [Homo sapiens] MTHQSHAYHMVKPSPWPLTGALSALLMTSGLAMWFHFHSMTLLMLGLLTNTLTMYQWWRDVTRESTYQGH HTPPVQKGLRYGMILFITSEVFFFAGFFWAFYHSSLAPTPQLGGHWPPTGITPLNPLEVPLLNTSVLLAS GVSITWAHHSLMENNRNQMIQALLITILLGLYFTLLQASEYFESPFTISDGIYGSTFFVATGFHGLHVII GSTFLTICFIRQLMFHFTSKHHFGFEAAAWYWHFVDVVWLFLYVSIYWWGS 1 mthqshayhm vkpspwpltg alsallmtsg lamwfhfhsm tllmlglltn tltmyqwwrd 61 vtrestyqgh htppvqkglr ygmilfitse vfffagffwa fyhsslaptp qlgghwpptg 121 itplnplevp llntsvllas gvsitwahhs lmennrnqmi qallitillg lyftllqase 181 yfespftisd giygstffva tgfhglhvii gstflticfi rqlmfhftsk hhfgfeaaaw 241 ywhfvdvvwl flyvsiywwg s Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
7 Model struktury drugorzędowej białka>plik FASTA sekwencji i struktury drugorzedowej fragmentu hemoglobiny SSNYCNQMMKSRNLTKDRCKPVNTFVHESLADVQAVCSQKNVACKNGQTN CCCHHHHHHHHCPCCCCCCCCEEEEECCCHHHHHHHHHCEEECCCCPCCC Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
8 Struktury drugorzędoweHelisy prawoskrętna lewoskrętna 3-turn helix (3/10 helix). Min length 3 residues (G) 4-turn helix (alpha helix). Min length 4 residues (H) 5-turn helix (pi helix). Min length 5 residues (I) Beta-kartki (E) równoległe anty-równoległe PSI-loop Zwroty (spinki) stabilizowane wiązaniami wodorowymi (3, 4 lub 5 turn) (T) Nitka – struktura dowolna, nieokreślona (C) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
9 Struktury przestrzenne molekułWiązanie peptydowe Kąty torsyjne Dozwolone kąty i Ramachandran Plot Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
10 Modele struktur trzecio- i czwartorzędowych białekWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
11 Struktura plików formatu PDBPDB ID i nazwy modeli: 3INS.pdb 1OCC.pdb 1HBB.pdb 1HBS_B.pdb Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
12 Struktura plików formatu PDBAtom | Grupa | koordynaty |inne parametry Atom nr pierw. aa nr X Y Z współcz. rodz ATOM 1 N GLU E N ATOM 2 CA GLU E C ATOM 3 C GLU E C … ATOM 2238 CE LYS E C ATOM 2239 NZ LYS E N ATOM 2240 N ALA E N ATOM 2241 CA ALA E C Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
13 przewidywanie Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
14 Profil hydrofobowościSkale hydrofobowości Analiza pozycji w sekwencji Analiza regionów sekwencji profil Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
15 Metody przewidywania struktury drugorzędowej białekGOR-I Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
16 Metody przewidywania struktury drugorzędowej białekGOR-I Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
17 Regiony transmembranoweWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
18 Regiony transmembranoweThe prediction of transmembranous regions is either based on the hydrophobicity method (Kyte & Doolittle, 1982) or on more specific method such as the positive inside rule (Von Heijne, 1992). The method is based on the positive inside rule that indicates that the cytoplasmic side of a membrane is rather positively charged whereas the external side is rather negatively charged. The hydrophobicvity scale is : Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
19 Regiony transmembranoweThe hydrophobicity of segments is first measured by calculating the weighted sum on a 21 AA trapezoid sliding window with a central, 11 AA rectangular section and 2 flanking wedge-like sections each 5AA long. The cytoplasmic regions (In) are predicted using the positive-inside rule and the periplasmic regions (Out) of bacterial inner membrane proteins. Thus the formulae is: Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
20 Otrzymywanie modeli struktury białekMetody laboratoryjne NMR, X-ray Teoretyczne przewidywanie struktury Ab initio protein modelling Comparative protein modelling modelowanie homologiczne threading (nawlekanie) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
21 NMR Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
22 X-RAY Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
23 Metody przewidywania struktury przestrzennej białek in silico1. Ab initio (de novo) symulacje: - Minimalizacja energii (EM), - dynamika molekularna (MD), - Monte Carlo GHIKLSYTVNEQNLKPERFFYTSAVAIL 2. comparative / homology modeling GHIKLSYTVNEQNLKPERFFYTSAVAIL THEESEQTEN-CESALIGN--NICELY ||| ||| || || ||||| |||||| THE—SEQ-EN-CE-ALIGNEDNICELY Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
24 Minimalizacja EnergiiWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
25 Minimalizacja EnergiiWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
26 Algorytm „lejkowy” The energy surface of a folding funnel from experimental data for the folding of lysozyme. The axes are defined as follows: E represents the energy of the system, Q is defined as the proportion of native contacts formed, and P is a measure of the available conformational space. Three pathways are shown corresponding to (yellow) fast folding, (green) slow folding pathway that crosses the high energy barrier, and (red) slow folding pathway which returns to a less folded state before following the pathway for fast folding (reproduced from Dobson et al., 1998).[2] Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
27 Protein folding Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
28 Modelowanie homologiczne1. Odnalezienie modeli białek homologicznych o sekwencji podobnej co najmniej 20-25% Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
29 Modelowanie homologiczne2. Najlepsze zestawienie sekwencji homologicznych + Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
30 Modelowanie homologiczne3. Threading - nawlekanie Template Target Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
31 Modelowanie homologiczne4. Optymalizacja modelu / projektu Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
32 wizualizacja Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
33 Podstawowe elementy w wizualizacji molekularnejPunkty i linie (druty) (points and wires) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
34 Podstawowe elementy w wizualizacji molekularnejKule i pręty (słomki, rurki) (balls and sticks) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
35 Podstawowe elementy w wizualizacji molekularnejSfery i powierzchnie (spheres and surfaces) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
36 Podstawowe elementy w wizualizacji molekularnejSfery i powierzchnie (spheres and surfaces) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
37 Podstawowe elementy w wizualizacji molekularnejWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
38 Podstawowe elementy w wizualizacji molekularnejWstążki i nici (ribbons and coils) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
39 Podstawowe kolory w wizualizacji molekularnejatomy C O N P S H Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
40 Podstawowe kolory w wizualizacji molekularnejŁadunki (charges) + - Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
41 Podstawowe typy wizualizacji molekularnejwireframe (obraz szkieletowy) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
42 Podstawowe typy wizualizacji molekularnejbackbone (kręgosłup) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
43 Podstawowe typy wizualizacji molekularnejsticks (pręty, rurki -wiązania chemiczne) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
44 Podstawowe typy wizualizacji molekularnejball and sticks (kulki i pręty – atomy i wiązania) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
45 Podstawowe typy wizualizacji molekularnejribbons i cartoon (wstążki – wzajemne ułożenie powierzchni wiązań peptydowych) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
46 Podstawowe typy wizualizacji molekularnejwstążki Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
47 Podstawowe typy wizualizacji molekularnejspacefill (kule / sfery oddziaływać sił Van der Waalsa - VDW) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
48 Podstawowe typy wizualizacji molekularnejsfery VDW Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
49 molecular surface (powierzchnia molekularna) accessible surface area (powierzchnia dostępu)Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
50 Molecular vs. Accessible areaWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
51 Podstawowe typy wizualizacji molekularnejmolecular surface (powierzchnia molekularna) accessible surface area (powierzchnia dostępu) electrostatic surface area (powierzchnia elektrostatyczna) Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
52 Programy do wizualizacji, renderingu i modelowaniaRasMol Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
53 Programy do wizualizacji i renderinguWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
54 Programy do wizualizacji, renderingu i modelowaniaSPDBV Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
55 Ray tracing (śledzenia promienia) – jedna z technik renderinguWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
56 Programy do wizualizacji i renderinguPovRay Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
57 Wizualizacja wektorowaWstęp do bioinformatyki Wykład 3 Biotechnologia UWM
58 Wizualizacja renderowana (OpenGL)Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
59 Wizualizacja renderowana (ray-tracing)Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
60 Ray-tracing Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM
61 Programy do wizualizacji, renderingu i modelowaniaCn3D Wstęp do bioinformatyki Wykład 3 Biotechnologia UWM