Czy komputery zabiją genomikę?. Problemy Ogromne ilości danych do przechowywania Zbyt słabe komputery aby „łączyć” sekwencje Nieoptymalne formaty danych.

1 Czy komputery zabiją genomikę? ...
Author: Gabriela Zych
0 downloads 2 Views

1 Czy komputery zabiją genomikę?

2 Problemy Ogromne ilości danych do przechowywania Zbyt słabe komputery aby „łączyć” sekwencje Nieoptymalne formaty danych

3 Genom Genom to łańcuch zasad Zasady mogą występować w jednej z kilkudziesięciu odmian Genom może się składać z 4000 do 670000000000 zasad Genom człowieka składa się z 2 kopii, a każda ma 3200000000 zasad

4 Łączenie sekwencji Dzisiejsze maszyny generują krótkie sekwencje (50 – 120 zasad), które trzeba połączyć w całość Wynikiem działania najczęściej jest obraz, zamiast bardziej przyjaznych formatów

5 Przechowywanie danych Współczesne urządzenia są w stanie wyprodukować 5TB dziennie Baza danych zawierająca pełne genomy 629 ludzi ma 7.3TB danych Oprócz samego wyniku trzeba zapisać jak dokładna była analiza Możliwości sekwencjonowania podwajają się co 5 miesięcy

6 Przechowywanie danych cd.

7 Możliwe rozwiązania Cloud computing Lepsze formaty danych Zamiast zapamiętywać dane, za każdym razem od nowa sekwencjonować

8 Formaty danych Zapamiętywać zasady wraz z ich jakością Zapamiętać jeden wzorzec, i różnice pomiędzy nim a nowym genomem Takie różnice występują statystycznie na 0.1% pozycji Tracimy wtedy informacje o jakości

9 Cloud computing - zalety Możliwość taniego składowania danych Dostęp do dużej mocy obliczeniowej Nie trzeba za każdym razem ściągać danych, tylko wykonywać obliczenia w chmurze Trudniej zniszczyć dane w chmurze

10 Cloud computing - wady Bezpieczeństwo danych Upload/download danych może trwać wiele tygodni Wymiana informacji między chmurami Mało programów, które wspierają prace w chmurze Obecnie ceny nie uzasadniają przejścia do chmury Brak standardów przechowywania danych, protokołów itp.