Były dyskietki, płyty, kasety. Teraz czas na…DNA! Czyli o pomyśle na wykorzystanie DNA w technologii pamięci masowych

BioLetyn 19/II/2016

AGATA KILAR

Według prognoz ilość informacji tworzonych przez ludzkość w 2017 roku przekroczy 16 zatabajtów (1021 bajta, porównując megabajt 106 bajta). Niepokojące tempo przyrostu danych w końcu przekroczy naszą zdolność do ich przechowywania. Dodatkowym problemem jest „żywotność” technologii przechowującej dane. Dyski magnetyczne obecnie działają średnio od 3 do 5 lat, natomiast dyski oparte na technologii taśmowej do 30 lat. Syntetyczne sekwencje DNA od dawna uważane są za potencjalne medium dla cyfrowego zapisu danych. DNA jest atrakcyjne ze względu na wysoki stopień upakowania informacji, a przy tym niezwykłą trwałość – istnieje tak długo jak istnieje życie na Ziemi.

Zaraz, zaraz…. ale jak?

Proces zapisu dla pamięci DNA rozpoczyna się od mapowania danych cyfrowych i ich przekodowania (przetłumaczenia) na sekwencję nukleotydową (przyp. nukleotyd jest podstawowym budulcem DNA), która następnie jest syntetyzowana i gotowa do przechowywania danych. Natomiast odczyt danych polega na sekwencjonowaniu cząsteczki DNA i dekodowaniu informacji z powrotem do oryginalnych danych cyfrowych. Jak wiadomo synteza i sekwencjonowanie cząsteczek DNA są szeroko stosowane w biotechnologii, od badań do diagnostyki i terapii. Proces odzyskiwania danych jest dużo bardziej czasochłonny niż ich zapis, dlatego postanowiono skrócić ten czas umożliwiając losowy dostęp do danych. W tym momencie możemy to sobie wyobrazić w ten sposób: nasza cząsteczka DNA jest folderem, w którym znajduje się kilka plików. Chcemy otworzyć tylko jeden plik, więc… najeżdżamy na niego kursorem i gotowe 😉 Ale skąd wziął się kursor? W celu uzyskania dostępu tylko do części cyfrowych informacji można skorzystać z metody PCR i amplifikować wybrany fragment sekwencji nukleotydowej, który jest naszym plikiem. Tak więc naszym kursorem będzie primer czy sekwencja starterowa. Prawda, że proste?

Wszystko na dobrej drodze

Pewnie niektórzy z Was pomyślą, że takie futurystyczne rozwiązania póki co można wsadzić między bajki. Nic bardziej mylnego! Prace nad zapisem danych cyfrowych wykorzystując DNA trwają już od ponad 15 lat! Zapisano i odtworzono wiadomość złożoną z 23 znaków już w 1999 roku. Rok później odzyskano 3 numery 9-bitowe. Metoda była ciągle udoskonalana – w 2010 roku z powodzeniem udało się odzyskać 1280 znaków zakodowanych w genomie bakterii jako „znaki wodne”. Jednak osiągnięcie to zostało dokonane in vivo, czyli wewnątrz organizmu, czego nie można zastosować na większą skalę. Kolejne udoskonalenia wprowadzili w 2012 roku Church i Goldman, którzy odtworzyli wiadomości odpowiednio 643kB i 739kB, z tym, że nie były one do końca udane – Goldman w wyniku eksperymentu stracił 25 nukleotydów, a Church musiał skorygować ręcznie 10 bitów błędu. Ostatnio udało się odzyskać wiadomość liczącą 83kB – tym razem z pełnym sukcesem. Obecnie zespół badaczy z University of Washington i Microsoft Research prowadzi badania nad przechowywaniem w DNA… zdjęć! Kto wie, może za niedługo zamiast szpuli filmowej w kinie będziemy oglądać film z podwójnej helisy?

To na pewno nie koniec!

Przechowywanie danych w postaci DNA ma w sobie niezwykły potencjał jako alternatywa dla obecnych rozwiązań stosowanych w pamięci masowej: jest bardzo gęste i niezwykle trwałe. Mimo to na pendrive’y zawierające DNA będziemy musieli jeszcze zaczekać, ponieważ obecny stan technologiczny metod syntezy i sekwencjonowania DNA nie umożliwia powszechnego  zastosowania. Jednak z każdym dniem w miarę ulepszania technologii i dynamicznego rozwoju branży biotechnologicznej metody te są coraz tańsze i prostsze w wykonaniu. Ponadto, warto wziąć pod uwagę fakt, iż technologia krzemowa może nie sprostać coraz wyższym wymaganiom ludzkości. Być może nadszedł czas, by architekci komputerowi rozważyli włączenie biomolekuł w integralną część projektowania komputerowego. Wszakże w ostatnich czasach biotechnologia ogromnie skorzystała z postępów przemysłu komputerowego – może teraz uda się jej w przemysł ten tchnąć dwuniciowe życie?

Źródła bibliograficzne:

Bornholt J., Lopez R., Carmean M. Douglas, Ceze L., Seelig G., Strauss K., A DNA-Based Archival Storage System, http://research.microsoft.com/pubs/258661/dnastorage-asplos16.pdf [20.05.2016]
Hossein S. M. Tabatabeai Yazdi., Han Mao Kiah, E. R. Garcia, Jian Ma, Huimin Zhao, O. Milenkovic, DNA-Based Storage: Trends and Methods, http://arxiv.org/pdf/1507.01611.pdf [20.05.2016]
Hossein S. M. Tabatabeai Yazdi., Han Mao Kiah, E. R. Garcia, Jian Ma, Huimin Zhao, O. Milenkovic,
 A Rewritable, Random-Access DNA-Based Storage System, „Nature”, 2015, 14138 (2015), http://www.nature.com/articles/srep14138 [20.05.2016]
Kuzdraliński A., PCR, http://www.e-biotechnologia.pl/Artykuly/pcr [20.05.2016]
Pomeroy R., New DNA Storage System Can Store 490 Exabytes Per Gram and Allows Data to Be Rewritten, http://www.realclearscience.com/blog/2015/09/new_dna_storage_technique_can_store_490_exabytes_per_gram_109391.html [20.05.2016]