Nowy przełom może znacznie ułatwić przechowywanie danych DNA – dodanie nowych liter pozwoli zaoszczędzić miejsce i przyspieszy prace.
Jak w przypadku większości rzeczy, naturalny system przechowywania danych, DNA, znacznie przewyższa wszystko, co stworzyliśmy. Teraz naukowcy z University of Illinois Urbana-Champaign podwoili i tak już niesamowitą pojemność pamięci, dodając dodatkowe litery do „alfabetu” DNA i opracowali nowy sposób jego odczytywania.
DNA w naturalny sposób składa się z kombinacji czterech nukleozasad: adeniny, guaniny, cytozyny i tyminy. Reprezentowane przez litery A, G, C i T, te zasady grupują się w różne sekwencje, tworząc plany dla każdego żywego organizmu. Ten system przechowywania informacji jest niewiarygodnie gęsty, z jednym gramem DNA zdolnym do przechowywania do 215 petabajtów (215 milionów GB) danych.
To oczywiście sprawia, że jest to bardzo atrakcyjne potencjalne rozwiązanie do przechowywania ogromnych ilości danych, które współczesne społeczeństwo produkuje codziennie – cała zawartość Internetu może zmieścić się w pudełku po butach pełnym DNA. I jakby ta pamięć nie była wystarczająco gęsta, naukowcy z nowego badania znaleźli sposób na jej podwojenie.
Wraz ze zwykłymi A, G, C i T zespół skutecznie dodał dodatkowe siedem „liter” do alfabetu DNA. Przybierają one formę chemicznie zmodyfikowanych nukleotydów, otwierając bardziej zróżnicowane kombinacje, które umożliwiają przechowywanie większej ilości informacji w tej samej przestrzeni fizycznej.
„Wyobraź sobie alfabet angielski” – powiedziała Kasra Tabatabaei, współautorka badania. „Gdybyś miał tylko cztery litery, mógłbyś stworzyć znacznie mniej słów. Gdybyś miał pełny alfabet, mógłbyś tworzyć nieograniczone kombinacje słów. Tak samo jest z DNA. Zamiast konwertować zera i jedynki na A, G, C i T, możemy zamienić zera i jedynki na A, G, C, T i siedem nowych liter w alfabecie magazynu.
Oczywiście dodanie dodatkowych nukleotydów oznacza, że istniejące systemy do odczytywania danych nie będą ich rozpoznawać, więc zespół opracował również nowy system, który to potrafi. Nić DNA przechodzi przez nanopory w specjalnie zaprojektowanym białku, które może wykryć poszczególne jednostki niezależnie od tego, czy są one naturalne, czy syntetyczne. Algorytmy uczenia maszynowego następnie dekodują przechowywane w nich informacje.
„Próbowaliśmy 77 różnych kombinacji 11 nukleotydów, a nasza metoda była w stanie doskonale odróżnić każdy z nich” – powiedział Chao Pan, współautor badania. „Struktura głębokiego uczenia w ramach naszej metody identyfikacji różnych nukleotydów jest uniwersalna, co umożliwia uogólnienie naszego podejścia do wielu innych zastosowań”.
Oprócz gęstości nowa metoda poprawia również szybkość zapisu danych, co zwykle jest dość powolnym procesem w przypadku DNA. System ten skrócił mniej więcej o połowę czas potrzebny na zapisanie informacji w DNA.
Ta praca może pomóc uczynić DNA opłacalnym systemem przechowywania danych, chociaż wciąż pozostaje jeszcze wiele do zrobienia.
Wyniki badań opublikowano w czasopiśmie Nano Letters.
➔ Obserwuj nas w Google News, aby być na bieżąco!
źródło: University of Illinois Urbana-Champaign | New Atlas