Dodanie nowych liter do oznaczeń DNA ułatwi przechowywanie danych

Nowy przełom może znacznie ułatwić przechowywanie danych DNA – dodanie nowych liter pozwoli zaoszczędzić miejsce i przyspieszy prace.

Gęstość danych DNA
fot. Nano Lett | 2022

Jak w przypadku większości rzeczy, naturalny system przechowywania danych, DNA, znacznie przewyższa wszystko, co stworzyliśmy. Teraz naukowcy z University of Illinois Urbana-Champaign podwoili i tak już niesamowitą pojemność pamięci, dodając dodatkowe litery do „alfabetu” DNA i opracowali nowy sposób jego odczytywania.

DNA w naturalny sposób składa się z kombinacji czterech nukleozasad: adeniny, guaniny, cytozyny i tyminy. Reprezentowane przez litery A, G, C i T, te zasady grupują się w różne sekwencje, tworząc plany dla każdego żywego organizmu. Ten system przechowywania informacji jest niewiarygodnie gęsty, z jednym gramem DNA zdolnym do przechowywania do 215 petabajtów (215 milionów GB) danych.

To oczywiście sprawia, że ​​jest to bardzo atrakcyjne potencjalne rozwiązanie do przechowywania ogromnych ilości danych, które współczesne społeczeństwo produkuje codziennie – cała zawartość Internetu może zmieścić się w pudełku po butach pełnym DNA. I jakby ta pamięć nie była wystarczająco gęsta, naukowcy z nowego badania znaleźli sposób na jej podwojenie.

Wraz ze zwykłymi A, G, C i T zespół skutecznie dodał dodatkowe siedem „liter” do alfabetu DNA. Przybierają one formę chemicznie zmodyfikowanych nukleotydów, otwierając bardziej zróżnicowane kombinacje, które umożliwiają przechowywanie większej ilości informacji w tej samej przestrzeni fizycznej.

„Wyobraź sobie alfabet angielski” – powiedziała Kasra Tabatabaei, współautorka badania. „Gdybyś miał tylko cztery litery, mógłbyś stworzyć znacznie mniej słów. Gdybyś miał pełny alfabet, mógłbyś tworzyć nieograniczone kombinacje słów. Tak samo jest z DNA. Zamiast konwertować zera i jedynki na A, G, C i T, możemy zamienić zera i jedynki na A, G, C, T i siedem nowych liter w alfabecie magazynu.

Oczywiście dodanie dodatkowych nukleotydów oznacza, że ​​istniejące systemy do odczytywania danych nie będą ich rozpoznawać, więc zespół opracował również nowy system, który to potrafi. Nić DNA przechodzi przez nanopory w specjalnie zaprojektowanym białku, które może wykryć poszczególne jednostki niezależnie od tego, czy są one naturalne, czy syntetyczne. Algorytmy uczenia maszynowego następnie dekodują przechowywane w nich informacje.

„Próbowaliśmy 77 różnych kombinacji 11 nukleotydów, a nasza metoda była w stanie doskonale odróżnić każdy z nich” – powiedział Chao Pan, współautor badania. „Struktura głębokiego uczenia w ramach naszej metody identyfikacji różnych nukleotydów jest uniwersalna, co umożliwia uogólnienie naszego podejścia do wielu innych zastosowań”.

Przechowywanie danych DNA przy użyciu naturalnych i chemicznie modyfikowanych nukleotydów
Przechowywanie danych DNA przy użyciu naturalnych i chemicznie modyfikowanych nukleotydów | fot. Nano Lett | 2022

Oprócz gęstości nowa metoda poprawia również szybkość zapisu danych, co zwykle jest dość powolnym procesem w przypadku DNA. System ten skrócił mniej więcej o połowę czas potrzebny na zapisanie informacji w DNA.

Ta praca może pomóc uczynić DNA opłacalnym systemem przechowywania danych, chociaż wciąż pozostaje jeszcze wiele do zrobienia.

Wyniki badań opublikowano w czasopiśmie Nano Letters.

➔ Obserwuj nas w Google News, aby być na bieżąco!

źródło: University of Illinois Urbana-Champaign | New Atlas