Пам'ять на штучній ДНК

Створена система, що зберігає різну інформацію в синтезованих ДНК і витягує її назад без помилок.


На 21-й Міжнародній конференції з архітектурної підтримки мов програмування та операційних систем дослідники з університету Вашингтона і фірми Microsoft, що завершилася 6 квітня в Атланті (США), представили доповідь, в якій описали систему зберігання інформації на синтезованих ДНК. Їм вдалося не тільки зберегти цим способом різні види інформації (текст, зображення, звук), а й безпомилково прочитати їх.


Молекули ДНК, створені природою для зберігання генетичної інформації живих організмів, здатні зберігати інформацію в багато мільйонів разів більш щільно, ніж всі існуючі технології для цифрових запам'ятовуючих пристроїв - жорсткі і оптичні диски, флеш-накопичувачі та ін. Крім того, ДНК може надійно зберігати дані протягом декількох століть на відміну від терміну від декількох років до двох-трьох десятиліть для інших пристроїв. За оцінками межа щільності запису на ДНК досягає 1 ексабайт на мм3 (1018 байт/мм3) при періоді напіврозпаду більше 500 років. Правда, поки доступ до записаної таким чином інформації дуже повільний (від десятків секунд до годин), так що таку систему можна використовувати тільки для архівного зберігання даних.

Кодування здійснюється за допомогою чотирьох основних будівельних блоків ДНК: аденіна (А), гуаніну (G), цитозину (C) і тиміну (T). Ці блоки відповідають цифрам коду. Оскільки їх чотири, то двійкові числа перед кодуванням переводяться в код з іншою підставою. У найпростішому випадку, може використовуватися система з підставою 4, тоді A, C, G, T зіставляються цифрам 0, 1, 2, 3. Процес кодування, наприклад, двійкової послідовності 01110001 полягає в її заміні на код Хаффмена при підставі 4 - 1301, а потім синтезі ланцюжка ДНК - СТАС. Однак таке кодування не дозволяє вберегтися від численних помилок, що виникають при синтезі ДНК, тому довелося розробити спеціальний метод кодування, що зменшує ймовірність помилки, і крім того, додати до біотехнологій схеми корекції помилок, що використовуються в комп'ютерній пам'яті.

Дослідники вирішили і проблему довільного доступу до інформації, записаної на великій кількості різних ДНК. Для цього вони навчилися кодувати в них службові дані («індекси»), що дозволяють знаходити потрібну інформацію. За допомогою полімеразної ланцюгової реакції, що використовується в молекулярній біології, вони ідентифікували потрібні індекси, а потім, використовуючи методи секвенування (визначення послідовності блоків) ДНК, читали дані.

Ця робота становить великий інтерес на тлі лавиноподібного зростання інформації в усьому світі. За прогнозами в 2017 році її кількість зросте до значення понад 16 зеттабайт (1021). Навіть за умови, що далеко не все треба зберігати, це величезне число. А найбільша щільність комерційно доступної пам'яті на стрічкових картриджах становить всього 10 гігабайт на мм3 (1 ГБ = 109 Б), навіть останні дослідження обіцяють оптичні диски з щільністю всього близько 100 ГБ/мм3. Висота потрібної стопки таких дисків буде більше відстані до Місяця. Зрозуміло, поки вартість і ефективність пам'яті на ДНК залишають бажати кращого, але дослідники вважають ці проблеми цілком вирішуваними.

За матеріалами Університету штату Вашингтон

COM_SPPAGEBUILDER_NO_ITEMS_FOUND