Штучний інтелект шукає «ліву» ДНК

Ймовірність перетворення людської ДНК на лівозакручену форму оцінили за допомогою нейромереж.


ДНК - це двозначна спіраль. Два ланцюги, які складаються з безлічі нуклеотидів, з'єднані між собою водневими зв'язками. Самі нуклеотиди - теж складні молекули, до складу яких входять азотисті підстави аденін, гуанін, тимін і цитозин, ті самі чотири літери генетичного коду А, Т, Г і Ц. Саме водневі зв'язки між ними тримають обидва ланцюги разом, причому водневі зв'язки утворюються за принципом комплементарності, тобто навпроти А в одному ланцюгу буде стояти Т, а навпроти Г - Ц.


Просторова структура ДНК залежить від фізико-хімічних взаємодій атомів і груп атомів всередині самої молекули і від їх взаємодій з середовищем - адже ДНК існує не у вакуумі, навколо неї вода, іони тощо. Взаємодії ці не жорсткі, умови середовища можуть бути різні, і тому у ДНК є кілька просторових форм. Зазвичай говорять про В-ДНК - закручену вправо спіралі двох ланцюжків нуклеотидів з певними параметрами; ДНК у формі В зустрічається найчастіше. При цьому вона може перетворюватися на Z-ДНК, головна особливість якої в тому, що вона - лівозакручена.

ДНК - величезна молекула, і її різні ділянки можуть існувати в різних просторових формах. Тобто, наприклад, форма Z може виникати там і посеред форми В. З ДНК постійно працюють різноманітні білки, які синтезують нові ланцюги ДНК або ж зчитують інформацію з генів в молекули РНК, щоб ті потім послужили інструкцією для складання білкових молекул. Властивості просторової структури впливають на її біологію: перехід з В-форми в Z-форму впливає на активність генів, тобто на кількість РНК, але також це впливає на ймовірність мутацій - Z-DNA хімічно менш стабільна і більш схильна до мутацій; навесні ми писали, що противірусний захист у клітці включається у відповідь на появу Z-ДНК.

Щоб краще розуміти, що відбувається в клітці, бажано вміти передбачати, які зони ДНК найбільше схильні ставати «лівими». Властивості тієї чи іншої ділянки ДНК залежать від послідовності нуклеотидів, від того, якого роду генетичний текст в них записаний. Аналізуючи послідовність ДНК, можна з певною точністю вгадати, де ДНК з більшою охотою переходить у Z-форму.

Але так можна виявити далеко не всі зони, схильні до Z-форми. Щоб краще їх розпізнати, потрібно ще враховувати і активність генів, і ряд інших параметрів. Співробітники Національного дослідницького університету «Вища школа економіки» (НДУ ВШЕ) спробували вирішити це завдання за допомогою штучного інтелекту; результати експерименту описані в Scientific Reports. Нейронні мережі трьох типів - свіркова (яку зазвичай використовують для розпізнавання образів), рекуррентна (яка використовується для розпізнавання тексту) і їх гібрид - вчили бачити Z-ДНК на великому масиві біологічних даних.

Всього в експерименті була 151 модель нейромереж, з них одна, що відноситься до рекуррентного типу, показала найкращий результат. І далі цією нейромережею прочесали вже весь людський геном - для кожного окремого нуклеотиду або групи нуклеотидів нейромережа показувала, з якою ймовірністю він може опинитися в Z-формі.

У перспективі нові дані повинні сильно допомогти всім, чиї дослідження тією чи іншою мірою стосуються молекулярної біології - оскільки, як було сказано, перетворення ДНК з однієї форми в іншу і назад впливають на активність генів, а від активності генів у нас залежить все життя.


За матеріалами прес-служби НДУ ВШЕ.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND