Тільки чотири нуклеотиди

Група фізиків з ФІАН, МФТІ і МДУ розробила новий метод порівняння двох молекул РНК. Його несподіваним наслідком стала гіпотеза про статистичний механізм виділеності використовуваного природою «чотирибуквеного нуклеотидного алфавіту».


Для еволюційної біології питання порівняння ДНК і РНК послідовностей - один з ключових, зокрема, він дозволяє судити про те, наскільки далеко в еволюційному сенсі розійшлися один від одного два розглянутих гена, і які гени можуть бути їх спільними предками. І якщо питання порівняння двох послідовностей молекул дезоксирибонуклеїнової кислоти (ДНК) з алгоритмічної точки зору не викликає принципових труднощів, то завдання побудови алгоритму порівняння молекул рібонуклеїнової кислоти (РНК) наштовхується на серйозні перешкоди і незважаючи на значний прогрес у цій області, досі повністю не вирішено. Справа в тому, що молекули РНК містять нетривіальну вторинну структуру типу «» наклепного листа «» або кактуса «». Сергій Нечаєв (ФІАН), Михайло Тамм (МДУ) і Ольга Вальба (МФТІ) пропонують метод порівняння РНК, що враховує як порядок слідування нуклеотидів, так і комбінаторику, обумовлену тим, що молекула РНК може утворити різні кактусоподібні структури.


«» Молекули ДНК і РНК - це нерегулярні послідовності, утворені чотирма типами «» букв «» - нуклеотидів. Завдання порівняння або, як кажуть, вирівнювання «» послідовностей молекул ДНК, полягає в знаходженні максимальної загальної підпослідовності двох молекул. Ця підпослідовність не обов'язково складається з літер, що йде безпосередньо один за одним, вони можуть йти і з пробілами - делеціями. Завдання про порівняння двох послідовностей РНК ми звели до завдання про обчислення вільної енергії комплексу двох взаємодіючих неоднорідних ланцюгів, кожен з яких може утворювати кактусоподібну структуру ", - розповідає керівник роботи, доктор фіз.-мат.наук Сергій Нечаєв.

"Уявіть собі, - пояснює Нечаєв, - що в експерименті виникла необхідність передбачити вторинну структуру синтезованої молекули РНК за послідовністю нуклеотидів. Наш алгоритм дозволяє передбачити оптимальну з точки зору статистичної фізики вторинну структуру молекули РНК, яка буде відповідати мінімуму вільної енергії. При цьому ми намагалися по можливості залишатися в рамках статистичної фізики і уникати евристичних міркувань, отриманих лише на основі аналізу експериментальних даних «».

Наслідком розробленого підходу стало досить несподіване спостереження. Виявилося, що якщо не обмежуватися тільки чотирма типами нуклеотидів (аденін, цитозин, гуанін і урацил), присутніми в найпростішій моделі РНК з випадковою первинною структурою, а розглянути гіпотетичний "" алфавіт "" з довільним числом "" букв "", с, то "" вирівнювання "" молекул РНК при  4 і при &gс "&с-&gс.

"Алфавіт, який використовує природа, - говорить Сергій Нечаєв, - виділений тим, що при числі букв, меншому або рівному чотирьом, укладання дуже довгої молекули РНК практично не містить перепусток, тобто їх частка прагне до нуля, і кожному нуклеотиду знайдеться компліментарний. У разі ж, коли число літер більше чотирьох, у дуже довгому ланцюгу РНК завжди присутня велика кількість перепусток (їх число можна порівняти з довжиною всього ланцюжка). Число "" чотири "є прикордонним: це максимальне число букв, при якому дуже довга випадкова РНК може утворювати «» досконалу «» вторинну структуру, тобто у кожного нуклеотиду в послідовності знайдеться компліментарний «».

Питання про те, чому природа використовує саме 4 типи нуклеотидів, - один з найважливіших у біології та генній інженерії. Як припускають дослідники з ФІАН, МДУ і МФТІ, з точки зору статистичної фізики випадкових гетерополімерів зі складною ієрархічною вторинною структурою типу РНК, число «» чотири «» є статистично виділеним серед усіх можливих алфавітів при вивченні проблеми вирівнювання. Для "лінійної" "молекули ДНК, де кількість нуклеотидів також дорівнює чотирьом (аденозин, цитидин, гуанозин і тимідин), вона вже нічим не виділена. Це спостереження може розглядатися як непрямий аргумент на користь гіпотези «» РНК-миру «», згідно з якою на початковому етапі виникнення життя на Землі існували тільки РНК, а ДНК з'явилися вже в результаті їх еволюції.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND