Х-хромосому прочитали від початку до кінця

Заповнення білих плям у геномі людини почали з Х-хромосоми, в якій зуміли заповнити прогалину в три мільйони генетичних букв.


Хоча вважається, що геном людини повністю прочитаний, в ньому досі залишаються невідомі шматки. Читання, або секвенування генома - це розшифрування послідовності молекул нуклеотидів, що становлять ланцюжок (точніше, подвійний ланцюжок) ДНК. Нуклеотидів всього чотири, позначаються вони літерами А, Т, Г і Ц, і їх цілком достатньо, щоб закодувати всі білки, з яких ми складаємося і які виконують в наших клітинах всі можливі молекулярні реакції.


Але крім послідовностей, в яких зашифровані білки, в ДНК є ділянки, які самі нічого не кодують, але регулюють активність тих, які кодують. Нарешті, в ДНК є досить великі фрагменти, які раніше називали не інакше, як сміттям. До сміттєвої ДНК відносять, наприклад, фрагменти вірусних генів, які колись вбудувалися в наш геном, та й заснули в ньому назавжди, також сміттям вважають повторювані послідовності нуклеотидів, і таких повторів може йти поспіль дуже і дуже багато (повтори не обов'язково ідентичні, вони можуть відрізнятися).

Так виглядає ділянка хромосом в районі центромери - так називають зону, в якій з'єднані дві копії хромосоми, що подвоїлася. За центромери хапаються білки, які беруть участь у клітинному поділі: причепившись до хромосом, вони розтягують їх по дочірніх клітинах. Ось центромірні ділянки хромосом зазвичай складаються з дуже великої кількості повторів. Такими зонами з масовими нуклеотидними повторами при секвенуванні людського геному часто нехтували, вважаючи, що в них немає ніякої істотної інформації.

Згодом, однак, стали з'являтися свідчення, що сміттєва ДНК не така вже сміттєва, і що навіть безглузді на перший погляд повтори можуть впливати на активність «осмислених» ділянок хромосом. Тобто всі хромосоми бажано прочитати повністю, без перепусток. Але зробити це не так просто. Коли читають геном, зони з повторами пропускають не просто так.

Взяти і прочитати всю хромосому від початку до кінця як вона є ми не можемо - існуючі методи дозволяють читати ДНК лише певної довжини, набагато менше довжини хромосоми. Тому величезну хромосомну ДНК дроблять на частини, ці частини читають, а потім отримані послідовності з'єднують разом.

Напевно, навіть без пояснень зрозуміло, наскільки непрості повинні бути тут алгоритми, які повинні знайти, де перекриваються різні шматки ДНК, де з'єднуються кінець одного фрагмента і початок іншого. Завдання ускладнюється, якщо фрагменти невеликі - чим менше фрагмент ДНК, тим складніше зрозуміти, в якому контексті він стоїть в геномі. (Для порівняння можна уявити, що вам потрібно визначити, з якого місця в незнайомому романі взято один розділ, або півголови, або абзац - або всього лише словосполучення, наприклад, «блакитне небо»: це блакитне небо може стояти в тексті багато де.) І завдання ще більш ускладнюється, якщо ми маємо справу з фрагментами, складеними з повторів.

Але якщо навчитися читати досить довгі шматки ДНК, то можна просеквенувати і зони з повторами. Власне, в цьому напрямку методи читання ДНК і розвивалися - фрагменти ДНК, які можна прочитати за раз, постійно подовжувалися. І ось дослідники з Каліфорнійського університету в Санта-Круз, Національних інститутів здоров'я та інших наукових центрів опублікували в Nature статтю, в якій пишуть, що їм вдалося повністю, від початку до кінця, прочитати людську Х-хромосому. Не заглиблюючись у подробиці, скажімо, що цього разу використовували нові варіанти методів читання ДНК, що дозволяють читати настільки великі шматки ДНК, які раніше було просто неможливо секвенувати; відповідно, були використані нові алгоритми, що дозволяють проаналізувати отримані послідовності, оцінити їх надійність і з'єднати їх разом. У підсумку вдалося закрити на Х-хромосомі велику зону з повторами довжиною приблизно 3 млн нуклеотидів, якраз в районі хромосомної центромери.


Дослідження стало частиною великого проекту, що має на меті прочитати до кінця 2020 року всі білі плями в геномі людини. Наскільки це вдасться, скоро стане ясно: у нас є хромосоми (перша і дев'ята) з повторними ділянками, які набагато більше тих, що є у Х-хромосоми; крім того, такі зони можуть відрізнятися у різних людей, і виникає питання, як відрізнити індивідуальну варіабельність від можливих похибок методу читання і який варіант потім взяти за референсний (тобто, грубо кажучи, за «середньоарифметичний», з яким потім можна буде порівнювати окремі геноми). Тим не менш, абсолютно повне секвенування геному - завдання, яке необхідно вирішувати вже зараз: послідовності генетичних букв у повторних («сміттєвих») ділянках ДНК і їх хімічні модифікації впливають на роботу генома в цілому і можуть бути пов'язані з тими чи іншими захворюваннями, молекулярно-генетичні причини яких залишаються досі невідомі.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND