Злом алфавіту геному

Джон Дж. Крамер

У цій колонці йдеться про алфавіт генома та новий метод його розширення, описаний у статті, нещодавно опублікованій у Nature Online. Зокрема, кількість букв в алфавіті геному збільшено з 4 до 6. Щоб зрозуміти значення цього розвитку, ми почнемо з огляду деяких основних молекулярних біологічних.

алфавіту

Все життя на землі, починаючи від бактерій і закінчуючи людиною, використовує однаковий генетичний код чотирьох нуклеотидних основ: тимідилової кислоти (Т), цитидилової кислоти (С), аденилової кислоти (А) та гуанілової кислоти (G). Нуклеотиди утворюють пари, так що пари A з T і C з G утворюють сходові ланцюжки ДНК, які діють як бібліотека інструкцій для збирання білків, з яких побудовані всі життєві форми. Фермент транскриптази проходить вздовж ланцюга ДНК, транскрибуючи нуклеотидну послідовність A, C, G і T в ланцюг нуклеотидів A, C, G та U "передавальної РНК" (мРНК), приймаючи уридицилову кислоту (U) місце Т у ланцюзі мРНК. Потім транскрибована мРНК читається як смужка перфорованої паперової стрічки, по 3 літери за один раз, ферментом рибосоми (див. Мою колонку № 106 "Розшифровка рибосоми" у випуску Analog за травень 2001 р.), Який за допомогою "переносна РНК" (тРНК), збирає молекулу білка.

Білок - це, по суті, одновимірна нитка амінокислот, яка складається в тривимірний об’єкт. Такі складені білки є основними будівельними елементами всього живого. Білки утворюють структурні елементи, регулятори, захисники, каталізатори, комунікатори та насоси; рушіїв і струсі всіх живих організмів. Інструкції щодо активного збирання кожного білка кодуються в ланцюжку мРНК. ДНК має основу дезоксирибози та фосфату, що підтримує чергування послідовностей букв A, C, G та T, тоді як мРНК має основу рибози та фосфату, що підтримує чергування послідовностей букв A, C, G та U. Ці структурні відмінності роблять мРНК більш рухливою лінійною послідовністю, яка не має тенденції ДНК до спіралі та утворення подвійної спіралі.

Нещодавно група з Інституту Скриппса в Ла-Хойї, штат Каліфорнія, внесла значні зміни в ці основні правила генетики, розширивши геномний алфавіт з 4 літер до 6. Вони застосували фокус із залученням хлоропластів у рослини, які мають здатність імпортувати нуклеотиди з навколишніх тканин. Ген, відповідальний за це, ідентифіковано, і група Скриппса вилучила цей ген із клітини водоростей і зросла його в ДНК бактерії кишкової палички.

Раніше група Скриппса ідентифікувала "неприродну" пару нуклеотидів, d5SICSTP (X) і dMaMTP (Y), які мають приблизно однаковий розмір і поєднуються так само, як природні нуклеотиди ДНК. У попередніх публікаціях вони продемонстрували, що ці неприродні нуклеотиди поводились як природні пари нуклеотидів, можуть посилюватися за допомогою полімеразної ланцюгової реакції (ПЛР) і можуть бути точно транскрибовані з ДНК в мРНК. У цій роботі вони ввели в геном E. coli невелике кільце ДНК (плазміду), що містить одну пару основ XY, і продемонстрували, відстежуючи процес через 24 цикли розмноження бактерій, що нормальний механізм реплікації клітин бактерій завжди викликав ДНК, що містить пару основ XY, підлягає відтворенню разом з іншим генетичним матеріалом організму. Робота була виконана лише з однією базою X-Y, доданою до клітини, але очікується, що клітини з великою кількістю таких пар основ повинні розмножуватися однаково.

Наслідком цієї роботи є те, що до алфавіту геному додано дві букви, що призводить до 6 x 6 x 6 або 216 можливих 3-літерних комбінацій слів, так що, навіть маючи додаткові надмірності та стоп-коди, багато інших можливих 3- Буквенні слова доступні для командування складання амінокислот у білки. Природний 4-літерний код геному дозволяє використовувати лише 20 амінокислот як білкові компоненти. Підраховано, що за допомогою неприродного 6-літерного коду до 172 різних амінокислот можна використовувати для складання білків, що призводить до набагато багатшого спектру можливих білків. Це має велике значення для дизайнерських препаратів, вироблених бактеріями, та ліків підвищеної різноманітності, потенції та ефективності.

Як встановлюється зв'язок між новими 3-літерними словами, що містять X та/або Y, та зайвими 152 амінокислотами? Це можлива проблема для будь-якого використання розширеного алфавіту. Зв'язок між кодами мРНК та амінокислотами здійснюється за допомогою спеціальних молекул переносної РНК (тРНК), присутніх у цитоплазмі клітини. Це досить короткі нитки РНК, які функціонують як обробники амінокислот у процесі синтезу білка. Молекула тРНК має спеціальний розділ, який містить комплементарну послідовність, яка збігається і стикується з трибуквеним кодом мРНК, а молекула тРНК закінчується послідовністю, яка приєднується до активованої форми конкретної амінокислоти, до якої трибуквенний код посилається. Ці молекули тРНК збирають призначені для них амінокислоти, транспортують їх до рибосоми та беруть участь у збиранні їх у білок.

Щоб процес працював, повинні бути доступні нові молекули тРНК, які стикуються з кодами мРНК, що містять X або Y, і вони повинні приєднуватися до одного вибраного члена розширеного набору амінокислот на іншому кінці. Навряд чи така тРНК була б присутня в природній клітині. Швидше за все, деяку ділянку ДНК клітини потрібно було б модифікувати, щоб мати послідовність, що містить нові X або Y нуклеотиди, яка змусить транскриптазу виробляти необхідні неприродні молекули тРНК. В принципі, такі послідовності ДНК можна синтезувати в лабораторії та зрощувати в клітинні ДНК, щоб забезпечити необхідну неприродну тРНК. Однак потрібно було б сконструювати отриману молекулу тРНК так, щоб вона виконувала необхідні завдання стикування та складання амінокислот. Принаймні для мене незрозуміло, що ми досить добре розуміємо молекулярну генетику, щоб виконати цю розробку.

Інша проблема полягає в згортанні білка. Точне прогнозування того, як природний білок, який є лінійним ланцюгом ланок, вибраних серед 20 природних амінокислот, складається у тривимірну молекулу, є основною проблемою молекулярної біології. У цій статті є близько 71 виділеного цифрового комп'ютерного сервера, спеціально побудованого для вирішення проблеми складання білка. Ці гігантські системи використовуються для прогнозування структури білка, але жодна з них не досягла повного успіху у виконанні цього завдання. Проблема складання білка є головним перешкодою у розробці нових препаратів та розумінні молекулярних процесів живих організмів. Тепер припустимо, що ми розширюємо поле, включаючи білки, утворені з 172 можливими амінокислотами замість лише 20. Проблема складання явно ускладнюється. Як ми, можливо, зможемо передбачити, як складаються ці нові неприродні білки, коли у нас є стільки проблем із передбаченням згортання простих природних? Як вчені люблять говорити в кінці наукових робіт, у цій галузі ще потрібно виконати багато роботи.

Отже, робота групи Скриппса є хорошим початком, але ми все ще далекі від розширення геномного алфавіту безпосередньо корисним способом. Тим не менше, ми розпочали шлях, який може призвести до багатьох нових генетичних чудес.

Це науково-фантастичний журнал, тому давайте розглянемо деякі наслідки SF для алфавіту розширеного геному. По-перше, тепер ясно, що стандартний 4-літерний геномний код, що утворює 3-літерні слова, який присутній у всіх відомих формах життя на Землі, є випадком еволюції. Є кращий код, який Природа не вибрала. Доступний 6-літерний код геному, який значно розширить спектр амінокислот, які клітини можуть використовувати для збирання білків. Життя деінде у Всесвіті могло б зупинитися на іншому стандарті, використовуючи замість цього 6 нуклеотидів. 4. Форми життя, що використовують такий алфавіт геному, можуть перевершувати життя Землі за пристосованістю, оскільки діапазон білків, які ці чужорідні клітини можуть зібрати, не буде обмежений всього 20 амінокислот.

Як варіант, технічний прогрес у цій галузі може призвести до нових генно-інженерних організмів, які використовують розширений геномний алфавіт, щоб відкрити широкий спектр нових хімічних функцій, включаючи нові ліки та нові продукти харчування. Чи ймовірно, що такі організми, що використовують неприродні білки, можуть "втекти" і спричинити напасті, смерть та руйнування? Не зовсім. Їх розмноження залежить від наявності синтетичних нуклеотидів X та Y, яких у природних клітинах мало або немає. Модифіковані природні біологічні організми, швидше за все, є більш небезпечними.

У далекому майбутньому ми можемо уявити, що нащадки людства могли взяти своє генетичне надбання під власне управління, і вони могли б перейти на новий геномний рівень, в якому їх розуми та тіла регулярно використовують 6-літерний код геному для адаптації до складних та небезпечних умов, що існують в інших частинах Всесвіту в космосі та на чужих планетах. У будь-якому випадку, у галузі молекулярної біології відкрилися нові двері.

ПЛР-підсилення 6-літерного геномного алфавіту:
"ПЛР із розширеним генетичним алфавітом", Д. А. Малишев та ін., J. Am. Хім. Soc 131, 14260-14621 (2013).

E. Coli з 6-літерним геномним алфавітом:
"Напівсинтетичний організм з розширеним генетичним алфавітом", Д. А. Малишев та ін., Природа 509, 385-388 (2014).

Нова книга Джона Крамера: наукова праця, що описує його транзакційну інтерпретацію квантової механіки, Квантове рукостискання - заплутаність, нелокальність та операції, (Springer, січень 2016 р.) Можна придбати в Інтернеті як надруковану або електронну книгу за адресою: http://www.springer.com/gp/book/9783319246406 .

SF Романи Джона Крамера: два мої важкі романи SF, Твістор і Міст Ейнштейна, нещодавно випущені як електронні книги від Book View Cafe і доступні за адресою: http://bookviewcafe.com/bookstore/?s=Cramer .

AV стовпці Інтернет: Електронні перевидання близько 177 колонок "Альтернативний погляд" Джона Г. Крамера, раніше опубліковані в Аналоговий, доступні в Інтернеті за адресою: http://www.npl.washington.edu/av .

Вихід на веб-сайт.

Ця сторінка була створена Джоном Г. Крамером 08.08.2014.