Самая главная молекула. От структуры ДНК к биомедицине XXI века - читать бесплатно онлайн полную версию книги автора Максим Франк-Каменецкий (2 От ДНК к белку) #4

2 От ДНК к белку

Как делается белок

Далекие от науки люди часто ворчат, что, мол, новые теории порождают больше вопросов, чем дают ответов. Это действительно так. Непонятно только, что здесь плохого. В действительности чем больше вопросов порождает новая теория, тем она ценнее. Ведь вопросы-то тоже новые – те, которые никому не приходили в голову, а подчас и не могли быть даже сформулированы до возникновения теории. В этом отношении модели ДНК Уотсона и Крика принадлежит, пожалуй, абсолютный рекорд. История науки едва ли знает еще теорию, которая породила бы столько новых вопросов. И каких вопросов! Они касались самой сути явления жизни. Самый первый и самый главный вопрос был поставлен уже в 1954 году известным физиком-теоретиком Георгием (Джорджем) Гамовым.

Судьба Гамова во многом похожа на судьбу Дельбрюка. Гамов прославился в 1928 году, когда создал теорию альфа-распада, основанную на идее квантового туннелирования. В 1934 году, после нескольких неудачных попыток сбежать из СССР, он наконец, став невозвращенцем из командировки в Европу, сумел покинуть родину и осел в США. Как и в Германии при Гитлере, жизнь в СССР при Сталине стала к тому времени невыносимой. Ближайшие друзья Гамова, блестящие физики Матвей Бронштейн и Лев Ландау, были арестованы во время Большого террора 1937–1938 годов. Бронштейн был расстрелян, а Ландау чудом спасся, проведя год в застенках НКВД в качестве «немецкого шпиона». Ландау был освобожден в значительной степени благодаря беспрецедентному и отчаянно смелому заступничеству другого великого физика, Петра Капицы. (Капица и Ландау впоследствии были удостоены Нобелевской премии.) Если бы Гамов не сбежал, он наверняка тоже попал бы в жернова НКВД.

В 1948 году Гамов выдвинул теорию, согласно которой в начале мироздания был гигантский взрыв, произошедший около 14 миллиардов лет назад. Теория утверждала, что от начального взрыва должно было дойти до наших дней электромагнитное излучение, и предсказывала спектр этого излучения. С легкой руки советского астрофизика И. С. Шкловского предсказанное Гамовым излучение получило название «реликтовое». Поначалу теория Большого взрыва казалась слишком экстравагантной, и мало кто в нее поверил. Но в 1965 году два американских радиоинженера, Роберт Вильсон и Арно Пензиас, случайно обнаружили излучение, равномерно поступающее со всех концов Вселенной, которое обладало всеми свойствами предсказанного Гамовым реликтового излучения. Теория Большого взрыва получила полное признание.

В 1954 году, вскоре после открытия двойной спирали ДНК, Гамов вновь выступил с кардинально новой идеей, на сей раз в области биологии. Как известно, рассуждал Гамов, основными рабочими молекулами в клетке являются белки. Всеми химическими превращениями в клетке ведают белки-ферменты. Почти весь строительный материал клетки также белковой природы. Даже хромосомы лишь наполовину состоят из ДНК, а наполовину – из белка. Значит, работа клетки определяется набором белков в ней.

Отдельная молекула белка может содержать от десятков до нескольких сотен мономерных звеньев. Но если взять все белки клетки и расчленить их на отдельные звенья, то окажется, что наберется всего 20 типов аминокислот. Собственно, разновидностей аминокислот как химических соединений может быть бесчисленное множество, и химики могут, в принципе, синтезировать любые аминокислоты. Но живая природа использует только 20 вполне определенных аминокислот, которые поэтому получили название природных, или канонических. Этот набор из 20 аминокислот абсолютно одинаков, универсален для всей живой природы на Земле. Возьмете ли вы самую ничтожную букашку или самого мудрого корифея, вы обнаружите в них один и тот же набор аминокислот. Чем же отличается букашка от корифея? Отличие заключается в том, какие цепочки образуют аминокислоты. Иными словами, оно сводится к последовательностям аминокислотных остатков в белках.

Чем же определяются последовательности белков? Ответ классической генетики на такой вопрос звучал очень формально: эти последовательности задаются генами. Как именно? Ничего вразумительного классическая, или, как ее еще часто в достаточной степени справедливо называли, формальная, генетика ответить на этот вопрос не могла.

Вот на этот главный вопрос, утверждал Гамов, теперь после работы Уотсона и Крика, имеется четкий и ясный ответ. Аминокислотные последовательности всех белков клетки определяются последовательностью звеньев в одной из двух комплементарных цепочек ДНК. Эти звенья ДНК, называемые нуклеотидами, бывают, как уже говорилось в предыдущей главе, четырех типов (А, Т, Г и Ц). Таким образом, информация о последовательности 20 типов аминокислотных остатков в белках записана в ДНК в виде последовательности нуклеотидов четырех типов. Значит, провозгласил Гамов, клетка должна обладать словарем, переводящим четырехбуквенный текст ДНК в двадцатибуквенный текст белков! Так родилась идея генетического кода.

Тут же возник целый каскад вопросов. Каким образом код реализуется, т. е. где в клетке и при помощи чего происходит перевод ДНКового текста на белковый язык? Как получается, что длинный нуклеотидный текст ДНК дает в конечном счете сравнительно короткие белковые цепи? Наверное, ДНКовый текст состоит из отдельных «предложений», каждое из которых отвечает одному белку? Так, может быть, эти «предложения» и есть гены классической генетики? А что между ними? Что играет роль «точек», разделяющих «предложения»? Иными словами, чем отличаются в физическом, химическом, т. е. в молекулярном, смысле сами гены от промежутков между ними? Ну и наконец, каков же он, генетический код, этот словарь живой клетки?

Небольшая по численности, разбросанная по разным лабораториям мира, но преисполненная боевого духа армия ученых приступила к штурму новых высот. Вел незримые полки Фрэнсис Крик. Он был в те годы признанным лидером среди молекулярных биологов. За период с 1954 по 1967 год на все основные вопросы были получены ответы. Совокупность этих ответов впоследствии стали называть центральной догмой молекулярной биологии. Не все из полученных ответов, казавшихся найденными раз и навсегда, выдержали испытание бурных 1970-х годов. И все же эти ответы, хотя они и перестали быть догмой, и по сей день являются фундаментом, на котором строится все здание молекулярной биологии.

Прежде всего никаких особенностей в химическом строении ДНК, которые отличали бы одни участки от других, обнаружено не было. По всей своей длине молекула ДНК представляет собой непрерывную последовательность нуклеотидных звеньев четырех типов: А, Т, Г и Ц. В этом смысле ДНКовый текст отличается от типографского текста, в котором есть точки, запятые, промежутки между словами. ДНКовый текст – это непрерывная последовательность букв. Роль «знаков препинания» играют сами же буквы. Это особые последовательности нуклеотидов, расположенные между участками, последовательности которых отвечают аминокислотным последовательностям в белках. Отдельный такой участок стали называть геном.

Итак, ген – это часть ДНКового текста, которая содержит информацию об аминокислотной последовательности одного белка. Теперь «элементарная» частица наследственности, о которой спорили когда-то Дельбрюк и Тимофеев-Ресовский, приобрела совершенно конкретный молекулярный, атомный смысл. Оказалось, что ген – вовсе не «неделимая частица», а построен из сотен нуклеотидов. Вот нуклеотиды – это уже действительно элементарные частицы генетического материала – мономерные звенья полимерной молекулы ДНК.

Как же ген порождает белок? Это происходит в два этапа. На первом этапе, который получил название транскрипции, специальный фермент узнает последовательность нуклеотидов, расположенную между генами (эту последовательность называют промотором), и, двигаясь вдоль гена, снимает с него копию в виде молекулы РНК.

Молекула рибонуклеиновой кислоты, что и скрывается за сокращением РНК, весьма сходна по своему химическому строению с молекулой дезоксирибонуклеиновой кислоты, т. е. ДНК. Она тоже представляет собой полимерную цепочку, построенную из мономерных звеньев – нуклеотидов. Как и ДНК, РНК строится из нуклеотидов четырех типов. Их химические формулы, которые, следует признать, выглядят довольно устрашающе, приведены на рис. 6. Чем отличаются нуклеотиды ДНК от нуклеотидов РНК? Для Ц, А и Г это отличие состоит только в том, что в каждом из них самая нижняя и самая правая ОН-группа заменяется в ДНК на Н (отсюда и приставка «дезокси»). Случай уридинового нуклеотида (У) несколько сложнее, так как для него при переходе к ДНК не только происходит замена ОН на Н, но и в шестичленном кольце водород в верхней группе СН заменяется на метильную группу СН₃. Этим и объясняется отличие в названиях РНКового нуклеотида (уридиновый) и ДНКового (тимидиновый), хотя они очень похожи друг на друга и оба служат партнерами А при образовании комплементарных пар.

Рис. 6. Полные химические формулы мономерных звеньев РНК-нуклеотидов (известных также под названием нуклеозидмонофосфатов. сокращенно НМФ). Сверху приведены пиримидиновые нуклеотиды (У и Ц). а снизу – пуриновые (А и Г]. Нуклеотиды, входящие в состав ДНК, отличаются тем, что у них вместо правой нижней группы ОН стоит просто Н. Поэтому ДНКовые нуклеотиды называют дезоксинуклеозидмонофосфатами и обозначают как дНМФ. Кроме того, в ДНК вместо уридинового нуклеотида входит тимидиновый, у которого верхняя СН-группа в кольце заменена на группу СНН₃

Копирование гена происходит по тому же правилу комплементарности, по которому идет репликация ДНК, только роль, которую играет в ДНК Т, в РНК играет У. Синтез РНК ведется по одной из двух комплементарных цепей гена. Фермент, ведущий синтез, т. е. осуществляющий процесс транскрипции, называется РНК-полимеразой.

Итак, РНК-полимераза снимает с участка длинной молекулы ДНК (с гена) копию в виде матричной РНК (мРНК). Этот РНКовый отпечаток гена используется на втором этапе синтеза белка, в процессе, получившем название трансляция. Собственно, этот этап является решающим, именно здесь вступает в силу генетический код.

Процесс трансляции очень сложен, в нем принимает участие множество действующих лиц. Главное из них – рибосома. Рибосома – это сложнейший агрегат, построенный из полусотни различных белков и молекулы РНК. Имеется в виду не та РНК, которая служит матрицей для синтеза белка на рибосоме, а другая, рибосомальная РНК (рРНК), которая является неотъемлемой частью рибосомы. Чтобы эти два класса РНК отличать друг от друга, рибосомальную РНК обозначают как рРНК, а матричную – мРНК. Рибосома – это молекулярный компьютер, переводящий тексты с нуклеотидного языка ДНК и РНК на аминокислотный язык белков. Этот узкоспециализированный компьютер работает только по одной программе, название которой – генетический код.

Генетический код

На рубеже 1950-х и 1960-х годов Фрэнсис Крик и его сотрудники выяснили основные свойства генетического кода. Было доказано, что код триплетный, т. е. одной аминокислоте соответствует последовательность из трех нуклеотидов на мРНК. Эта тройка нуклеотидов была названа кодоном. Текст, записанный в мРНК, считывается рибосомой последовательно, кодон за кодоном, начиная с некоторого начального инициирующего кодона по следующей схеме:

На этой схеме а₀, а₁… обозначают аминокислотные остатки белка. Напомним, что их может быть 20 типов. А сколько типов кодонов? Легко подсчитать, что всего существует 4³ = 64 различных кодона. Так что же, не всякому кодону соответствует аминокислота? Да, не всякому.

Но таких бессмысленных, или незначащих, кодонов очень немного, и они выполняют специальную функцию – служат стоп-сигналами, обозначают конец белковой цепи. Поэтому их еще называют терминирующими кодонами. Подавляющее же большинство кодонов соответствует какому-либо аминокислотному остатку. А это значит, что код вырожден – большинству, если не всем, аминокислотным остаткам должно отвечать несколько кодонов.

К 1961 году стало ясно, что код триплетный, вырожденный и неперекрывающийся (т. е. считывание происходит кодон за кодоном) и что он содержит инициирующие и терминирующие кодоны. Дело было за тем, чтобы установить соответствие каждого аминокислотного остатка конкретным кодонам и узнать, какие кодоны обозначают начало и конец синтеза белковой цепи. Было совершенно ясно, что именно для этого требуется. Нужно «только» прочесть параллельно два текста – ДНКовый (или РНКовый) текст гена и аминокислотный текст соответствующего этому гену белка. Затем сличить эти два текста – и дело сделано.

Вспомним, что именно так были когда-то расшифрованы египетские письмена. Но беда в том, что если белковые последовательности к этому времени умели расшифровывать, то ни последовательности ДНК, ни последовательности РНК читать не умели. Поэтому пришлось пойти по иному пути.

Представьте себе, что вместо Розеттского камня, на котором один и тот же текст был написан египетскими иероглифами и по-гречески, откопали бы во время наполеоновского похода в Египет живого древнего египтянина. Тогда не потребовался бы гений Шампольона, чтобы составить французско-древнеегипетский словарь. Достаточно было бы показывать египтянину различные предметы, а он рисовал бы соответствующие иероглифы.

Именно этим принципом дешифровки кода и воспользовались американский биохимик и генетик из Национального института здравоохранения Маршалл Ниренберг и его немецкий постдок[1] Генрих Маттеи. Ведь клетки-то знают код! Значит, надо предложить им распознавать разные последовательности нуклеотидов, лишь бы было точно известно, что это за последовательности. К этому времени как раз научились синтезировать кое-какие искусственные РНК (но отнюдь еще не любые!). Ниренберг и Маттеи использовали не живые клетки, а клеточные экстракты, которые сохраняли способность синтезировать белок на РНК. Эти экстракты не умели, разумеется, многого другого, что умеет делать клетка, но важно лишь одно – они были способны синтезировать белок по внесенной извне РНК. Такие экстракты назвали бесклеточной системой.

Ниренберг и Маттеи получили экстракт из кишечной палочки и добавили к нему искусственную РНК, состоящую только из урацилов. Так бесклеточной системе был задан первый вопрос: «Какой аминокислоте соответствует кодон УУУ?» Ответ был однозначен: «Кодону УУУ отвечает фенилаланин». Этот ответ, о котором Ниренберг сообщил на Международном биохимическом конгрессе в Москве в 1961 году, произвел настоящую сенсацию. Путь к расшифровке кода был открыт!

Очень быстро удалось сделать подобный перевод для многих аминокислот. Однако определять последовательность нуклеотидов в искусственных мРНК было довольно трудно. В то время еще не умели синтезировать даже короткие фрагменты с заданной последовательностью. Умели лишь получать полинуклеотиды со случайной последовательностью из смеси мономеров, да и то не из любой смеси. Начали думать, как попытаться иными способами расшифровывать кодоны. Но неожиданно произошел новый прорыв, и ситуация резко изменялась.

Мы видели, что у истоков проблемы кода стоял физик, общие свойства кода были выяснены генетическими методами, после чего за дело взялись биохимики. Окончательно проблема была решена, когда на помощь биохимикам пришли химики-синтетики. Главный вклад внес Хар Гобинд Корана.

К 1965 году Корана научился синтезировать короткие фрагменты РНК с заданной последовательностью – сначала двойки (динуклеотиды), а потом тройки (тринуклеотиды). Из таких двоек и троек с помощью ферментов синтезировали длинные полинуклеотиды, в которых эти двойки или тройки повторялись много-много раз. Затем полинуклеотиды со строго определенной и известной последовательностью добавляли в бесклеточную систему и определяли их соответствие белковым цепям.

А к 1967 году расшифровка генетического кода была окончательно завершена. Этот код изображен на рис. 7. В центральном круге таблицы обозначены первые нуклеотиды кодонов, в следующем – вторые, а затем – третьи. На внешней части круга указаны соответствующие кодонам аминокислотные остатки.

Символ Тер обозначает терминирующие кодоны. А где же инициирующие кодоны? Специальных инициирующих кодонов не существует. Эту роль в определенных условиях играет кодон АУГ, обычно отвечающий аминокислоте метионину.

Даже беглого взгляда на рис. 7 вполне достаточно, чтобы заметить определенную закономерность. Вырожденность кода носит явно не случайный характер; то, какой аминокислоте будет соответствовать данный кодон, определяют главным образом два первых нуклеотида. Каков третий нуклеотид – не так уж важно, т. е., хотя код и триплетный, главную смысловую нагрузку несет дублет, стоящий в начале кодона. Иными словами, код квазидуплетный.

Рис. 7. Генетический код. Первая буква кодона расположена в центральном круге, вторая – в первом кольце и третья – во втором. В наружном кольце записаны сокращенные названия аминокислот

Эта главная особенность кода была замечена еще на самой ранней стадии его расшифровки. Конечно, дублетами нельзя закодировать все 20 аминокислот, так как различных дублетов может быть всего 4² = 16. Поэтому третий нуклеотид в кодоне должен нести некоторую смысловую нагрузку.

Существует, однако, правило, которому код подчиняется почти строго. Чтобы его сформулировать, нам надо вспомнить, что четыре нуклеотида – урациловый, цитозиновый, адениновый и гуаниновый – принадлежат по строению к двум разным классам – пиримидиновому (У и Ц) и пуриновому (А и Г) (рис. 6). Так вот, правило вырожденности кода можно сформулировать следующим образом: если два кодона имеют два одинаковых первых нуклеотида и их третьи нуклеотиды принадлежат к одному классу (пуриновому или пиримидиновому), то они кодируют одну и ту же аминокислоту.

Взгляните еще раз на таблицу кода (рис. 7), и вы убедитесь, что это правило выполняется очень хорошо. Но два исключения все же существует. Если бы сформулированное выше правило выполнялось совсем строго, то кодон АУА должен был бы отвечать метионину, а не изолейцину, а кодон УГА – триптофану, а не быть сигналом окончания синтеза.

Универсален ли код?

«Но позвольте, – вправе спросить читатель, – ведь бесклеточная система получена из конкретного организма. Где гарантия, что опыты по расшифровке кода в бесклеточной системе, взятой из другого организма, дадут тот же результат?» Вопрос совершенно резонный. И естественно, он возник уже в ходе работ по расшифровке кода.