Часть 1. Или часть-матчасть

Введение

В чем только не соревновались мы в детстве с одноклассниками! Кто первым съедет верхом на стуле по лестнице с третьего этажа до первого, кто сможет на большее время задержать дыхание, кто быстрее всех произнесет английский алфавит и даже кто сможет с первого раза без единой запинки произнести «дезоксирибонуклеиновая кислота». К сожалению, ровно на этом знания генетики у 11 «Л» класса и заканчивались.

Последние 6 лет, которые я с переменным успехом занимаюсь популяризацией науки, в многочисленных разговорах с читателями блога LabMouse вырисовалась совсем нерадостная картина: многим из них повезло не больше. Я точно знаю, что в мире есть совершенно потрясающие школьные учителя биологии (и мне очень повезло быть лично знакомой с несколькими из них), которые любят свой предмет, постоянно обновляют собственные знания, могут заинтересовать ученика и даже помочь ему найти любимую профессию. Но если вдруг по этой или иной причине вам кажется, что перед чтением этой книги вам стоило бы освежить свои знания генетики, то первая глава книги написана специально с этой целью. Если же знания биологии постоянно находятся в вашей активной памяти, то главу 1 вы можете бегло пролистать. Однако не пропускайте ее совсем уж полностью. Среди привычно знакомой вам информации я постаралась встроить немного интересных данных, полученных учеными за последние годы.

Попробуйте провести эксперимент: задайте произвольному человеку вопрос «что такое ГМО?». Я готова поспорить, что большинство из вас получит ответ, который можно сформулировать как-то так: ученые пошли против природы и специально изменили гены таких организмов. Это убеждение невероятно популярно. И в следующих нескольких главах мы поговорим о том, сколько же в нем правды.

Глава 1, в которой мы вспоминаем, как все устроено

Вот ведь что странно. Когда физик пишет популярную книгу об элементарных частицах, от него никто не требует начинать с объяснения того, что такое молекула, атом, атомное ядро. Считается, что все это и так знают. Но любая попытка писать о современных проблемах генетики, не объяснив сначала, что такое гены и хромосомы, решительно пресекается редактором и рецензентами.

Нет, – говорят они, – так непонятно.

Но как же, ведь и устройство ДНК, и законы Менделя учат в школе!

Это ничего не значит. Мало ли чему учат в школе. Вот я, например, – говорит редактор, – понятия не имею о том, что такое гетерозигота и чем она отличается от гомозиготы.

Но ведь чтобы это все объяснить, – начинаю оправдываться я, – нужно написать отдельную большую книгу вовсе не о том, о чем хочу написать я.

А вы коротенько, в первой главе объясните все фундаментальные понятия, а потом уж пишите, что хотите про ваших кошек.

П. М. Бородин. Кошки и гены

Честно говоря, с редактором Павла Михайловича я скорее согласна. Уж лучше в самом начале договориться, что вы планируете говорить об одном и том же, чем очень долго спорить каждый о своем. Эта мысль возникла у меня впервые пару лет назад, после многочасовых споров о том, почему традиционная селекция ничем не безопаснее[5] генной модификации. И только пару километров сообщений спустя случайно выяснилось, что под той самой традиционной селекцией мы с собеседником понимаем совсем разные вещи. Но об этом я предлагаю поговорить в отдельной главе. Пока же последуем мудрому совету и… будем говорить о пицце.

1.1. Говорить о пицце

Вы умеете готовить пиццу? Я – нет. Но я попробую пофантазировать, что все-таки умею. По традиции тесто следует готовить самостоятельно. Смешать муку из твердых сортов пшеницы с водой, дрожжами, солью и свежевыжатым оливковым маслом, а затем по всем правилам завести. Собрать на собственном огороде за домом самые спелые и ароматные томаты и приготовить томатный соус. За сыром нужно отправиться в… хлев – будущий сыр надо сначала добыть из упрямой козы.

Сколько же деталей! Хорошо бы подробно записать их все для будущих поколений. Создать настоящую энциклопедию о пицце с тысячами рецептов мировых кухонь и новомодных экспериментов от шеф-поваров известных ресторанов. Вот это вышла бы книга!

А ведь подобной кулинарной книгой запаслась каждая клетка нашего тела. Да и не только нашего – все живые существа, от помидора до бактерии, живущей на его спелом боку, таскают с собой такую энциклопедию. Правда, готовить по ней нужно не пиццу, а много куда более интересных вещей.

Мы зовем эту книгу геномом. Геном живого существа – это кулинарная книга, генеральный строительный план, по которому будет изготовлена каждая деталь и собран сложный механизм – живое существо. Но что представляет собой этот план?



Как кулинарная книга состоит из отдельных глав – рецептов, так наш геном состоит из генов[6]. Как повар читает рецепт перед началом готовки, так специальные молекулярные «машинки» внутри каждой клетки читают информацию с генов и переводят ее в молекулы РНК. Прочитав кулинарный рецепт, повар начинает готовить блюдо. Например, соус для пиццы. По прочитанному с гена «рецепту» механизмы клетки готовят белок[7]. Тесто, сыр, соус и, наконец, сама пицца – это все уже не буквы на бумаге. Это вещественное и съедобное, результат работы повара. Результат работы «молекулярной кухни» внутри клетки – аминокислотные последовательности и сложенные из них впоследствии белки.

Представьте дальше, что нашу энциклопедию о приготовлении пиццы мы разослали в разные уголки мира. В ресторанчике на Крайнем Севере вряд ли станут готовить пиццу по рецепту с тропическими фруктами. А в ресторане в самом сердце австралийской пустыни повару не по возможностям пицца с ломтиками свежего лосося. Хотя книга рецептов и будет одинакова на каждой кухне, но готовить из нее повара будут по разным рецептам. Так и каждая клетка тела любого живого организма содержит одинаковый[8] геном, но в каждой клетке читается только та часть генов, что нужна именно этой клетке для выполнения ее функций.

Пожалуй, пора перейти от абстрактных сравнений к скучным деталям.

• Геном – это совокупность всех молекул ДНК (дезоксирибонуклеиновой кислоты) или РНК (рибонуклеиновой кислоты, как, например, у некоторых вирусов), которые расположены в клетке.

• В живых клетках ДНК не «разбросана» просто так, а уложена в аккуратные структуры, в поддержке которых участвуют специальные белки.

• Каждая отдельная молекула ДНК с прикрепленными к ней белками называется хромосомой. К примеру, геном человека состоит из 46 хромосом, расположенных в ядре клетки, и множества небольших молекул ДНК, которые находятся в митохондриях[9].

• В геноме бактерий, как правило, всего одна хромосома и несколько очень маленьких молекул ДНК, которые называются плазмидами.

Запомните это слово. Ведь благодаря механизму обмена плазмидами, о котором мы еще поговорим далее, бактерии умеют становиться настоящими суперзлодеями и приобретать антибиотикорезистентность. Но для нас гораздо интереснее то, что благодаря этому же механизму ученые смогли поставить бактерии на службу во благо человечества. Плазмиды – один из главных инструментов генетической модификации!

Геномы растений и вовсе космос. Без пол-литра крепкого чая с ними разобраться никаких шансов. Одна только простая и привычная пшеница способна свести с ума любого неподготовленного биолога сложностью устройства своего генома[10]. А некоторые растения и вовсе обзавелись в процессе эволюции тысячами хромосом! И это я еще промолчу, что в клетках растений есть хлоропласты со своими собственными геномами. Очень хорошо представляю, как легко запутаться во всем этом с ходу и забросить эту книжку как можно дальше. Поэтому мы начнем по порядку.

1.2. По порядку

В основе всего атомы. Если вернуться к аналогии про приготовление пиццы, то атомы будут отдельными крупинками муки.

Все в мире состоит из атомов. Атомы могут соединяться друг с другом, образуя молекулы. Сами атомы настолько малы, что без применения сложных технических подходов разглядеть их невозможно[11] даже в самый сильный микроскоп. Но можно, например, пытаться увидеть не саму молекулу, а восстановить ее вид по «теням», которые отбрасывают ее атомы в рентгеновских лучах, – этот метод носит название «рентгеноструктурный анализ». Еще молекулу можно поместить в магнитное поле, затем подвергнуть действию других магнитных полей, считать сигналы поведения атомов, возмущенных таким безобразием, и проанализировать их при помощи компьютера, воссоздав трехмерную структуру их расположения. Метод, основанный на явлении ядерно-магнитного резонанса (ЯМР), называется ЯМР-спектроскопия. А вот еще популярный метод: молекулу можно превратить в замороженный кристалл и «фотографировать» уже его. Это криоэлектронная микроскопия.

В общем, вот из таких микроскопических частиц (атомов) состоит и кристалл соли, и частица космической пыли у далекой звезды, и воздух, которым мы с вами дышим. И даже мы с вами. Не знаю, как вам, а мне удивительно сознавать, что я состою из тех же самых частиц, что миллиарды и миллиарды лет назад были частью далеких, ныне ярко погибших звезд.

В этом месте можно справедливо отметить, что все вокруг (и включая) нас лишь физика. Или химия. Все зависит только от того, физик или химик возьмется рассказывать эту историю.

В основе любого организма, живущего на планете Земля, лежат атомы углерода и водорода. Они – кирпичики, из которых построены все органические (то есть обязательно имеющие в своем составе углерод) вещества. Вполне возможно, на иных планетах и в иных Вселенных совсем другие атомы являются основой жизни. Эта идея уже много десятилетий любима не только писателями-фантастами, но и серьезными учеными. Однако на старушке Земле все сложилось именно так.

Часто вместе с упомянутой выше парочкой можно встретить также кислород, азот, фосфор и серу, а иногда и более экзотических ребят. Некоторые органические вещества, например, не стесняются иметь в своем составе атом магния или железа. Но кто их решится за это осуждать.

Основные молекулы, с которыми нам обязательно нужно познакомиться как можно ближе для комфортного чтения этой книги, называются аденин, тимин, гуанин и цитозин. Они – основные строительные и информационные единицы самой главной молекулы всего живого – молекулы ДНК[12]. Всю их группу называют азотистые основания (а иногда просто основания). Каждое азотистое основание в ДНК соединено с остатком молекулы сахара – дезоксирибозы. Она тоже состоит из атомов углерода, кислорода и водорода.



А теперь мне потребуется ваше воображение. Представьте себе, что молекула сахара – это такое смешное одушевленное существо, у которого есть две цепких лапки. Одну из лапок оно протянет к какому-то из азотистых оснований, например к тимину, и крепко за него ухватится. Вторую лапку протянет к другой такой же молекуле сахара и ухватится за нее. Но не «голыми руками», а через связку с использованием атома фосфора – этакую «фосфатную рукавичку». Взгляните на картинку. Такую конструкцию можно назвать «позвоночником» молекулы ДНК. Или сахарофосфатным остовом, поскольку он состоит из сахаров и фосфатных (содержащих в себе фосфор) групп. Вторая молекула сахара тоже не лыком шита: она точно так же имеет две лапки, одной из которых поймает свое азотистое основание – пусть это будет молекула гуанина, – а второй через такую же фосфатную рукавичку ухватит третий сахар. Эта третья молекула сахара тоже имеет две лапки…

Так звено за звеном образуется настоящая цепочка – одноцепочечная молекула ДНК. Важно заметить, что «информационный» состав цепочки определяется именно азотистыми основаниями – они в этой истории главные герои. Потому биоинформатики записывают «текст» ДНК так: АТГГГТТАЦАЦ.

Так, мы вроде разобрались, как ДНК устроена и даже в том, кто в ней носитель информации. Но как именно она эту информацию носит и передает? Этим вопросом миллиарды лет назад задалась и эволюция. И уж она-то нашла выход!

Любой школьник знает, что самый простой способ выполнить работу – это списать ее из учебника или у соседа по парте. И эволюция выбрала ровно тот же метод – списывание! Каждая новая одноцепочечная молекула ДНК «списана» с предыдущей молекулы. Этот же механизм лежит и в основе деления клеток (роста, развития и обновления тканей организмов), и «производства» новых организмов. Итак, новую цепочку ДНК всегда можно воссоздать по старой. Дело в том, что у каждого азотистого основания есть свой «напарник». У аденина это всегда тимин. У гуанина это всегда цитозин. Только с таким напарником он может устанавливать связи[13]. Это называется комплементарность, что переводится как взаимодополнение. Можно спорить, существуют ли «идеальные половинки» в человеческих отношениях, но вот в отношениях азотистых оснований они точно есть.

Получается, если у нас есть одна произвольная цепочка ДНК, то мы всегда можем построить на ее основе другую, комплементарную. А главное, что это может сделать и клетка любого организма! Напротив каждого аденина должен встать тимин, а напротив тимина, наоборот, – аденин. Напротив каждого цитозина должен встать гуанин. И наоборот. Получается, что цепи АТГГА комплементарна будет ТАЦЦТ. На положенное место в новой растущей цепи азотистое основание встает не само по себе, а в связке с сахаром – то есть в виде нуклеозида. В среде, где происходит копирование молекулы[14], все четыре варианта свободно плавают, пока не проплывут достаточно близко от растущей молекулы. Тогда в нужном месте и в нужное время они будут подхвачены ферментом[15], отвечающим за построение цепи. Плавают они, кстати, «надев удлиненную фосфатную рукавичку». В такой форме нуклеозид с фосфатным хвостиком называется нуклеотидом. Как только нуклеотид подплывет достаточно близко к положенному в цепи ДНК месту, он отбросит часть фосфатного хвостика, встроится в растущую цепь и приготовится остатками своей «рукавички» захватить следующий удачно проплывающий мимо нуклеотид.

Таким образом напротив старой одинарной ДНК-нити со временем вырастает вторая, которая как зеркало отражает информацию первой цепи. Сложно это представить? Возьмите с полки любую книгу и подойдите с ней к зеркалу. Поднесите книгу обложкой к зеркалу. Мы привыкли читать текст слева направо. То есть начало названия книги на левой стороне обложки, а конец – на правой. Но вот зеркало сейчас показывает вам иную картину! Заглавная буква названия оказалась справа от вас, а его конец – слева. Но при этом напротив буквы «к» по-прежнему стоит буква «к». Просто раньше она была началом, а теперь стала окончанием отзеркаленного названия. Так информация передается от нити к нити, от поколения к поколению.

Но еще кое-что всегда идет рука об руку со списыванием. Спросите у любого третьеклассника, уж он-то знает. Списать без единой ошибки практически невозможно! В этом простом правиле кроется и наше счастье, и наше горе: и тому, что эти строки набирает не одноклеточная амеба, и тому, что в любой момент времени у набирающего эти строки может начать развиваться раковое заболевание, мы обязаны тем самым ошибкам, допускаемым при «списывании». Но все-таки это уже другая история.

Связи между двумя комплементарными цепочками довольно хрупкие, а звенья в каждой из отдельных цепочек, наоборот, держатся очень крепко. Поэтому даже когда под влиянием каких-то факторов цепочки расходятся будто застежка-молния – денатурируют, после они так же легко за счет комплементарности «слипаются» обратно при первой возможности – то есть ренатурируют.

Почему такое разрушение вообще происходит? Часто под действием внешних факторов, например ультрафиолетового излучения (вот почему так важно пользоваться солнцезащитными средствами) или радиации, которая всегда присутствует в атмосфере Земли.

Скорость такого распада не очень высока и сильно зависит от условий, в которых находится ДНК. Например, погибший под снежной лавиной мамонт очень быстро замерзнет, и его ДНК может сохраниться в холодных условиях намного лучше, чем ДНК неосторожного кролика, провалившегося в тропическое озеро всего, скажем, лет 50 назад. Но чтобы ориентироваться на какие-то числа, можно сказать, что скорость полураспада ДНК составляет 521 год[16]. Как посчитали? Ученые взяли от давно вымерших нелетающих птиц моа 158 костей из трех мест гибели на территории Новой Зеландии, где они когда-то проживали. Разные кости датировались возрастом от 600 до 8000 лет. Из них выделили митохондриальную ДНК, составили математические модели, учитывающие температуру окружающей среды, особенности почвы, и вывели среднее значение: при температуре около 13 °C молекула ДНК длиной 242 нуклеотида распадается наполовину за 521 год. За следующий 521 год пополам распадется оставшаяся половина, затем еще раз пополам оставшаяся и так далее. Так что получается, что даже от вымершего всего какие-то 4000 лет назад на острове Врангеля последнего мамонта ученым могут перепасть вполне крупные фрагменты ДНК, по которым мы можем узнать очень много всего об этих прекрасных созданиях. А вот надеяться на получение хоть совсем маленького фрагмента ДНК динозавра нам не стоит. Уже через пару миллионов лет от молекулы ДНК даже в самых хороших условиях остается не так много – самая древняя на декабрь 2021 года ДНК имеет возраст чуть больше миллиона лет и получена из зуба мамонта буквально недавно[17]. Последние динозавры же вымерли аж 65 миллионов лет назад.



В этой главе мы обсудили, как хранится информация об организмах и как она передается каждой новой клетке и соответственно дочернему организму от родительского. Мы поняли, что можем сравнить информацию, хранящуюся в ДНК, с набором слов, с книгой, в которой записан организм. Но как эта записанная информация становится вполне вещественными «кирпичиками», из которых состоит организм?

То есть как перейти от слов к делу?

1.3. От слов к делу

Между рецептом в книге и готовым блюдом на столе спрятался повар. Тот, кто сначала прочел, а затем, старательно соблюдая инструкции и выбирая самые лучшие ингредиенты, приготовил и подал на стол свежую, ароматную и невероятно аппетитную пиццу. На молекулярной кухне внутри каждой клетки трудится не один такой повар, а целая армия ответственных и узкоспециализированных профессионалов, чтобы в конечном итоге «подать на стол» свой кулинарный шедевр – белок – цепочку из аминокислот, которая после некоторых превращений станет важной шестеренкой в функционировании живого существа. Одни работники зажимают страницы раскрытой на нужном рецепте книги, другие – читают его вслух. Третьи тащат из кладовых на кухню нужные ингредиенты, а четвертые соединяют их в указанном порядке. Эти ребята – отточенные эволюцией за три с половиной миллиарда лет существования жизни на Земле молекулярные механизмы.

Поэтому мы сосредоточимся на ключевом понятии – центральной догме молекулярной биологии. Название пафосное, но это потому, что описывает оно ключевой принцип молекулярной биологии и вообще жизни. А сформулировал этот принцип Фрэнсис Крик – один из легендарных авторов открытия структуры[18] молекулы ДНК. Если выразить ее коротко, то в изначальном виде она звучит так: информацию, записанную в виде ДНК, можно перевести в форму РНК, а из РНК – в белок[19].

«Она [центральная догма] утверждает, что как только “информация” перешла в белок, она уже не может вернуться обратно. Если точнее, передача информации от нуклеиновой кислоты к нуклеиновой кислоте или от нуклеиновой кислоты к белку может быть возможна, но передача от белка к белку или от белка к нуклеиновой кислоте невозможна. Под информацией здесь понимается точное определение последовательности оснований нуклеиновой кислоты или аминокислотных остатков в белке», – говорит Крик в 1958 году[20], через 5 лет после открытия структуры ДНК.


А еще по ДНК может быть построена новая ДНК. В последующие годы центральная догма была снова расширена – теперь мы знаем, что на основе РНК может строится новая РНК, а некоторые вирусы, такие как ВИЧ, могут даже построить ДНК на основе РНК, – но главный принцип центральной догмы остается неизменен: изменяя последовательность белка, нельзя изменить последовательность РНК или ДНК. Поток в этом случае идет всегда только в одну сторону.

1.4. Трудности перевода

Итак, пусть ДНК – это наша книга рецептов. Каждый отдельный рецепт в ней называется «ген». Иногда ген содержит информацию для создания других молекулярных механизмов, которые будут работать в клетке. Например, для создания специальных транспортных молекул РНК, которые доставляют аминокислоты на их рабочие места. Но чаще всего ген – это все же инструкция по сборке белка.

Белки – строительные и функциональные единицы всего живого – блюда, ставшие результатом приготовления по рецептам-генам. Поговорим немного о процессе их приготовления, в котором главную роль играют РНК.

Молекулы РНК бывают разные. Хотя все они и представляют собой похожую на ДНК последовательность азотистых оснований, скрепленных с несущими их сахарами. У ДНК в клетке не так много обязанностей – хранить информацию да передавать ее потомкам. У молекул РНК задач намного больше. Их можно назвать молекулярными инструментами, с помощью которых в клетке выполняется самая разная полезная работа. Объем работ для каждой задачи разный, потому и нужные инструменты необходимы клетке тоже в разных количествах. Все как в жизни – например, у меня на кухне есть сразу несколько ножей, но только одна открывашка для консервных банок. Если же взять активно функционирующую клетку и подсчитать соотношение разных типов молекул РНК в ней, то окажется, что на долю рибосомальной РНК (необходимой для сборки молекулярных «заводиков» по производству белков) приходится порядка 90 % от общего количества всех РНК в клетке. Еще 4 % молекул РНК – это транспортные РНК – или «грузовики», которые поставляют «строительные материалы» на «заводы». Немногим больше 1 % – различные другие типы молекул РНК (например, малые ядерные РНК). И всего 3–5 % молекул РНК – информационные, или матричные, РНК – будут интереснее всего для нас в контексте этого рассказа[21].

В нашей аналогии с заводом и грузовиками мРНК стали бы распечатанной копией конкретной инструкции для сборки готовой детали. Но постойте! Мы же чуть ранее уже назвали ген инструкцией (или рецептом) по сборке! Все верно. Здесь уместно сравнить ген с рецептом, являющимся частью книги, а мРНК – с рецептом, выписанным на отдельную карточку, в текст которого внесены некоторые изменения. А пока не пугайтесь следующей странной просьбы: громко вслух произнесите слово «молекула».

Прочли? При чтении вслух мы переводим символы в звуки. Буква «к» в слове «молекула» соответствует звуку [к]. Но вот безударная «о», например, мягко маскируется под [а]. Так и РНК похожа на ДНК, но некоторые отличия, никак не влияющие на саму информацию, передаваемую в тексте, все-таки есть. Мы помним, что в «алфавит» ДНК входит четыре основания, четыре «буквы»: А – аденин, Т – тимин, Г – гуанин, Ц – цитозин. Если бы мы хотели «что-то сказать» при помощи этого алфавита, то получили бы, к примеру:

ТАЦАЦАЦГААТААААГАТААЦАААГАТГАГТАААГГАГААГААЦТТТТЦАЦТГГАГТТГТЦЦЦААТТЦТ[22]

«Алфавит» РНК очень похож на ДНК-овый, но вместо молекулы тимина в РНК всегда будет стоять урацил. То есть вместо буквы Т мы встретим У. В виде РНК приведенная выше фраза превратится в:

УАЦАЦАЦГААУААААГАУААЦАААГАУГАГУАААГГАГААГААЦУУУУЦАЦУГГАГУУГУЦЦЦААУУЦУ

Если бы я попросила вас прочесть вслух не одно слово, а несколько предложений, то, готова спорить, с первого раза у вас не вышло бы это сделать без единой ошибки. Тут неверное ударение получилось, там окончание в спешке потерялось или на длинном слове пришлось споткнуться. У молекулярных механизмов внутри клеток те же проблемы! Иногда при копировании одной молекулы по шаблону другой они совершают ошибки. Если специальные молекулярные «надзиратели» ошибку замечают, то высылают «ремонтные бригады», которые ломают проблемный участок цепи и позволяют отстроить его заново. Этот процесс называется репарация.

Но бывает и так, что ошибка остается незамеченной. И молекула передаст эту ошибку другим своим копиям, а те своим. И так далее. Что не всегда плохо, но и не всегда хорошо.

Передачу звуков на письме лингвисты называют транскрипцией. В генетике похожий процесс называется так же: создание молекулы РНК на базе молекулы ДНК – то есть процесс переноса с языка ДНК на язык РНК – тоже называется транскрипцией. Сама считанная при этом последовательность РНК – новая РНК-молекула – получила название «транскрипт».

Возьмем еще буквально пару нужных в будущем терминов и побежим дальше. Итак, трансляция – это перевод с языка ДНК/РНК на язык аминокислот, из которых состоят белки. И репликация – удвоение молекулы ДНК или РНК. Запоминать не обязательно, не беспокойтесь об этом.

1.5. Что бывает, когда неудачно обращаются со словами

Первые подозрения о том, что истоки страхов перед ГМО лежат где-то вне темы самих ГМО, возникли у меня довольно давно. Со временем впечатление, что репутацию всей генетике как науке портят какие-то неучтенные факторы «за кадром», становилось все крепче. Может быть, дело в ассоциации с евгеникой, успешно маскировавашейся под науку десятки лет, но не имевшей никакого отношения ни к генетике, ни к науке вообще? Многочисленные разговоры с читателями блога и слушателями лекций показали, что в этом предположении достаточно много правды. Но не вся она. Свою роль здесь сыграло, например, слово «мутация», превращенное популярной культурой в нечто опасное и грозящее эволюционированием в зеленого монстра. Или вот еще хорошее название – «вырожденность генетического кода». Когда-то давно я устраивала в блоге опрос, что видят в этой фразе читатели. И в ответ многие люди описывали жутковатые образы и истории про кровосмесительные браки с рождением очень нездоровых детей.

Бороться с дурной репутацией чего бы то ни было очень тяжело. Медицинские генетики стремятся избегать использования слова «мутация» в практике и в литературе из-за его негативной коннотации. Теперь чаще можно встретить слова «вариант», «перестройка», «полиморфизм» (однобуквенная замена) и многие другие, соответствующие конкретному виду мутации, но не само дискредитированное слово. А вот слово «вырожденность» в ходу до сих пор. Кстати, по-английски этот термин звучит еще более жутко – degeneracy (дегенерация). Уф! Ну точно ничего хорошего за таким словом стоять не может!

К счастью, это вовсе не так. И за жутковатым термином стоит очень простой процесс, благодаря которому обеспечивается устойчивость организма к множеству случайно возникающих при репликации и транскрипции мута… вариантов.

Итак, любой геном (и каждый отдельный его кусочек – ген, и все межгенные интервалы) для биоинформатика выглядит как текст. Текст этот написан только буквами А, Т, Г и Ц (а в РНК вместо Т «пишут» У).

Каждый организм, будь то бактерия, гриб или человек, построен из белков самого разного рода, как любой дом построен из кирпичей и цемента. Белок – это аккуратно определенным образом уложенная длинная молекула, состоящая из отдельных элементов – аминокислот. Представьте себе бусы, уложенные в пространстве в красивой и сложной форме. Тогда все бусы – это белок, а отдельная бусина – аминокислотный остаток.

В конце XIX века, когда общество в большинстве своем смирилось с учением Дарвина, в разных концах света начали появляться организации с общей идеей «за чистоту» в основе. Чистоту государства, нации или сразу всего человечества, чего уж мелочиться. Одни считали, что право иметь детей должны иметь только определенные категории людей, другие выбрали путь уничтожения всех «не таких». Недостаточно умных, недостаточно здоровых, недостаточно белых. Во главе многих из них стояли люди, часто принимающие государственные решения или имеющие вес в таких вопросах. И если у вас в памяти сейчас всплыл образ фашистской Германии, идеи арийской расы и «всего цивилизованного мира», противостоящего этому злу, то нужно вспомнить – нацистская Германия случилась намного позже. За годы до этого и годы после тот самый «цивилизованный мир» часто следовал тем же идеям. (Iredale R. Eugenics and its relevance to contemporary health care. Nurs Ethics. 2000 May; 7(3):205–14. doi: 10.1177/096973300000700303. PMID: 10986944.) Пусть и в других масштабах. Часто не через убийство, а через принудительную стерилизацию (в конце XIX – начале XX века из-за уровня развития медицины саму операцию по стерилизации переживали не все, так что по факту это часто оборачивалось тем же убийством). Нацистская Германия пала в 1945-м. А принудительная стерилизация и по сей день остается в практике некоторых стран, пускай и неофициально. В разное время и в разных политических интересах принудительной стерилизации подвергали людей, чей балл IQ не дотягивал до установленного порога, людей, совершивших преступление и имевших уже в роду преступников, людей с диагностированными психическими заболеваниями. Многие из этих ужасных вещей делались под «прикрытием» генетики, хотя последняя часто не имела к этому никакого отношения: иногда гены могут сделать вклад в предрасположенность к тому или иному дурному поступку, но само решение мы принимаем на основании нашего воспитания и внутренних моральных норм, в других ситуациях человек может стать жертвой обстоятельств независимо от того, что записано в его геноме. «Фильтрация» по «генетическим» признакам получила собственное название – евгеника. А люди, защищавшие личные, государственные или иные интересы, возвели ее в статус настоящей науки. По иронии судьбы формальным основоположником евгеники стал Фрэнсис Гальтон – кузен Чарльза Дарвина, вдохновленный идеями своего знаменитого родственника.

Аминокислота – это тоже химическое соединение. Молекула. В основе молекулы аминокислоты, как вы уже, наверное, догадались, также лежат наши старые знакомцы – углерод, водород, кислород и азот. У всех аминокислот есть одна одинаковая для всех часть[23] и одна уникальная для каждой. Эта уникальная часть называется радикалом. 20 различных аминокислот могут входить в состав белка[24].

И тут мы переходим к самому интересному: откуда молекулярные машинки внутри клетки знают, какую именно «бусину» из 20 различных надо «нанизать» на растущую белковую цепь в нужный момент времени? И вот эта информация как раз и зашифрована в геноме! Отдельные инструкции для построения отдельного белка передаются при помощи тех самых матричных РНК, о которых мы говорили выше. А процесс перевода инструкции с языка РНК на язык аминокислот носит название «трансляция». Каждое «генетическое слово» – кодон – состоит из трех «букв». И оно всегда однозначно переводится в одну «белковую букву» – аминокислоту, которую стоит добавить к цепи. Этот язык понятен каждой живой клетке на планете, поэтому наш генетический код называют универсальным. Клетка лягушки и клетка кактуса поймут записанные в геноме инструкции одинаково. Что уж говорить о людях: разделенные языками и культурами, объединенные единым языком жизни, записанным в их ДНК.

Происходит трансляция внутри молекулярного заводика – рибосомы. Рибосома состоит из двух половинок – одна поменьше, другая побольше. «Текст инструкции» – готовая матричная РНК – соединяется с маленькой частью рибосомы, а затем получившаяся конструкция присоединяется к ее большей части. Нить мРНК будет протягиваться через эту конструкцию от одного своего конца к другому.

Получается, будто рибосома продвигается вдоль молекулы мРНК (мне это немного напоминает движущийся по монорельсе поезд). А внутри нее в это время происходит тот самый перевод РНК-овых слов – кодонов – в белковые буквы – аминокислоты (как это получается, описано чуть ниже). Происходит это с просто фантастической скоростью: 15 аминокислот в секунду присоединяются к растущей белковой цепи! А так как каждый кодон состоит из трех нуклеотидных «букв», то можно представить себе скорость движения рибосомы по нити РНК: между двумя ударами вашего сердца каждая рибосома в каждой клетке вашего тела успела пробежать по полсотни «букв»! А если вы очень быстро читаете, то за время чтения этого абзаца ваши рибосомы успели прочесть почти полторы тысячи нуклеотидов и посадить на растущую белковую цепь около пяти сотен аминокислот. А это, например, значит, что к моменту прочтения этих слов внутри каждого вашего эритроцита успели построиться по парочке новых молекул гемоглобина[25].

Переводить помогают еще одни маленькие труженики молекулярного фронта – молекулы транспортной РНК (тРНК). тРНК на первый взгляд самые обычные одноцепочечные молекулы, но есть у них две суперспособности. Первая заключается в том, что несколько участков каждой молекулы тРНК взаимно комплементарны. Так что стоит таким участкам в один момент времени оказаться слишком близко друг к другу, как они тут же «склеиваются». Происходит благодаря тому же принципу, что удерживает вместе две нити ДНК. Склеившись таким образом, из прямой ниточки тРНК превращаются в фигуру, напоминающую лист клевера: от «стебля» отходят три «листочка». Еще немного пространственных преобразований, и молекула примет свою трехмерную структуру. Участок молекулы, соответствующий «среднему лепестку» «клевера», получил название «антикодон». Кодон – «генетическое слово», состоит из трех нуклеотидных букв. Антикодон, соответственно, также из трех, комплементарных буквам кодона. Например, кодону АУГ будет соответствовать антикодон УАЦ, а кодону ААЦ – антикодон УУГ.

Вторая суперспособность тРНК – это умение крепить к противоположному концу молекулу аминокислоты, строго соответствующую тому кодону, который задан при помощи антикодона. Звучит ужасно запутанно. Здесь поможет разобраться картинка. Когда кодон мРНК оказывается внутри рибосомы, трудяги-тРНК тут же бегут к нему, размахивая каждый своей аминокислотой. Если антикодон подошедшей близко тРНК оказывается комплементарным кодону мРНК, находящемуся в данный момент «на рабочем столе» у рибосомы, тРНК отсоединяет свой полезный груз, и аминокислота присоединяется к растущей белковой цепи. Затем тРНК налегке уплывает из рибосомы, чтобы поймать себе следующую подходящую к ее антикодону аминокислоту. И повторить все сначала, доставив ее точно на рабочее место. Мне молекулы тРНК немного напоминают портняжек, которые бегают за клиентами с мерками в одной руке и готовым костюмом в другой. Стоит им встретить клиента, идеально подходящего под их мерки, как они тут же натягивают этот костюм на него.

Почему же в кодоне три буквы? И вот еще хороший вопрос: сколько же всего существует различных тРНК (то есть молекул с различными антикодонами)? Давайте посчитаем вместе. Мы знаем, что видов тРНК должно быть как минимум 20, чтобы можно было запрограммировать антикодонами все 20 необходимых аминокислот. Еще нам нужна комбинация для кодирования «точки» в тексте гена – стоп-кодона. Различных нуклеотидов же всего 4. Так что, если бы кодон состоял всего из одной буквы, то закодировать мы смогли бы лишь 4 аминокислоты. Маловато. Предположим далее, что кодон состоял бы из двух букв. Тогда на первой позиции может стоять любая из четырех (А, У, Г или Ц) и на второй позиции также любая из четырех: АА, АУ, АГ, АЦ, УА… Сколько всего таких вариантов? 4 x 4 = 16. А надо минимум 20 + 1. Снова не хватает. Перебираем варианты дальше. Для кодонов из трех букв на первом месте может стоять одна из 4 букв, на втором одна из 4 и на третьем также. Итого комбинаций: 4 × 4 × 4 = 64. Что даже больше, чем нужно. Но в данном случае эта избыточность дает очень сильные преимущества организмам. Поговорим об этом далее. А пока же подведем черту: по законам комбинаторики, во-первых, чтобы закодировать 20 аминокислот, нужно использовать как минимум трехбуквенные комбинации (поэтому второе название для кодона – триплет). А во-вторых, все по тем же законам комбинаторики, в клетке может существовать 64 различных тРНК[26].

Итак, получается, что любое комбинаторное сочетание из трех ДНК-овых букв дает всегда одну строго определенную аминокислоту (минус три возможные комбинации для стоп-кодона). Таким образом, зная это трехбуквенное сочетание, мы всегда можем точно сказать, какая аминокислота будет добавлена в белок. Видим кодон ЦГУ – знаем, что добавится аминокислота аргинин (R).




А если наоборот? Взгляните на таблицу. Каждой аминокислоте может соответствовать от одной комбинации (как у метионина) до сразу целых шести (как у лейцина). Но чаще все же это от двух до четырех различных комбинаций. Это свойство генетического кода называется избыточностью. Если мы увидим «белковую» букву R (аминокислоту аргинин), то будем в растерянности – как же именно перевести его обратно на язык РНК? Ведь и вариант ЦГУ будет правильный, и вариант АГГ, и еще целых 4 разных варианта! Эта невозможность произвести однозначный перевод в обратную сторону и называется страшным словом «вырожденность». Вырожденность генетического кода. Иногда мне кажется, что если бы в прошлом генетики придумывали термины попроще, больше людей доверяли бы сегодня этой науке.

Еще немножко про генетический код напоследок. Этакая вставка для читателей, которые любят самые хитрые подробности. Хотя мы и называем код универсальным, есть и здесь несколько исключений. В таких ситуациях мы называем код (или коды) альтернативным(и). Впервые альтернативный код обнаружили еще в 1979 году. Причем не где-то далеко, а прямо внутри нас! Оказалось, что генетический код митохондрий отличается от стандартного, о котором мы говорили на протяжении всей этой главы[27]. Вот, например, обычно кодон УГА означает «точку» – символ окончания трансляции (терминации), после которого аминокислотная цепочка отсоединяется от рибосомы. А вот в коде митохондрий УГА всего лишь кодирует аминокислоту триптофан! Кодон АУА вместо обычного для большинства живых организмов изолейцина соответствует метионину. Ну а так как митохондрии – органеллы внутри наших клеток, то получается совсем парадоксально: даже внутри наших тел действуют разные «правила перевода»! Но на самом деле это не так уж и удивительно, ведь мы уже знаем, что когда-то митохондрии были вольными и самостоятельными организмами, которых захватили и поставили себе на службу наши одноклеточные предки.

Своими вариациями генетического кода обладают также некоторые бактерии, водоросли, плоские черви, паразиты… А кое-кто из них даже умеет переключаться между тем, какой код им использовать, в зависимости от окружающих их условий[28]! Воистину, генетика – настоящее олицетворение утверждения, что из каждого правила просто обязаны быть исключения!

1.6. Чей это у вас тут ген?

Ну что, кажется, мы разобрали уже достаточно скучной теории, чтобы в первый раз начать говорить про интересные вещи, связанные с ГМО. Так и начнем! Вот нам загадка: если все организмы на планете (забудем на несколько минут обо всех исключениях, что мы чуть выше перечислили) записаны на одном универсальном генетическом «языке», то сможем ли мы понять, что в некий «помидор вставили ген скорпиона»[29]?

В большинстве случаев – да. Большая часть методик редактирования геномов оставляет за собой следы – вместе с целевым геном в геном вставляются определенные узнаваемые последовательности и маркеры. Такие следы довольно просто обнаружить при помощи молекулярно-биологических методов – например, при помощи ПЦР (полимеразной цепной реакции – операции, при которой возможно многократно копировать ДНК. Или только нужный ее фрагмент. Например, фрагмент, который мы надеемся обнаружить в геноме. Конечно, таким образом затруднительно найти любой чужеродный ген – нам нужно знать, что мы ищем, чтобы попробовать получить много копий этого, – но вполне возможно обнаружить гены и генетические маркеры, традиционно используемые при создании ГМ-организмов). Однако, если кто-то решит специально спрятать модификацию и не добавит никаких опознавательных последовательностей, то ответить однозначно, было проведено редактирование или нет, будет довольно сложно. Хотя кое-какие подсказки есть в руках именно у биоинформатиков.

Первая подсказка в том, что хотя мы и поговорили выше, как одна и та же аминокислота кодируется разными кодонами, встречаемость этих альтернативных кодонов в тексте одного гена и даже целого генома не равновероятна[30]. Вот аминокислота изолейцин может быть задана кодонами АУЦ, АУА или АУУ. Но возьмем, например, туберкулезную палочку (Mycobacterium tuberculosis). Ей нравится, чтобы кодоны в ее генах заканчивались на букву Г или Ц. Поэтому изолейцин в ее геноме записывается как АУЦ почти в 30 раз чаще, чем АУА, или в 5 раз чаще, чем АУУ[31].

Это явление получило название «предпочтение кодонов», и оно активно изучается эволюционными биологами уже много десятилетий. Какие-то организмы более строго придерживаются правил предпочтения кодонов, а какие-то менее. Для нас тут самое интересное в том, что относительно недавний перенос гена из одного организма в геном другого можно предположить, если в этом гене статистика употребления каких-то кодонов отличается от картины в других генах этого же организма. Сработает этот метод, конечно, лишь для некоторых пар организмов. Мы не сможем использовать его, если хотим, например, найти в геноме яблони сорта X следы переноса генов от яблони сорта Y. А вот найти в том же геноме яблони сорта X следы переноса генов из бактерии вида Agrobacterium tumefaciens вполне реально, так как бактерия предпочитает использовать свой набор кодонов[32].



Вторая подсказка для биоинформатиков также основана на статистике и во многом следует из факта существования принципа предпочтения кодонов. Представьте, что перед вами фото многолюдной улицы неизвестного вам города. Вы бы хотели понять, где именно сделано это фото. Оценив, какой оттенок кожи и разрез глаз вы видите на фото чаще, вы можете сделать первые выводы. Если добавить к признакам, какую одежду предпочитают люди с фото, можно скорректировать свои выводы. Добавим далее то, какая архитектура преимущественно попала на снимок, и вуаля – наш прогноз стал достаточно хорошим даже для снимка крупного портового города, каковые известны своей смесью национальностей, культур и архитектур. Примерно так же мы можем посмотреть и на геном. Сначала оценить, как часто в нем встречаются определенные буквы. Чаще всего измеряют долю букв Г и Ц (этот параметр получил название ГЦ-состав) или долю букв А и Т (АТ-состав) на геном или на определенный фрагмент генома. Уже по такому простому, казалось бы, параметру можно неплохо различать между собой различные организмы. Например, в человеческом геноме доля букв Г и Ц составляет в среднем 41 % (есть отдельные специфические регионы в геноме, которые содержат значительно больше или меньше, но среднее для большей его части такое)[33], а в геноме бабочки монарха (Danaus plexippus) ГЦ-контент равен 31,6 %[34].

Затем можно изучить различные двухбуквенные сочетания. Например, сколько раз в геноме (или определенном регионе генома) найдется сочетание АГ, или АТ, или ЦЦ. Потом вычислить частоту вхождения различных троек. Например, как много в геноме сочетаний ЦЦЦ, ГГГ или АГА. После перейти к четверкам и определить, скажем, процент вхождения сочетаний ААГГ и ЦЦГА. Затем к пятеркам… Таким образом мы сформируем индивидуальный портрет генома из признаков частоты вхождения в него различных подстрок. Такой же портрет мы можем получить для каждого отдельного региона в этом геноме. А потом наложить два портрета друг на друга и сделать выводы о том, вписывается ли рассматриваемый фрагмент в картину всего генома. Если ответ «да», вероятно, все в нем «родное». Если ответ «нет», можно предположить, что там есть ген, который был перенесен из генома организма другого вида.

Загрузка...