“Ландшафт приспособленности” – это воображаемый график, показывающий, как зависит функциональность гена от его нуклеотидной последовательности (или работоспособность белка от его аминокислотной последовательности). Биологи привыкли считать ландшафт приспособленности абстракцией, полезной для теоретических рассуждений, но недосягаемой для реального изучения. Однако стремительное развитие биотехнологий уже позволяет картировать небольшие области ландшафта приспособленности конкретных белков. Американские биологи экспериментально изучили свойства всех возможных аминокислотных комбинаций, занимающих четыре ключевые позиции в одном из белков кишечной палочки. Неожиданно оказалось, что из 160 000 комбинаций работоспособны целых 1659 (более 1 %). При этом эволюционные маршруты от одних “разрешенных” последовательностей к другим, как правило, оказываются длинными и окольными. Это связано с сильным эпистазом – зависимостью пользы мутации от того, какие мутации успели закрепиться раньше. Иными словами, важно не только само появление тех или иных мутаций, но и порядок их появления. Возможно, из-за эпистаза эволюция не может найти многие удачные решения, а ее пути становятся до некоторой степени предсказуемыми.
Одним из способов представить себе, как идет эволюция, является картирование ландшафта приспособленности конкретных белков. В схематичном виде ландшафт приспособленности показан на илл. i (см. цветную вклейку). Конечно, в идеале хотелось бы просканировать все “пространство последовательностей” (все возможные аминокислотные последовательности белка), определив для каждой его точки (то есть для каждой последовательности) эффективность выполнения белком интересующей нас функции. Однако такая задача невыполнима, поскольку даже для маленькой белковой молекулы в 100 аминокислот число точек в пространстве последовательностей (то есть число всех возможных белков такого размера) на много порядков превышает число атомов во Вселенной (первое равно 20100 ≈ 10130, второе – в 1050 раз меньше).
Поэтому лучшее, на что мы можем пока рассчитывать, – это картирование очень маленьких, специально подобранных, удобных для изучения участков пространства последовательностей. Даже такая задача невероятно трудоемка. Но все же сегодня, благодаря развитию биотехнологий, она уже выполнима. Об этом свидетельствует статья Анны Подгорной и Майкла Лауба из Массачусетского технологического института (США), опубликованная в 2015 году в журнале Science (Podgornaia, Laub, 2015). Авторы сосредоточили усилия на четырех ключевых аминокислотах, входящих в состав белка PhoQ все той же кишечной палочки (Escherichia coli). Белки, гомологичные PhoQ, есть и у других гамма-протеобактерий, таких как сальмонелла и чумная палочка. PhoQ – это рецептор, располагающийся на внутренней мембране бактерии. Он реагирует на изменения концентрации ионов Mg2+ снаружи от мембраны (в так называемом периплазматическом пространстве, которое у гамма-протеобактерий и других грамотрицательных бактерий находится между внутренней и наружной мембранами) и передает сигнал в цитоплазму посредством активации или инактивации другого белка, называемого PhoP. Белок PhoP, в свою очередь, включает и выключает гены, необходимые для адаптации бактерии к меняющимся условиям среды.
Ключевую роль в работе двухкомпонентной регуляторной системы PhoQ-PhoP играют четыре аминокислоты, входящие в состав PhoQ и образующие так называемый белок-белковый интерфейс. Это значит, что они необходимы для того, чтобы PhoQ мог безошибочно опознать своего партнера PhoP и правильно провзаимодействовать с ним.
В белке PhoQ кишечной палочки это следующие четыре аминокислоты: аланин в позиции 284, валин в позиции 285, серин в позиции 288, треонин в позиции 289 (сокращенно Ala284, Val285, Ser288, Thr289 или еще короче – AVST).
Но AVST – лишь одна из 160 000 (204) возможных комбинаций четырех аминокислот. Ведь чисто теоретически на каждой из этих четырех позиций могла бы стоять любая из 20 аминокислот. Исследователи поставили перед собой амбициозную задачу откартировать все пространство последовательностей для данных четырех аминокислотных позиций. То есть для каждой из 160 000 комбинаций проверить, обеспечивает ли она нормальное взаимодействие PhoQ с PhoP, а значит, и правильную работу всей регуляторной системы.
Для этого были изготовлены плазмиды с геном phoQ, в котором триплеты нуклеотидов, кодирующие аминокислоты белок-белкового интерфейса AVST, были полностью рандомизированы, то есть заменены на случайные тройки нуклеотидов. Затем эти плазмиды вставили в клетки E. coli, из которых их собственный ген phoQ был заблаговременно удален. Кроме того, в геном подопытного штамма вставили ген желтого флуоресцирующего белка под управлением такой регуляторной последовательности, которая обеспечивает активацию этого гена в присутствии активной формы белка PhoP (чтобы клетки, в которых система PhoQ-PhoP сработала, можно было отличить по флуоресценции). В итоге получилась разношерстная популяция кишечных палочек, у каждой из которых в белке PhoQ на месте четырех аминокислот AVST находилась какая-то из 160 000 возможных аминокислотных комбинаций.
Теперь нужно было выбрать из этой популяции те клетки, у которых система PhoQ-PhoP по-прежнему исправно работала. Отбор проводился в два этапа. Сначала микробов выращивали при разных концентрациях ионов магния и отбирали тех, у которых интенсивность желтого свечения соответствовала таковой у контрольных бактерий с последовательностью AVST. Затем отобранных микробов помещали в среду, не содержащую ионов магния. Пережить такое “магниевое голодание” способны только бактерии с исправно работающей системой PhoQ-PhoP.
Геномы бактерий, выдержавших эти испытания, подвергли секвенированию, чтобы получить полный список аминокислотных последовательностей, обеспечивающих нормальную работу системы PhoQ-PhoP. Таких последовательностей оказалось неожиданно много: целых 1659. Ученые выборочно проверили некоторые из мутантных штаммов на способность конкурировать с контрольными кишечными палочками при разных концентрациях ионов магния. Эти эксперименты показали, что приспособленность мутантов осталась на том же уровне, что и у исходного штамма. Таким образом, по крайней мере некоторые (а скорее всего, большинство) из выявленных 1659 последовательностей не имеют серьезных дефектов по сравнению с исходной последовательностью AVST.
Это один из главных результатов работы. Он показывает, что “плато” ландшафта приспособленности, соответствующее функциональному белок-белковому интерфейсу, весьма обширно: оно занимает более 1 % всего пространства последовательностей (1659 точек из 160 000). Это значит, что, подобно генетическому коду, в котором 20 аминокислот и знак “стоп” кодируются 64 триплетами, “белок-белковый” код, обеспечивающий узнавание белками друг друга, тоже обладает высокой избыточностью. Есть много разных вариантов, способных работать одинаково, что, по идее, должно облегчать эволюцию белков. Чем обширнее плато ландшафта приспособленности, соответствующее данной функции, тем больше шансов, что с какой-нибудь его точки удастся перейти (или перепрыгнуть) на другое плато. Иными словами, повышается вероятность смены функции белка в ходе эволюции.
Полученные данные позволили изучить топографию плато и оценить его “эволюционную проходимость” (илл. i на цветной вклейке). Принципиальный вопрос, от ответа на который зависит ход эволюции, а конкретнее динамика перемещения эволюционирующей молекулы по ландшафту приспособленности, состоит в том, насколько сильно влияние четырех аминокислотных позиций друг на друга. Это влияние называется эпистазом. Если эпистаз отсутствует, то плато ландшафта приспособленности, соответствующее данной функции белка, представляет собой ровную, плоскую поверхность, по которой эволюционирующий белок может гулять абсолютно свободно. Есть некий набор “разрешенных” аминокислотных замен, и приобретать их можно в любом порядке. При сильном эпистазе плато становится похоже на лабиринт узких тропинок, разделенных пропастями. По такому плато передвигаться трудно, потому что аминокислотные замены, безвредные в одних контекстах, оказываются вредными в других. В результате порядок приобретения замен становится крайне важным: к каждой точке пространства последовательностей можно теперь добраться лишь строго определенными немногочисленными маршрутами. В таком случае многие работоспособные последовательности, скорее всего, до сих пор не найдены эволюцией просто потому, что у нее не хватило на это времени.
Анализ полученного списка из 1659 работоспособных последовательностей показал сильнейшее взаимное влияние четырех аминокислотных позиций, то есть очень сильный эпистаз. Это второй главный результат исследования. В наличии эпистаза можно убедиться разными способами. Например, можно сравнить друг с другом последовательности, отличающиеся от AVST одной, двумя, тремя и четырьмя аминокислотами. Исследователи обнаружили среди функциональных (“разрешенных”) последовательностей 16 одиночных мутантов, 100 двойных, 544 тройных и 998 четверных, то есть таких, в которых все четыре аминокислоты отличаются от исходных A, V, S и T. Если бы эпистаза не было, то разрешенные множественные мутации представляли бы собой просто-напросто произвольные комбинации одиночных. Однако ничего подобного не наблюдается. Каждая отдельная аминокислотная замена оказывается разрешенной в одних сочетаниях и запрещенной в других. Из-за этого кратчайший разрешенный эволюционный путь от одной последовательности к другой в большинстве случаев оказывается длиннее, чем кратчайший из потенциально возможных (рис. 2.1).
Рассмотрим, например, переход от AVST к разрешенной последовательности MLAI (рис. 2.1, вверху слева). Чтобы превратить AVST в MLAI, нужно заменить четыре аминокислоты. Соответственно, если считать аминокислотную замену единичным эволюционным событием, то кратчайший путь от AVST к MLAI будет состоять из четырех шагов. Разных путей такой длины потенциально существует 24, поскольку аминокислоты можно заменять в разном порядке. Однако из этих 24 кратчайших путей разрешенными оказались только два. Все остальные пути требуют пересечения “пропасти” на ландшафте приспособленности, то есть прохождения через нефункциональный промежуточный этап.
рис. 2.1. Кратчайшие разрешенные эволюционные пути от AVST к последовательностям MLAI и SIQC. Функциональные (разрешенные) последовательности обведены рамками. Контурными буквами обозначены аминокислоты, отсутствующие в начальной и конечной последовательностях. Два левых рисунка в качестве единичного эволюционного события предполагают замену аминокислоты в белке, на правом рисунке таким событием считается замена одного нуклеотида в ДНК. В последнем случае путь получается длиннее из-за структуры генетического кода: от каждой аминокислоты путем замены одного нуклеотида можно прийти не ко всем, а лишь к некоторым из остальных 19 аминокислот. По рисунку из Podgornaia, Laub, 2015.
Во многих случаях все кратчайшие пути оказываются запрещенными. Тогда маршрут из одной точки пространства последовательностей в другую (например, путь от AVST к SIQC, показанный на рис. 2.1 слева внизу) оказывается длиннее, чем кратчайший из потенциально возможных (кратчайший путь предполагает три промежуточных состояния, а на рисунке их четыре).
Ну а если учесть, что реальные единичные мутации обычно представляют собой замену одного нуклеотида в ДНК (а не триплета на любой другой триплет), то проходимость ландшафта окажется еще ниже. На рис. 2.1 справа показан кратчайший разрешенный путь от AVST к MLAI с учетом этого обстоятельства. Теперь он состоит не из четырех, а из целых десяти шагов. Это объясняется структурой генетического кода, которая позволяет путем единичных нуклеотидных замен переходить от данной аминокислоты только к некоторым, но не к любым другим аминокислотам. Например, фенилаланин кодируется триплетами UUU и UUC. Изменив в любом из этих триплетов только одну букву, можно заменить в белковой молекуле фенилаланин на лейцин, изолейцин, валин, серин, тирозин или цистеин. Для перехода к любой из оставшихся 13 аминокислот потребуется не одна, а две или три нуклеотидных замены. Таким образом, эпистаз и структура генетического кода совместными усилиями делают ландшафт приспособленности труднопро- ходимым.
В целом топография изученного плато ландшафта приспособленности оказалась довольно замысловатой. Это плато мало похоже на гладкое, легкопроходимое поле. Оно подразделяется на несколько областей, внутри каждой из которых эволюционирующий белок может передвигаться относительно свободно, однако переход в соседнюю область возможен лишь по немногочисленным тропкам. Некоторые разрешенные последовательности вообще оказываются недосягаемыми из обжитой реальными бактериями области пространства последовательностей. По-видимому, эволюция белок-белкового интерфейса действительно настолько затруднена эпистазом и структурой генетического кода, что эволюция просто не успела разведать многие потенциально доступные области пространства последовательностей.
Данное исследование кому-то может показаться слишком скучным и специальным. Но только не биологам, привыкшим считать “пространство последовательностей” и “ландшафт приспособленности” абстракциями, полезными для теоретических построений, но недосягаемыми для реального изучения. Больше всего впечатляет сам факт, что стало в принципе возможным прямое экспериментальное картирование отдельных областей пространства последовательностей. Хотя, конечно, речь пока идет лишь о четырех аминокислотных позициях, то есть о переборе 204 вариантов. Полное картирование пространства всех возможных белков навсегда останется неразрешимой задачей.