Итак, предварительный этап «гонки за геномом» завершен. Завершается опознание примерно трех миллиардов звеньев ДНК, уложенных в хромосомы человека.
И сейчас, когда расшифровка генома человека вступает в завершающую фазу, самое время задать сакраментальный вопрос: а что же дальше? Какие новые направления выдвигаются на первый план в развитии биологии XXI века?
Ответ на этот вопрос таит в себе поразительные новые термины, которые с недавнего времени стали все чаще звучать на различных биологических конференциях и в научной печати: «геномика», «фармакогеномика», «протеомика», «транскриптомика», «феномика» и тому подобное. В совокупности они образуют то, что некоторые специалисты называют сегодня «геномной», а другие, более восторженные (или более увлеченные модой), – даже «постгеномной» эрой в биологии. О чем речь?
Легче всего объяснить, что такое «геномика». За этим термином скрывается дальнейшее развитие работ по расшифровке и классифицированию все новых и новых геномов все новых и новых живых существ. Чтобы стать действительно массовым и скоростным, такое развитие, по мнению специалистов, требует резкого (как минимум в десять раз) увеличения мощности нынешних автоматизированных устройств по определению последовательности химических звеньев, составляющих различные геномы.
Центральной задачей геномики будет, конечно, дальнейшее проникновение в детали человеческого генома. Содержанием первого этапа исследований станет, видимо, картографирование всех генов человека. Даже эта, самая первая задача потребует немалых усилий. Выявление генов – крайне трудное дело, как это показали недавние исследования одного из участков генома дрозофилы. Несмотря на то что над задачей трудились коллективы двенадцати лабораторий, примерно шестая часть генов, расположенных (судя по теоретическим прикидкам) на этом участке генов, не была опознана вообше. Опознание генов затруднено еще и тем, что пока неизвестно их полное число в геноме человека. Тем не менее можно думать, что все эти трудности будут со временем преодолены и точный химический состав всех человеческих генов станет известным. Уже сейчас существуют два эффективных метода опознания генов: по РНК и по так называемым снипсам (см. ниже), и их точность непрерывно повышается.
Картографирование и анализ всех генов позволят прежде всего провести сравнение их друг с другом во всей человеческой популяции, что, в свою очередь, даст возможность выявить те отличия, которые накопились в каждом гене за время эволюции вида гомо сапиенс. Такие отличающиеся друг от друга разновидности одного и того же гена называются в биологии «аллелями». Изучение их необычайно важно для выявления индивидуальной восприимчивости к тем или иным болезням. Вот хотя бы один пример. Существует ген р53, который защищает организм от многих видов рака. У него есть аллель, отличающийся тем, что такой «чуточку измененный» ген уже не способен выполнять свою защитную функцию. Поскольку каждая хромосома в клетке представлена попарно, то генов р53 в каждой клетке два. Если оба представлены нормально функционирующими аллелями, клетка надежно защищена от перерождения в раковую; если один из аллелей дисфункционален, второй еще тоже может защитить клетку; но если и этот второй будет выведен из строя какой-нибудь случайной мутацией, вероятность ракового перерождения клетки становится весьма велика. Люди, почему-либо рождающиеся только с одним рабочим аллелем р53, весьма восприимчивы к раку.
К счастью для нас, изучение всех человеческих генов на предмет аллельности не так затруднительно, как можно было бы подумать. На пути своего развития современное человечество прошло сквозь так называемое бутылочное горлышко эволюции, когда численность исходного коллектива гомо сапиенс резко снизилась – по нынешним оценкам, всего до двух-трех тысяч особей. Такой маленький коллектив не мог быть генетически очень различен – каждый ген в нем мог быть представлен самое большее несколькими различными вариантами. Поскольку это происходило максимум 150-200 тысяч лет назад и длительность жизни людей за эти годы росла, то сменилось всего несколько тысяч поколений, а это, по эволюционным масштабам, не могло существенно увеличить генетическое разнообразие. В результате люди сегодня значительно меньше отличаются друг от друга по составу генов, чем, например, их ближайшие родственники – шимпанзе. Изучить все существующие различия человеческих генов и составить каталог всех аллелей – задача вполне представимая и осуществимая. Это было подтверждено недавними пробными исследованиями ряда типичных генов.
Другое важное направление исследований, возможное после расшифровки всех генов, – сопоставление человеческих генов с генами других биологических видов. Это позволит проникнуть в процесс эволюции и понять его механизмы. Многие специалисты считают, что природа совершенствовала млекопитающих не столько посредством умножения разнообразия их генов, сколько путем постепенного копирования, модификации и комбинации уже существующих генов, а также путей регулировки этих генов. Ведь известно, например, что человек отличается от шимпанзе какими-нибудь двумя процентами своих генов, чуть больше генов отличает его от гориллы и так далее. А некоторые группы генов (например гены так называемого гомеобокса, управляющие телесной формой организма) у человека и других млекопитающих сродни аналогичным группам у куда более простых существ и восходят к биологическим видам, возникшим еще пятьсот – шестьсот миллионов лет тому назад, во времена так называемого Кембрийского биологического взрыва.
Понятно, однако, что все эти направления, охватываемые общим термином «сравнительная геномика», представляются всего лишь первым, начальным этапом программы биологических исследований XXI века. Без знания последовательности звеньев в отдельных хромосомах любого генома, и в частности – без знания этой последовательности внутри его генов, нечего и думать о понимании процессов, происходящих в данном организме. Но она лишь начальный этап, потому что сама по себе эта последовательность звеньев еще не определяет полностью работу генов. Не менее важной является система управления этой работой, которая включает или выключает те или иные гены в тот или иной момент времени, на время или навсегда, меняет активность их работы, определяет индивидуальные различия в этой работе и дает понимание того, как работают эти гены. Без понимания механизмов регулировки генов не может быть ни полного понимания жизненных процессов, протекающих в клетках и в организме в целом, ни полного понимания биологической природы болезней и путей борьбы с ними (что более всего интересует медицину, да и простых людей тоже).
Увы, именно от этого знания биология пока еще весьма далека, несмотря на свои последние огромные достижения в расшифровке геномных последовательностей. Даже если считать, что число генов в человеческом геноме не превышает 65 тысяч, на данный момент ученым известны функции разве что лишь около восьми тысяч из них. А детальные сведения о механизмах их регуляции еше более скудны. Меж тем что проку в самой полной и точной карте генов, если неизвестны их назначение и характер работы в организме?
Путь от обнаружения генов к обнаружению их функций весьма сложен. Здесь самые большие надежды возлагаются сейчас на так называемые генетические маркеры, или снипсы (по-английски SNPsi – от Single Nucleotide Polymorphisms). Примерно год назад общественный консорциум «Геном человека» совместно с несколькими другими фирмами (в том числе «Ай-би-эм» и «Моторола») даже запустил многосотмиллионный исследовательский проект, целью которого является создание сводной карты, показывающей расположение в геноме этих «генетических маркеров». Термином «снипсы» обозначаются «точечные» отличия (полиморфизмы) в молекулах ДНК различных людей (иначе говоря, отличия ДНК от человека к человеку), вызванные заменой отдельного химического звена-нуклеотида.
За время человеческой эволюции в нашем геноме накопилось очень много таких случайных, вызванных разными причинами «точечных замен». По нынешним оценкам, они в сумме составляют примерно одно различие на каждую тысячу звеньев. Изучение «снипсов» показало, что если такая замена олного-единственного нуклеотида происходит вблизи рабочего гена, на участке ДНК, рейдирующем работу этого гена, то она может вызвать у данного человека повышенную восприимчивость к той или иной болезни – гипертонии, раку, диабету и тому подобное. Этот факт породил надежду, что изучение «точечных» различий (в сочетании с изучением генных аллелей) может открыть – в отдаленном будущем, конечно – путь к «индивидуализированной медицине», или, как ее стали теперь называть, «фармакогеномике», которая сможет подгонять лекарства под индивидуальный генотип и проводить тесты, показывающие вероятность того или иного заболевания для данного конкретного человека. Создание фармакогеномики позволило бы врачам, например, заранее предсказать, что апьцхаймеровский больной с генным вариантом <Арое е4> будет менее восприимчив к препарату такрин, чем другие пациенты (пример реальный).
Перспектива, конечно, невероятно увлекательная, но пока еще совершенно фантастическая. Чтобы прийти к такой медицине, нужно прежде всего, конечно, найти – то есть обнаружить среди десятков тысяч других – именно те гены, которые в силу «точечных замен» стали повышенно восприимчивы к тому или иному заболеванию. К счастью, оказалось, что снипсы могут помочь и в таком поиске. Когда точечная замена возникает поблизости от какого-нибудь гена, делая его восприимчивым к болезни, она, как правило, передается по наследству вместе со всем этим участком ДН К. то есть вместе со «своим» геном. Именно эта неразрывная связь «точечных замен» с близлежащими генами и делает такие замены «генетическими маркерами», позволяющими опознавать местоположение самих «восприимчивых к болезни» генов. В самом деле, если в геномах нескольких разных людей на одном и том же месте какой-нибудь молекулы ДНК будет обнаружена замена одного какого-то нуклеида, то это может быть указанием, что у всех у них где-то вблизи находится некий рабочий ген, восприимчивый к какой-то болезни. Затем можно будет собрать людей, страдающих тем или иным заболеванием, сравнить их с контрольной (здоровой) группой, найти, какой «точечной заменой» первая группа отличается от другой и какой ген находится вблизи этой замены. Это и будет (скорее всего) ген, отвечающий за восприимчивость к данной болезни.
План консорциума, как уже сказано, состоял в составлении карты таких «точечных замен», которая позволила бы выявить гены, ответственные за восприимчивость людей к различным заболеваниям, и затем изучить, вышеописанным путем, функцию каждого из них. В мае этого года участники проекта собрались на совещание, чтобы подвести итоги «первого года работы». Выяснилось, что число выловленных к этому времени SNP достигло уже 102719. Много это или мало? В начале работы, год назад, организаторы проекта считали, что для составления карты, позволяющей сравнивать SNP различных групп людей, им будет достаточно найти 150 тысяч таких «точечных замен». Увы, на совещании они пришли к выводу, что для этого необходимо как минимум 500 тысяч! (Недавно было сообщено, что параллельно этому консорциуму создается британский, ставящий задачей не только составить каталог пятисот тысяч снипсов, но и найти связь каждого из них с той или иной болезнью.)
Но даже эти цифры еще не дают полного представления о масштабах работы, необходимой для выявления функций и механизмов действия всех наших генов. А речь именно обо всех генах, ибо никогда нельзя заранее знать, как влияет на организм тот или иной ген, а тем более – несколько генов в их взаимодействии. (Замечательный пример такого взаимодействия генов: когда экспериментаторы попытались превратить лабораторную мышь-альбиноса в черную и подсадили ей для этого ген, производящий черный пигмент, ее потомки оказались хотя и черными, но нежизнеспособными, так как все их внутренние органы поменяли свое расположение на симметричное.)
Но в этом плане не менее важны выявление и анализ действия тех участков, которые регулируют эти гены. Дело в том, что химические изменения в этих участках зачастую вызывают разного рода индивидуальные отличия людей даже при одинаковости их генов и аллелей. Помимо «точечных замен», такие химические изменения могут быть вызваны так называемым метилированием – присоединением к некоторым звеньям регулировочного участка (цитозинам) метиловых групп, состоящих из одного атома углерода и трех атомов водорода. Помимо своего влияния на индивидуальные особенности людей (и, в частности, на их индивидуальную восприимчивость к тем или иным болезням), такое метилирование, по-видимому, является и причиной загадочного, происходящего уже в эмбриональном состоянии феномена, когда во всех клетках женского организма навсегда подавляется одна из двух «женских» Х-хромосом (что, возможно, вызывает повышенное долголетие женщин в сравнении с мужчинами).
Метилирование, а также другие способы, которыми природа меняет активность генов, меняя лежащие рядом с ними регулировочные участки, стали предметом изучения новой «постгеномной» дисциплины – эпигенетики (от греческого «эпи» – рядом, около). Ее развитие тоже будет одним из основных направлений биологического поиска в ближайшие десятилетия. Об этом говорит хотя бы тот факт, что в декабре 1999 года большая группа ведущих европейских научных центров объединила свои усилия для создания Европейского эпигенетического консорциума, задачей которого будет выявление четырехсот тысяч участков генома, подвергающихся метилированию, и анализ различных его вариаций.
Однако многие сторонники «постгеномного» подхода в сегодняшней биологии считают, что выяснение функций различных генов должно идти не по пути изучения эпигенетики, снипсов и тому подобного, а по линии так называемой протеомики, то есть изучения белков (протеинов), производимых этими генами. Ведь в конечном счете именно белки, а не гены, говорят эти биологи, ответственны за все процессы, идущие в организме. Белки намного меньше по размеру и проще по составу, и их автоматизированное исследование уже разработано до такой степени, что сегодня можно идентифицировать до сотни различных белков в течение какой-нибудь одной недели. Тем не менее для амбициозных целей «протеомистов» этого далеко не достаточно. По их убеждению, необходимо развернуть намного более скоростное и массовое выявление, отождествление и изучение белков, но для этого необходимо радикально усовершенствовать устаревшие (20-летней давности) методы электрофореза. Сегодня, например, эти методы не позволяют выловить из клеточной протоплазмы гидрофобные (отталкивающие воду) белки. Но гидрофобными белками являются, в частности, все белки-реиепторы, пронизывающие мембрану клетки, а между тем именно эти рецепторы – самые важные мишени при разработке лекарств.
Однако на пути протеомики существуют и принципиальные трудности. Работа белков, как и работа генов, тоже зависит от многих факторов, и прежде всего от их пространственной структуры, а эта структура намного сложнее пространственной структуры генов: как пишет американский биолог Роберг Поллак, «гены – это линейный текст, а белки – трехмерная скульптура». Вдобавок в живой клетке форма белков может динамически меняться, что превращает их в подобие еще более сложной, «кинетической» скульптуры. Поэтому перспективы создания «каталога протеинов» еще более далеки, чем перспективы создания упомянутых выше каталогов генов, снипсов или вариаций метилирования. Учитывая эти трудности, «транскриптомисты», в свою очередь, утверждают, что оптимальный путь изучения работы генов состоит в изучении промежуточного продукта между генами и белками, а именно – тех небольших молекул («информационная РНК»), которые переносят инструкцию на создание того или иного белка от его гена к «внутриклеточным машинам» по производству белков («рибосомам»). Процесс переписывания такой инструкции с гена на РНК называется в биологии «транскрипцией», в силу чего этот подход и получил название «транскриптомики».
Работающий геном производит одновременно множество различных РНК, и транскриптомисты видят свою задачу в выявлении и расшифровке всех этих молекул. Решение такой задачи позволит выявить все работающие в данный момент гены, поскольку состав любой РНК является «химически дополнительным» к тому гену, с которого она транскрибирована; они с геном составляют, грубо говоря, «ключ» и «замок».
«Транскриптомистов» вдохновляет тот факт, что технология автоматического вылавливания и опознания этих РНК уже существует. Разработанная в последние годы несколькими американскими фирмами, она основана на так называемых биочипсах – небольших пластинках с подвешенными к ним короткими отрезками ДНК. Каждый такой отрезок извлечен из уже расшифрованных генов и является той «матрицей», с которой идет транскрипция какой-то определенной РНК. Когда эти свисающие с пластинки отрезки ДНК погружаются в раствор (в протоплазму, извлеченную из клетки в какой-то момент ее жизни), к каждому из них прилипает «его» РНК, и исследователю остается лишь извлечь чипе из раствора и проанализировать состав всех налипших на него РНК (предварительно «размножив», если нужно, ее количество с помощью так называемой полимеразной цепной реакции), но и это сегодня уже делается автоматически.
Остановимся на этом. Объем нашей статьи не позволяет более подробно обсуждать перспективы и трудности геномной биологии завтрашнего дня. Будем рассматривать наш беглый обзор как своего рода путеводитель по этой проблематике и как некое введение в связанные с нею темы. Нам наверняка еще доведется не раз обсуждать эти темы в будущем.