Откуда мы пришли? На этот вопрос истории человечества существует множество ответов. Поражающие воображение рассказы о нашем происхождении, предложенные мифами и религиями, оставили отпечаток в культурах надолго. Наука сегодня приводит ответы другого рода: ее задачей является описывать и объяснять то, что мы можем знать о нашем происхождении – начиная со знаний о развитии живого организма, которые мы накопили и которые постоянно усовершенствуем. Основное направление задано теорией эволюции – следствием учения Дарвина. Эта теория станет нашей отправной точкой. Затем к ней добавится открытие ДНК и основ генетики, затем появление популяционной генетики, которая приведет нас к современному знанию о разнообразии наших геномов – потрясающему инструменту для изучения современного человека, а также всего того, чем он обязан своему прошлому.
Для популяционной генетики все началось в 1859 году, с публикации «Происхождения видов» – потрясающей книги Дарвина, ознаменовавшей начало эры эволюционного учения. Чуть менее полутора веков спустя, в 2001 году, секвенирование генома человека произвело революцию в геномике. В период между этими двумя датами ученые совершили множество открытий, были усовершенствованы теории, появились новые технологии, благодаря чему мы можем теперь лучше понять эволюцию человека и дать новые ответы на вопрос: «Кто мы?».
Популяционная генетика базируется на двух дисциплинах: эволюционном учении и генетике. Эти науки появились независимо друг от друга в середине XIX века: их основателями были соответственно Чарлз Дарвин и Грегор Мендель. Но потребуются целые десятилетия, чтобы биологи увидели связь между основными процессами эволюции и принципами наследования. Конечно, у Дарвина были и предшественники, предвосхитившие или угадавшие идею эволюции. Еще во времена Античности некоторые философы – такие как Анаксимандр Милетский[3] или Эмпедокл[4] – имели представление об эволюции, о постоянном изменении и объяснимом без сверхъестественного происхождении жизни. Похожие озарения возникали и позднее, в эпоху Просвещения – например, у Дени Дидро[5]. Однако влияние учений, отстаивающих божественное происхождение живых существ, и в особенности груз двух тысячелетий христианства оттянули появление в Европе эволюционистской идеи до начала XIX века.
Дарвин смог преодолеть эту преграду, и посеянные им семена дали быстрые всходы. Минувший век собрал богатый научный урожай: он подарил нам принципы популяционной генетики, концепцию генотипа и открытие структуры ДНК и, кроме того, мы начали постигать разнообразие нашего вида, изучать его миграции и адаптации к окружающей среде. Наконец, секвенирование ДНК ископаемых организмов позволило нам узнать, что в ходе своей истории наш вид обменивался генетическим материалом с другими, ныне исчезнувшими видами людей – такими как неандертальцы или денисовцы. И это только начало.
Вопрос эволюции поднимался и другими учеными. Жан-Батист де Ламарк[6] (в книге «Философия зоологии»), Жорж-Луи Леклерк де Бюффон[7], Бенуа де Майе[8], а также Эразм Дарвин[9] (дедушка Чарлза) упоминали о возможности изменения видов, таким образом подвергая сомнению их постоянство. Но именно о Чарлзе Дарвине говорят как об отце теории эволюции, несмотря на то что сам он в своей книге избегает слова «эволюция» и пишет о «наследственной модификации».
Теория эволюции Дарвина основана на многочисленных наблюдениях, сделанных им главным образом во время экспедиции на борту корабля «Бигль», длившейся пять лет, с 1831 по 1836 год. Это событие он полагал самым значительным в своей жизни. Капитан корабля Роберт Фицрой нанял молодого ученого-натуралиста в качестве волонтера для выполнения картографической съемки в кругосветном путешествии. И Дарвин собирал сведения и вел наблюдение повсюду, где они останавливались: от островов Зеленого Мыса до лесов Амазонии, от Огненной земли до Галапагосов и Тихого океана. По возвращении в Англию – сначала в Кембридж, а затем в Кент – Дарвин, переполненный новыми сведениями, потратит тринадцать лет на то, чтобы превратить свои записные книжки в готовую рукопись, которую он, наконец, опубликует в ноябре 1859 года – из опасения, как бы Альфред Рассел Уоллес[10], собиравшийся опубликовать очень похожую теорию, не обвинил бы его в плагиате. Эта книга принадлежит к числу тех, что изменили наш мир. Ее название – «О происхождении видов путем естественного отбора» («On the Origin of Species by Means of Natural Selection»).
Основным положением теории эволюции Дарвина является утверждение об изменении и преобразовании видов под действием естественного отбора и в соответствии с медленными изменениями, наблюдаемыми в природе: эти наблюдения привели к принципу «Natura non facit saltus»[11] («природа не делает скачков»), или принципу непрерывности Готфрида Вильгельма Лейбница[12]. Таким образом, Дарвин стал первым, кто заявил, что все живущие на Земле организмы происходят от одного общего предка и что различия, характерные для каждого населяющего Землю вида, были приобретены под воздействием естественного отбора, являющегося, по мнению Дарвина, основным механизмом изменения, адаптации к окружающей среде и видообразования.
Чарлз Дарвин отстаивал идею, согласно которой ресурсы, например пища, представляют собой основной лимитирующий фактор роста популяции. Дело в том, что конкуренция, возникающая между индивидами или целыми видами в борьбе за ресурсы, ограничивает их способности к выживанию и размножению. Кроме того, Дарвин определил, что различия, наблюдаемые между индивидами или видами, передаются следующим поколениям, хотя сам принцип такой передачи остался неясен – он был неизвестен Дарвину и никак не связывался с генетикой. Именно эти различия влияют на способность индивидов или видов к выживанию и самовоспроизводству – сегодня это называется селективной ценностью, или «fitness» по-английски. С течением времени естественный отбор изменяет популяцию, поскольку выживают и дают потомство максимально адаптированные индивиды.
Эта теория, положившая начало философии эволюционизма, была революционной для своего времени и вызвала большие споры – несмотря на то, что современник Дарвина Альфред Рассел Уоллес пришел со своей стороны к точно таким же выводам. Двое ученых даже написали совместную статью о теории естественного отбора, которая вышла в 1858 году. После публикации книги Чарлз Дарвин вел уединенную жизнь в графстве Кент, глубоко подавленный поднявшейся вокруг его теории шумихой и спорами. Он скончался в 1882 году, в возрасте 73 лет.
В свою очередь, современник Дарвина австрийский аббат Грегор Мендель[13] является «отцом» генетики – второй дисциплины, лежащей в основе популяционной генетики. Благодаря его трудам о передаче наследственных признаков, опубликованным в 1865 году, наследственность, упомянутая Дарвином, стала научной концепцией, которая описывает наблюдаемую и управляемую реальность. Мендель провел тысячи экспериментов на растениях, а именно, на горохе с различными признаками (цвет и форма семян, цветков и т. д.): он проводил скрещивания и наблюдал, каким образом признаки распределяются между потомками. Своими опытами Мендель показал, что «факторы», которые тогда еще не назывались генами, передаются из поколения в поколение предсказуемым образом, и сформулировал три закона наследственности, теперь известные как законы Менделя. В то время оставшиеся незамеченными, эти законы были заново открыты в 1900 году Хуго де Фризом, Карлом Корренсом и Эрихом фон Чермаком. Казалось, что законы применимы только к дискретным (то есть качественным), но не к континуальным (то есть количественным, измеряемым) признакам, и, следовательно, противоречат теории Дарвина. Кроме того, именно Хуго де Фризу мы обязаны термином «панген» – ученый использовал его для обозначения физической единицы передачи признаков, а Вильгельму Йохансену – терминами «генетика» и «ген».
В отличие от Дарвина, труд которого получил огромный резонанс, труды Менделя не были по-настоящему оценены современниками: в течение трех десятилетий их почти не замечали, и Чарлз Дарвин никогда не читал его работ. А это значит, что связь между наследственностью и эволюцией еще предстояло открыть.
Объединение двух теорий – дарвинизма и менделизма – начинается в период между двумя мировыми войнами благодаря молодым исследователям британской биометрической школы Фрэнсиса Гальтона. Это были Роналд Фишер (1890–1962), Сьюэл Райт (1889–1988) и Джон Бердон Сандерсон Холдейн (1892–1964). Трое ученых сформуровали основы популяционной генетики – дисциплины, в которой эволюционная биология и генетика соединяются в одно гармоничное, математически подкрепленное целое.
Изучая генетические причины сложных болезней, Роналд Фишер заложил основы количественной генетики – активно развивающегося сегодня направления. Количественная генетика занимается статистическим анализом качественных признаков фенотипа – таких, например, как рост. Благодаря такому анализу возникла гипотеза, что изменчивость фенотипа зависит от множества генов. Одним из важнейших достижений Роналда Фишера стала демонстрация того, что изменчивость количественных признаков фенотипа подчиняется законам Менделя. Эту фундаментальную концепцию Фишер развивает в своей книге «Генетическая теория естественного отбора» («The Genetical Theory of Natural Selection»), заявляя, что эволюция происходит путем естественного отбора генетических мутаций. Он предполагает, что мутации, оказывающие сильное воздействие на фенотип, имеют больше шансов снизить селективную ценность («fitness») индивидов, тогда как «слабые» мутации имеют 50 % шансов ее повысить, и, таким образом, естественный отбор сохраняет преимущественно их. А значит, эволюция и изменение фенотипов[14] должны происходить постепенно, под воздействием многочисленных мутаций слабого влияния – как и предсказывал Дарвин… «Природа не делает скачков!».
Сьюэл Райт, со своей стороны, более всего известен благодаря двум понятиям: дрейф генов и адаптивный ландшафт. Под дрейфом генов понимается случайное изменение частоты встречаемости мутаций в каждом следующем поколении в пределах популяции. Это один из тех исключительных и непредсказуемых факторов, благодаря которым формируется генетическое разнообразие. Понятие «адаптивный ландшафт» в эволюционной биологии используется для отображения связи между мутациями и репродуктивным успехом популяции или вида, когда «fitness» (селективная ценность) представляется в виде своего рода топографической карты. Организмы могут перемещаться по этому «ландшафту» и оказываться на адаптивных «пиках» благодаря приобретению мутаций, позволяющих им лучше приспосабливаться к окружающей среде. Рассмотрим в качестве примера устойчивость к малярии. Дрейф генов может привести уже адаптированный вид как на вершину «пика» – (в этом случае вид окажется относительно устойчивым к малярии), так и в нижнюю точку «долины» – это будет означать, что вид плохо адаптирован и уязвим для малярии. Адаптивный ландшафт не статичен: популяция, спустившаяся с «пика» селективной ценности и находящаяся в «долине» с низким уровнем адаптивности, может заново оказаться на вершине «пика», еще более высокого, чем предыдущий. Если популяция под воздействием естественного отбора приобретет новые, благоприятные мутации, то может стать еще более устойчивой к малярии, чем была раньше.
И, наконец, третьим отцом-основателем популяционной генетики является Джон Бердон Сандерсон Холдейн. Он разработал математический подход, позволяющий понять, каким образом естественный отбор определяет частоту мутаций и как связаны между собой отбор, мутации и миграции. Холдейн также выдвинул гипотезу о связи между естественным отбором и устойчивостью к малярии, несмотря на то что подлинное авторство этого наблюдения, сделанного в 1949 году, принадлежит итальянскому генетику Джузеппе Монталенти. Именно Монталенти заметил, что нарушения в функционировании эритроцитов (талассемия[15] или дрепаноцитоз[16]) наблюдались главным образом в регионах, где малярия была распространенным заболеванием. И только в 1954 году Энтони Эллисон подтвердит гипотезу, что патологии эритроцитов могут защищать организм от малярии: этим объясняется увеличивающаяся частотность таких нарушений в регионах, где распространена малярия. Сегодня это показательный пример естественного отбора.
Подлинное развитие популяционная генетика получила гораздо позже, между 1930 и 1960 годами, благодаря взаимодействию естествоиспытателей, палеонтологов, математиков и генетиков, разработавших «синтетическую теорию эволюции». Эта теория, называемая неодарвинистской, стала апогеем идей Дарвина. Во главе нового научного движения стояли трое ученых – Эрнст Майр (1904–2005), Феодосий Добржанский (1900–1975) и Джулиан Хаксли (1887–1975). Вслед за Дарвином в своих работах они говорят, что эволюция – постепенный процесс, и это подтверждается как исследованиями в области генетики, так и наблюдениями естествоиспытателей. Изменчивость индивидов в пределах одной популяции порождается мутациями, рекомбинацией и переносом (потоком) генов[17]. Эволюция происходит в результате совместной работы двух механизмов: появления в пределах одной популяции новых мутаций и воздействия естественного отбора или дрейфа генов, изменяющих частотность мутаций в популяции. Синтетическая теория эволюции отстаивает идею, что естественный отбор – это главная движущая сила эволюции: она действует в условиях изменяющейся среды обитания и приводит к изменениям частотности мутаций, влияющих на фенотипы.
Тем не менее, несмотря на накопление теоретических знаний, укрепляющих научную базу популяционной генетики, эмпирических данных не хватало, и физический носитель наследственности еще не был известен. Открытие в 1953 году двуспиральной структуры ДНК стало поворотным моментом в развитии популяционной генетики. Фрэнсис Крик (1916–2004), Розалинд Франклин (1920–1958) и Джеймс Уотсон (род. 1928) показали, что ДНК состоит из двух цепочек соединенных между собой нуклеотидов четырех разновидностей, в состав которых входит сахар, связанный с фосфатной группой, и азотистое основание, обозначаемое буквами A, T, G или C. Эти нуклеотиды расположены в виде двойной спирали[18], «хребтом» (основой) которой служат сахара и фосфаты. Входящие в состав нуклеотидов азотистые основания соединяются водородными связями с комплементарным[19] основанием на другой цепочке.
Именно благодаря этим важным для молекулярной биологии – и для генетики – открытиям японец Мотоо Кимура смог объединить теоретический подход с эмпирическими данными, предложив в 1968 году теорию нейтральной эволюции. Эта теория предполагает, что большинство эволюционных изменений происходит из-за дрейфа генов, в отличие от синтетической теории эволюции, которая оказывала предпочтение воздействию естественного отбора. Так или иначе, нейтральная теория описывает эволюцию на молекулярном уровне, и сам Кимура признавал, что эволюция фенотипов не может происходить без воздействия естественного отбора.
Однако принцип популяционной генетики «природа не делает скачков» продолжал дарить нам все новые и новые открытия, часто идущие рука об руку с появлением новых технологий и методик. За последние пятьдесят лет произошел целый ряд значительных событий, и некоторые из них будут более подробно рассматриваться в следующих главах. Укажем самые важные:
• 1977 год: публикация первых методов секвенирования[20] ДНК, позволяющих расшифровать содержащуюся в ней информацию.
• 1984 год: за счет анализа ДНК показано, что человек и шимпанзе имели общего предка.
• 1987 год: первое генетическое доказательство, подтверждающее африканское происхождение нашего вида.
• 1997 год: первая последовательность ДНК из древней кости, принадлежащей неандертальскому человеку.
• 2001 год: первая публикация последовательности генома человека.
• 2010 год: открытие нового вида человека – денисовца, сделанное исключительно благодаря секвенированию его ДНК (использовали небольшой фрагмент фаланги пальца).
• 2010 год: первая публикация проекта «1000 геномов», открывающего путь к изучению генетического разнообразия человека на беспрецедентном новом уровне.
• 2018 год: завершение «UK Biobank» – грандиозного проекта по изучению человеческого биологического материала. Он стартовал в 2006 году в Великобритании, его задачей было проанализировать 500 000 геномов и выяснить степень влияния генетических факторов и воздействия окружающей среды на изменчивость фенотипов людей, а также на человеческие болезни.
Каким образом теоретические и математические модели популяционной генетики могут помочь с ответом на вопрос «Кто мы?»? Популяционная генетика возникла, потому что мы начали понимать, как в ходе эволюции проявлялось на макроскопическом уровне популяций влияние микроскопических изменений на уровне генов и молекулярных структур, лежащих в их основе. И именно теория эволюции сделала возможным этот необычайный синтез, давший единое объяснение всем уровням организации жизни.
Синтетическая теория эволюции позволяет нам лучше понять процессы, вызывающие изменение частоты мутаций во времени и пространстве в пределах данной популяции. Понимая их механизм, мы можем создавать реалистичные математические модели. Следовательно, теоретическое рассмотрение взаимодействия естественного отбора и дрейфа генов поможет нам с позиций современной генетики определить, каким образом эти процессы сформировали генетическое разнообразие той или иной популяции. Как только в нашем распоряжении оказываются соответствующие модели, остается лишь найти для них надлежащие данные. Другими словами, если мы научились хорошо моделировать прошлое на основании теоретических данных, мы получаем возможность «узнать» прошлое популяции на основании имеющихся сегодня реальных генетических данных. Это основной принцип исследования в популяционной генетике.
Но что это за эволюционные процессы, влияющие на генетическое разнообразие популяции? Десятилетия теоретических поисков в области популяционной генетики в XX веке показали, что эволюционные механизмы можно разделить на три большие категории: геномные факторы – мутация или рекомбинация[21], демографические факторы – дрейф генов или миграции, и факторы естественного отбора в различных его формах.
Мутация – это единственный процесс, который «создает» разнообразие, производя молекулярные изменения в ДНК и тем самым генерируя новые аллели[22]. Можно сказать, что мутация – это «материал для эволюции», на который могут воздействовать эволюционные механизмы. Когда клетка делится, она должна воспроизвести ДНК так, чтобы две дочерние клетки унаследовали ту же генетическую информацию, какую содержит материнская клетка. Двойная спираль ДНК обеспечивает простой механизм репликации: две ее цепочки раскручиваются, и каждая из них служит матрицей для синтеза новой цепочки с комплементарной последовательностью нуклеотидов. Этот процесс позволяет воспроизвести две идентичные спирали двухцепочечной ДНК. Однако в ходе репликации ДНК возможны «ошибки», когда исходное основание заменяется на другое, неподходящее. Несмотря на то что бо́льшая часть этих ошибок затем корректируется механизмами контроля и репарации[23], случается, что ошибки ускользают от контроля и становятся мутациями.
Различают два больших класса мутаций в зависимости от типа затронутых ими клеток. С одной стороны, существуют соматические мутации: они не затрагивают половые клетки, отвечающие за размножение, и, следовательно, не передаются потомству. Эти мутации могут появляться на протяжении всей жизни индивида в ДНК самых разных клеток. В некоторых случаях эти клетки в результате мутаций могут превратиться в опухоль. С другой стороны, когда мутации воздействуют на ДНК гамет, или половых клеток (сперматозоидов и яйцеклеток), то говорят о герминальных мутациях. В этом случае эмбрион станет носителем мутации, хотя ни один из родителей не имел ее в своем генотипе. Причиной около 80 % мутаций у потомков служит хромосомный материал, переданный отцом (сперматозоид), и количество мутированных сперматозоидов напрямую связано с возрастом отца. Тем не менее нередки и аномалии, переданные матерью, и они также имеют тенденцию увеличиваться с возрастом, хотя и в меньшей степени. На сегодняшний день мы знаем, что почти каждый из нас имеет при рождении 70 новых мутаций по сравнению со своими родителями; 55 из них приобретены от отца и 15 от матери.
Другой источник генетического разнообразия – рекомбинация. Этот процесс не создает новых вариантов генов, но производит новые их комбинации, а значит, новые геномы. У эукариотических организмов[24] рекомбинация происходит во время полового размножения благодаря мейозу – процессу, в результате которого формируются гаметы. Образование новых генетических комбинаций обеспечивает перемешивание генов и поддерживает генетическое разнообразие в популяции, что повышает возможности вида адаптироваться к изменениям окружающей среды. То есть мутация и рекомбинация – это эволюционные процессы, которые увеличивают генетическое разнообразие в пределах одной популяции и в то же время приводят к росту различий между популяциями.
Другим фактором, воздействующим на генетическое разнообразие популяций, являются демографические процессы. Для начала вспомним о дрейфе генов в определении Сьюэла Райта: изменение частоты аллелей в пределах одной популяции, которое не зависит от мутаций, естественного отбора и миграций. Причиной дрейфа генов являются совершенно случайные и непредсказуемые события, например, встречи сперматозоидов и яйцеклеток при половом размножении. Масштаб дрейфа генов связан с «эффективным размером» популяции, который представляет собой число индивидов данной популяции, обеспечивающее передачу генетического разнообразия следующему поколению. В больших популяциях частота мутаций останется относительно стабильной от поколения к поколению, так как влияние дрейфа генов в них, как правило, несущественно. Но вот в маленьких популяциях воздействие дрейфа генов будет очень заметным, со значительными флуктуациями частот аллелей с течением времени; дрейф генов может даже привести к исчезновению благоприятного аллеля или, наоборот, закреплению неблагоприятного аллеля в популяции.
Отдельные демографические события связаны с уменьшением размера популяции и наиболее значительными эффектами дрейфа генов. Прежде всего речь идет о географической или культурной изоляции популяции, об эффекте бутылочного горлышка – резком сокращении размера популяции вследствие изменения окружающей среды, войны или эпидемии – или об эффекте основателя, то есть основании новой популяции очень малым числом индивидов, принадлежавших ранее большой популяции. В этих условиях дрейф генов снижает генетическое разнообразие в пределах популяции, вместе с тем усиливая межпопуляционные различия.
Миграция (перенос, или поток генов) – это еще один демографический механизм, обеспечивающий обмен генами между популяциями. Прибытие мигрантов может изменить состав генетического разнообразия принимающей популяции, изменяя частоту встречаемости мутаций. Таким образом, миграция и скрещивание (или метисация) снижает генетическое различие между популяциями, которое могло бы привести к появлению нового вида. В случае популяции с малым (вследствие эффекта бутылочного горлышка или эффекта основателя) генетическим разнообразием прибытие мигрантов и последующая гибридизация с ними позволяют повысить уровень генетического разнообразия гораздо быстрее, чем мутации. Таким образом, миграции и мутации являются силами, противодействующими дрейфу генов: дрейф генов уменьшает разнообразие, а миграции и мутации повышают – это явление называется мутационно-дрейфовым равновесием. Миграция увеличивает генетическое разнообразие в пределах конкретной популяции, одновременно уменьшая генетические различия между популяциями.
И наконец мы добрались до факторов, изменяющих генетическое разнообразие популяции в рамках естественного отбора. Естественный отбор составляет основу биологической адаптации человека к окружающей среде. Он работает, когда существуют различия селективной ценности (fitness) среди индивидов. Поскольку фенотипические характеристики индивида во многом определяются генетическими изменениями, увеличивающими его шансы на выживание и размножение, они передаются новому поколению. Влияние естественного отбора на генетическую изменчивость неоднозначно, потому что оно зависит от конкретного типа отбора. Он может увеличивать, уменьшать или сохранять неизменным генетическое разнообразие.
В случае положительного отбора встречаемость благоприятной мутации в популяции будет быстро расти, адаптированность – увеличиваться; иначе говоря, будет увеличиваться селективная ценность мутации. Все больше распространяясь и, следовательно, вытесняя другие, эта благоприятная мутация приведет к уменьшению генетического разнообразия в пределах популяции и увеличению различия между популяциями – при условии, что воздействие окружающей среды, вызвавшее это событие, будет отличаться от такового для других популяций. Но это еще не все, потому что существуют другие формы естественного отбора – как, например, поддерживающий высокое генетическое разнообразие стабилизирующий отбор, – и эти формы могут увеличивать разнообразие в пределах одной популяции и уменьшать различия между популяциями. В отдельной главе мы рассмотрим различные формы естественного отбора и то, каким образом они влияют на разнообразие наших геномов и нашу способность к адаптации к окружающей среде.
Теоретические модели, разработанные во второй половине XX века, позволили нам понять, какой вклад каждый из факторов вносит в генетическое разнообразие популяций, а также создавать прогнозы геномного разнообразия для различных демографических сценариев. Благодаря этому популяционная генетика получила возможность дальнейшего развития. На основании многочисленных доступных на сегодняшний день данных о геномах популяций она может не только объяснять настоящее, исходя из эволюционирующего прошлого, но также использовать нынешнее состояние популяций, чтобы восстановить их эволюцию. Действительно, мы можем реконструировать прошлое, исходя из актуальных данных о геномах, и оценить важные параметры эволюционного развития: темп роста популяции, возраст мутации или активность миграции между двумя популяциями.
Генетические исследования начинают стремительно развиваться после 1977 года, когда появляются техники секвенирования, и в особенности благодаря проекту «Геном человека» – стартовавшей в конце 1988 года международной научной программе, задачей которой было определить полную последовательность ДНК генома человека. Первая версия генома, охватывающая 90 % последовательности, была получена в 2001 году, и вслед за ней в 2004 году опубликовали почти завершенную версию. Разница между первой – «черновой» – и окончательной версиями определяется покрытием секвенированной ДНК, другими словами, количеством несеквенированных участков, «пробелов», и степенью точности. Версия 2004 года содержит как минимум 400 пропусков. 99 % генома секвенировали с точностью менее одной ошибки на каждые 10 000 пар оснований. Эта работа сейчас продолжается, и референсная последовательность генома постоянно совершенствуется: в 2020 году количество пропусков становится уже менее 100.
Проект «Геном человека» ознаменовал собой начало новой эры[25] в генетике. Ученые получили возможность использовать последовательность ДНК для исследований как в медицинской, так и в популяционной генетике. Стоимость работ была астрономической; около 3 миллиардов долларов (2,7 миллиарда, если точнее) потратили, чтобы секвенировать около 3 миллиардов нуклеотидов (3,2 миллиарда, если точнее), которые составляют наш геном. В 2021 году, двадцать лет спустя после начала проекта, техники секвенирования стали такими совершенными, что теперь можно секвенировать целый геном, получив результаты с высоким уровнем точности, менее чем за 500 долларов. Как бы то ни было, секвенирование дает нам доступ к ключевым знаниям о структуре и содержании генома. На сегодняшний день мы знаем, что человеческий геном состоит из приблизительно 3,2 миллиарда нуклеотидов; что лишь 2 % генома являются «кодирующими», другими словами, содержат генетическую информацию, которая используется для синтеза белков – молекул, необходимых для возникновения живых существ. Мы знаем, что геном человека содержит примерно 20 000 генов, кодирующих белки; и что оставшаяся часть генома, то есть около 98 %, не является кодирующей и задействована по большей части в регуляции.
Последовательность нашего генома включает в себя так называемую ядерную ДНК, которая распределяется по 23 парам хромосом, находящимся в ядре каждой клетки. При этом у нас еще есть другой маленький геном, замкнутый в кольцо: митохондриальная ДНК. Она находится, как следует из ее названия, в митохондриях – крошечных органеллах клетки, отвечающих за производство необходимой для ее жизни энергии. По объему митохондриальная ДНК несопоставима с ядерной: в ней содержится всего 16 569 нуклеотидов и 37 генов – вот почему она стала первым геномом, который выбрали для секвенирования в 1981 году. Тем не менее далее мы увидим, что, несмотря на свой небольшой размер, митохондриальная ДНК открыла нам важнейшую информацию об эволюционном прошлом человека.
Для изучения необычайного разнообразия индивидов и популяций секвенирование генома человека на первых порах предоставило очень мало информации. По сути, речь шла об одной-единственной последовательности, а между тем каждый индивид, за исключением однояйцевых близнецов, обладает собственным уникальным геномом. И только с появлением в геномике новых технологий – таких как ДНК-микрочипы и секвенаторы нового поколения[26] – в сочетании со снижением расходов на секвенирование, начался золотой век в исследованиях разнообразия генома человека. Были созданы многочисленные международные консорциумы – как, например, проекты «ХэпМэп»[27] или «1000 геномов»[28], – перед которыми стояла задача изучить генетическое разнообразие человека во всей его полноте, содействуя таким образом исследованиям в области популяционной и медицинской генетики.
Благодаря этим исследованиям мы сегодня знаем, что существует несколько типов различий между геномами людей. Речь идет о масштабах мутаций – от одного-единственного нуклеотида до нескольких сотен тысяч – и их встречаемости. Самые распространенные и хорошо изученные мутации затрагивают единственный нуклеотид. Известный пример – однонуклеотидный полиморфизм, или SNP (произносится как «снип») – замещение в последовательности ДНК нуклеотида на другой (например, C меняется на T). Если мы возьмем геном любого из нас и сравним с референсной[29] последовательностью или сравним двух случайно выбранных индивидов в популяции, мы обнаружим в среднем от 3 до 4 миллионов «снипов». В подавляющем большинстве случаев эти изменения в геноме не влияют на его функции: они или находятся вне кодирующих участков гена – и тогда говорят о «молчащем» SNP, – или же обнаруживаются в экзонах гена (т. е. в участках, кодирующих белок), но при этом не приводят к замене кодируемой аминокислоты – и тогда говорят, что это синонимичный SNP. В большинстве случаев SNP нейтральны, они не влияют на приспособленность (fitness) индивидов. Нейтральные SNP очень полезны для изучения человеческих популяций, поскольку они позволяют проследить их историю – миграции, метисации, демографические изменения.
Тем не менее, в некоторых случаях SNP могут менять соответствующий белок и приводить к изменению фенотипа: неопасному – как, например, пигментация кожи, или вызывающему болезнь – например, муковисцидоз. Такие SNP делятся на несколько типов: миссенс-мутация (меняющие смысл, или несинонимические), когда SNP меняют аминокислотную последовательность соответствующего белка; нонсенс-мутация (бессмысленные) – когда кодон[30], обозначающий аминокислоту, заменяется стоп-кодоном, который производит неполный белок, в большинстве случаев не работающий. Если SNP не обнаружен в пределах кодирующего участка, это вовсе не означает, что он не влияет на функции гена. Действительно, мутации, находящиеся в регуляторных областях, – таких как энхансеры или промоторы (т. е. участки ДНК, отвечающие за управление экспрессией гена), могут модифицировать процесс экспрессии и в итоге изменять фенотип.
Но разнообразие, которое можно наблюдать при сравнении геномов различных индивидов, не ограничивается только SNP. Каждый из нас в равной степени отличается от референсной последовательности на приблизительно 450 000 коротких вставок или выпадений участков генома (иначе говоря, «инсерций» и «делеций», вместе называемых «инделы»), то есть участков ДНК, состоящих как минимум из 50 нуклеотидов, которые вставлены или удалены из последовательности ДНК. К этому добавляется особая форма генетической изменчивости, важность которой в последние годы стала очевидной: изменения “структуры” генома. Сюда относятся делеции или дупликации: ученые говорят о «вариации числа копий» (или по-английски copy number variation, CNV). Они различны у каждого индивида и влияют на число копий одного и того же гена или фрагмента хромосомы.