Ах ты гой еси, правда-матушка!
Велика ты, правда, широка стоишь!
Ты горами поднялась до поднебесья,
Ты степями, государыня, раскинулась,
Ты морями разлилася синими,
Городами изукрасилась людными,
Разрослася лесами дремучими!
Не объехать кругом тебя во сто лет,
Посмотреть на тебя — шапка валится!
Выезжало семеро братиев,
Семеро выезжало добрых молодцев,
Посмотреть выезжали молодцы,
Какова она, правда, на свете живет?
А и много про нее говорено,
А и много про нее писано,
А и много про нее лыгано.
Поскакали добры молодцы,
Все семеро братьев удалыих,
И подъехали к правде со семи концов,
И увидели правду со семи сторон.
Посмотрели добры молодцы,
Покачали головами удалыми
И вернулись на свою родину.
А вернувшись на свою родину,
Всяк рассказывал правду по-своему:
Кто горой называл ее высокою,
Кто городом людным торговыим,
Кто морем, кто лесом, кто степию.
И поспорили братья промеж собой,
И вымали мечи булатные,
И рубили друг друга до смерти,
И, рубяся, корились, ругалися,
И брат брата звал обманщиком.
Наконец полегли до единого
Все семеро братьев удалыих.
Умирая ж, каждый сыну наказывал,
Рубитися наказывал до смерти,
Полегти за правду за истину.
То ж и сын сыну наказывал,
И доселе их внуки рубятся,
Все рубятся за правду за истину
На великое себе разорение.
А сказана притча не в осуждение,
Не в укор сказана — в поучение,
Людям добрым в уразумение.
Эта часть книги главная. В ней собраны воедино свидетельства четырёх наук — как четырёх очевидцев. Каждая наука, каждый очевидец дают свое видение русского генофонда: антропология (глава 4) классическая антропогенетика (глава 5), молекулярная генетика (глава 6) и фамилии (глава 7). Эти четыре свидетеля по-своему описывают генофонд. Более того, каждая из этих наук говорит на своем языке. Методология, понятийный аппарат, терминология, стиль — всё различно в этих науках.
Конечно же, даже просто собрать в одной книге итоги этих наук чрезвычайно полезно для создания общей картины русского генофонда. Однако мы решили сделать ещё один шаг — помочь этим наукам заговорить на одном языке. Этим языком стала геногеография: сведения о русском генофонде, добытые каждой из этих наук, мы переводили на универсальный язык карт. Карты — это образы. Яркие, ясные, явные и не менее объективные, чем «числовая», табличная информация. «Географическая карта — это вербализованное изображение» [Родоман, 1990, с. 44].
Карты древнее письменности. Они могут быть использованы в виде некоего «эсперанто» для общения разных наук. Для чтения карт любой науки не надо быть специалистом. Достаточно лишь желания освоиться с чтением карт, чтобы пролистывать любой из Атласов — картографировано ли в нём распространение роста бороды, групп крови АВ0, гаплогрупп митохондриальной ДНК или же фамилий.
Но, конечно же, мы оказались не просто «переводчиками» на геногеографический язык. Разговор на одном языке ещё не гарантирует успешность встречи.
Ведь и семеро братьев говорили на одном языке, но не поняли, что их рассказы повествуют об одном и том же. Для того, чтобы встреча четырёх наук состоялась, каждая из «договаривающихся сторон» должна не просто сообщить о себе, о своих вкусах, привычках и достижениях. Она должна в какой-то мере забыть о себе и согласиться обсуждать общий предмет, интересующий и объединяющий всех. Этим предметом стала изменчивость русских популяций в географическом пространстве. Все иные темы, как бы ни были они важны для каждой из наук, оставлены за пределами этой книги. Главной темой первой встречи наук стала изменчивость русского народа в его историческом ареале — на Русской равнине. Для первой встречи такое самоограничение необходимо, чтобы соблюсти единство и стройность книги.
Только если мы зададим всем очевидцам один и тот же вопрос, мы сможем непредвзято сравнить их свидетельства. Только если мы составим все портреты генофонда одним и тем же методом, мы сможем определить, действительно ли они так же различны, как рассказы семи братьев. Или же, напротив, хорошо согласуются друг с другом и рассказывают нечто общее о русском генофонде. Каждая из следующих глав могла бы составить отдельную книгу. Однако все вместе они дают максимально полное, разностороннее описание генофонда. И мы не просто объединили их под одной обложкой. Но объединили их одним методом, общим языком, единой задачей, объединили их свидетельства в целостную картину генофонда.
Какой иной путь может приблизить нас к правде о русском генофонде?
— Но ты ведь и сам путешественник! Расскажи мне о своей планете…
— Ну, у меня там не так уж интересно, — промолвил Маленький принц. -
У меня все очень маленькое. Есть три вулкана… Потом у меня есть цветок.
— Цветы мы не отмечаем, — сказал географ.
— Почему?! Это ведь самое красивое!
— Потому, что цветы эфемерны.
— Как это — эфемерны?
— Книги по географии — самые драгоценные книги на свете, — объяснил географ. — Они никогда не устаревают. Ведь это очень редкий случай, чтобы гора сдвинулась с места. Или чтобы океан пересох. Мы пишем о вещах вечных и неизменных…
— А что такое «эфемерный»?
— Это значит: тот, что должен скоро исчезнуть.
В этой маленькой главе очень кратко описывается план картографического исследования генофонда и то, как построены те или иные карты книги. Общих методик построения, чтения и анализа карт здесь мы почти не касаемся. Детальное описание картографической технологии и материалов, на которых построено исследование русского генофонда, приведено в Приложении — там читатель найдёт ответы на многие вопросы.
Материалы нашей книги охватывают данные только по коренному населению и только в пределах «исконного» ареала — все прочие популяции эфемерны в глазах геногеографа (отмеряющего время не годами, а поколениями), а мы хотим обнаружить именно те черты русского генофонда, которые с наибольшим правом могут считаться «вечными и неизменными».
Основу всей книги составляют картографические Атласы. Они черпают свою информацию из специально созданных банков данных. Прежде всего, это созданный нами комплексный банк данных «Русский генофонд», который вобрал в себя и результаты исследований русского народа по классическим генетическим маркёрам (группы крови, биохимические, физиологические маркёры), и по ДНК маркёрам (аутосомные, мтДНК, Y хромосомы), и результаты изучения антропологами облика русского населения (соматология, дерматоглифика). Во-вторых, для анализа русских фамилий была создана специальная база данных «ONOMA» о географическом распространении десятков тысяч фамилий. В-третьих, создан банк данных о полиморфизме митохондриальной ДНК в популяциях мира («World Mitochondrial»). Он занимает особое положение, поскольку является сейчас наиболее полной мировой сводкой об изменчивости мтДНК. Однако эту главу мы посвятим не столько банкам данных, сколько картографическим атласам, созданным на их основе.
Почему же мы столько внимания уделяем картам и атласам? Потому что они являются стержнем нашего исследования. Именно благодаря картам мы можем увидеть структуру русского генофонда. И только благодаря картам можем сопоставить и объединить данные разных наук и разных типов признаков. Комплексное изучение объединяет все проекции генофонда, все его «портреты», созданные по каждому типу маркёров — будь то черты физического облика, фамилии, группы крови или ДНК маркёры. Цель такого синтеза — создать единый «портрет» генофонда, который выявит не эфемерные, а наиболее общие и устойчивые элементы генофонда, его архитектонику, тот каркас генофонда, который проявляется в большинстве карт самых разных признаков.
Карты отдельных признаков — Обобщённые карты одного раздела науки — Сравнение обобщённых карт разных разделов — Единый план анализа для всех разделов — Не только карты
Основу всех наших баз данных составляет однотипная информация: данные по географической изменчивости признаков в русских популяциях, а также в популяциях других народов. Каждый из этих признаков является геногеографическим маркёром. Изменчивость любого маркёра сформирована как его «личными» особенностями (для получения «общего портрета генофонда» они становятся второстепенными), так и общими тенденциями, объективно существующими в генофонде. Именно эти общие тенденции — не эфемерные, но наиболее устойчивые — мы и хотели выявить. Для этого мы от «простых» карт геногеографических маркёров переходили к их обобщённым картам. А далее — сравнивали обобщённые карты уже разных наук.
Мы старались на протяжении всей книги — вопреки разным традициям собранных нами наук — везде следовать единому плану исследования. Иначе как им заговорить на одном языке? Как обнаружить их видение русского генофонда?
ОДИН ПРИЗНАК — ОДНА «ПРОСТАЯ» КАРТА
Сначала мы картографировали изменчивость каждого признака каждой науки. И получили «простые» карты — карты для отдельных признаков.
Однако не всё так просто. По одной карте на каждый признак мы получаем только для одного и того же ареала. Если мы изменяем изучаемый ареал (например, выходим за пределы исторического ареала русского народа), то мы должны построить другую карту — географической изменчивости того же признака, но уже в новом ареале. Поэтому во второй части книги мы рассмотрели карты изменчивости признаков в ареале русского народа. А в третьей части книги — карты изменчивости этих же признаков, но уже в ареале населения Европы и Евразии.
МАССИВ «ПРОСТЫХ» КАРТ — ОДНА ОБОБЩЁННАЯ КАРТА
Затем для каждого массива «простых» карт строили обобщённые карты — по очереди для каждого раздела науки. Например, для одного из разделов антропологии (соматологии) мы построили тридцать «простых» карт, показывающих географическую изменчивость каждого из тридцати признаков физического облика. А затем на основе всех этих карт создали одну обобщённую карту — она дает «портрет» изменчивости русского народа по данным соматологии. И такие же операции провели для каждого раздела каждой науки: 1) соматология; 2) дерматоглифика; 3) классические генные маркёры; 4) маркёры мтДНК; 5) маркёры Y хромосомы; 6) аутосомные ДНК маркёры; 7) фамилии. В результате мы получили семь типов «портретов» — обобщённые карты для каждого из семи разделов антропологии, генетики и антропонимики.
Такие обобщённые карты показывают, как видится структура генофонда с точки зрения данного раздела науки. Географические закономерности, сходство определённых популяций друг с другом, сходство с соседними народами и многое другое удаётся выявить на каждой из обобщённых карт.
Однако вновь всё не так просто. Дело в том, что для каждого массива карт мы можем построить разные типы обобщённых карт — например, разные карты генетических расстояний, или генетического разнообразия, или же «синтетические» карты главных компонент. Но суть всех этих карт одна: по массиву «простых» карт создается одна обобщённая карта данного типа, раскрывающая облик генофонда, а не отдельных его признаков.
СРАВНЕНИЕ ОБОБЩЁННЫХ КАРТ РАЗНЫХ РАЗДЕЛОВ НАУКИ
И, наконец, на последнем этапе мы сравнивали портреты генофонда, полученные по разным типам признаков (по данным разных разделов наук). И те общие черты, которые проявились на большинстве портретов, мы сочли основными, важнейшими закономерностями в структуре генофонда.
Конечно, реальный анализ сложнее. Он включает не только картографирование, но и другие методы. Да и в самом картографировании не всё сводится к обобщённым картам. Последующие главы содержат много разнообразной информации по каждому типу признаков, и мы провели много разных видов анализа. Но всё-таки, если вычерчивать схему нашего исследования, его маршрут, его суть, то они именно таковы: 1) сначала «простые» карты отдельных признаков; 2) потом обобщённые карты по каждому из разделов науки; 3) и венчает работу сравнение основных закономерностей по разным типам признаков.
ПЛАН АНАЛИЗА
Анализ проведён для семи типов признаков: соматологии, дерматоглифики, классических генетических маркёров, аутосомных ДНК маркёров, митохондриальной ДНК, Y хромосомы, фамилий.
Для русского народа анализ каждого типа признаков проведён по единому плану. Сначала рассматривается специфика данного типа маркёров, история его изучения в русском генофонде и описывается накопленный массив данных. Затем картографируются отдельные признаки, даётся описание «простых» карт и количественные показатели их изменчивости, интерпретация выявленных закономерностей. На следующем этапе проводится обобщённый картографический анализ: строятся синтетические карты, объединяющие информацию всех карт отдельных признаков. Основным инструментом являются карты главных компонент, также используются карты генетических расстояний и показателей генетического разнообразия.
После того, как такой анализ проведён для каждого отдельного типа признаков, основные результаты сравниваются с данными других наук, что позволяет сделать общие выводы об объективной структуре русского генофонда, истории его формирования и взаимоотношениях с соседними популяциями.
В основу изучения каждого типа признаков нами положен картографический метод. Этот метод позволяет: 1) рассмотреть географическую изменчивость каждого признака; 2) рассчитать статистические показатели изменчивости каждого признака; 3) выявить общие статистические параметры генофонда по совокупности признаков данного раздела науки; 4) дать «геногеографический портрет» генофонда с точки зрения данного раздела науки (обобщённые карты по совокупности признаков этого типа); 5) наконец, количественно сравнить, насколько похож полученный «портрет» генофонда на «портреты», независимо созданные другими разделами науки.
На каждом этапе картографический анализ широко дополняется другими методами — многомерного шкалирования, сравнения спектра гаплотипов мтДНК, оценки разнообразия и инбридинга, спектра фамилий и другими. Но наша задача — изучить русский генофонд через его географию. Поэтому и главным инструментом, и главным итогом работы являются геногеографические карты.
Универсальный адаптер — Карта-это матрица — И лишь потом картинка — Что такое обобщённые карты — Что такое. Атласы — И как они устроены
БЕЗ КАРТ НЕТ СРАВНЕНИЙ
Почему только картографический подход позволяет объединять и сравнивать данные по разным типам признаков?
Признаки, изученные в разных популяциях, нельзя сравнить напрямую. Но можно сравнить интерполяционные карты распространения этих признаков. Так картографический подход становится единственным инструментом комплексного анализа.
Например, классические и ДНК маркёры изучены в разных популяциях. И сравнить результаты этих работ напрямую невозможно, если пользоваться лишь статистическими методами. Картографирование позволяет создать карты, на которых значения обоих признаков показаны в одних и тех же точках. Тем самым снимается проблема неравномерной и различной изученности разных признаков. Оценка надёжности позволяет не заходить при этом слишком далеко, чтобы не сравнивать данные по тем областям карты, которые недостаточно обеспечены исходной информацией.
ЧТО ТАКОЕ КАРТА
Любые карты мы всегда видим в графическом виде, как образ, картинку. Но эти изображения являются лишь производными от «базовых» компьютерных карт — цифровых моделей карты (ЦМ). Исходным материалом для построения цифровой модели служат значения признака в изученных популяциях, эта информация берется из банков данных. К этим данным применяется интерполяционная процедура и создаётся цифровая модель. Она представляет собой трёхмерный массив чисел, моделирующий геногеографические характеристики каждой точки карты: географическую широту, географическую долготу и значение картографируемого признака. Именно эти истинные «базовые» карты, которые для человеческого глаза предстают лишь как матрицы чисел, дают возможность строить графические карты.
Исходные популяции разбросаны в ареале неравномерно. Ареал как бы накрывается равномерной сетью, и для каждого узла сети рассчитываются интерполированные значения признака. Поскольку полностью идентичные сети набрасываются на распределение разных признаков, результаты оказываются полностью совместимыми. Каждый узел одной сети аналогичен соответствующему узлу другой сети. У них одинаковые координаты. И переходя от карты одного признака к карте другого, мы находим в аналогичном узле значение уже другого признака. Поэтому можно сравнить значения всех признаков в аналогичных узлах разных сетей. Мы можем количественно сравнивать любые интерполяционные карты друг с другом, если у этих карт одинаковые сети. Каждый узел сети — элемент общей матрицы. С матрицами можно проводить любые статистические операции. Матрица, сеть, цифровая модель интерполяционной карты — синонимы.
На основе цифровых моделей (а не графических образов) ведется весь точный картографический анализ: анализируются закономерности «простых» карт и строится множество специальных обобщённых карт.
Одну и ту же цифровую модель можно представить в разных графических вариантах, если использовать разные шкалы. При этом получаются различные картографические образы, отвечающие конкретным задачам исследования и особенностям зрительного восприятия. На рис. 10.3.1. (глава 10) в качестве примера показана одна и та же карта (одна и та же ЦМ), представленная в двух разных шкалах. В результате возникли два разных картографических образа. Поэтому при рассмотрении любых карт надо помнить, что непрерывный изменяющийся ряд значений ЦМ при создании графического образа превращён в небольшое число интервалов. И в зависимости от шкалы (границ интервалов) создаются разные графические образы. Это значит, что точное положение изолиний, каких-либо особенностей рельефа на карте не стоит абсолютизировать. Достаточно немного изменить шкалу, и изолиния пройдёт несколько иначе, и особенности очертаний изменятся. Поэтому мы говорим о выявлении резких границ только тогда, когда границы выявляются в самых разных шкалах, или выделяются по двум и более изолиниям.
ТИПЫ ОБОБЩЁННЫХ КАРТ
Важнейшим инструментом нашего исследования являются обобщённые карты. Мы создаём три типа обобщённых карт: карты главных компонент, карты генетических расстояний и карты разнообразия. Каждая из обобщённых карт показывает одну из главных тенденций в генофонде, концентрирует те закономерности, которые в картах отдельных признаков присутствовали только в очень «разбавленном виде».
КАРТЫ ГЛАВНЫХ КОМПОНЕНТ (synthetic maps) — самые популярные обобщённые карты и в отечественных, и в зарубежных геногеографических работах. Анализ главных компонент — это известный статистический метод, который позволяет от множества исходных признаков перейти к нескольким новым, которые называются главными компонентами и являются максимально информативными. При этом первые несколько главных компонент высоко коррелируют с большинством исходных признаков. То есть нам не нужно рассматривать всё множество исходных признаков — достаточно рассмотреть две-три главные компоненты, и при этом мы не потеряем информацию — главные компоненты покажут нам то главное, что есть во всей совокупности исходных признаков.
Две геногеографические школы, возглавляемые Ю. Г. Рычковым и L. L. Cavalli-Sforza, независимо пришли к мысли, что метод главных компонент идеален для выявления основных тенденций в генофондах. Эти два коллектива разработали оригинальные технологии картографирования главных компонент [Menozzi et al., 1978; Рычков, Балановская, 1992]. Точнее, методы расчёта карт главных компонент через карты отдельных признаков.[24]
Карты главных компонент — это карты новых, чрезвычайно информативных признаков. В отечественной традиции принято говорить, что они выявляют основные закономерности генофонда, за рубежом говорят более образно — о сценариях истории генофонда. Для признаков соматологии карты главных компонент заменяются их математическим аналогом — картами канонических переменных. Различие заключается лишь в методике расчёта (см. раздел 4.1.), а для интерпретации карт безразлично, какой показатель использован.
КАРТЫ ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ часто используются в отечественных исследованиях. Странно, что их не изобрели также за рубежом. Ведь в отличие от главных компонент, являющихся математической абстракцией, карты генетических расстояний проще для понимания. Генетические расстояния — интуитивно понятный и очень распространённый инструмент: они показывают величину различий между парой популяций. Чтобы получить карты генетических расстояний, нужно лишь нанести значения генетических расстояний на карту. В каждую точку карты нужно поместить величину расстояния от этой популяции (расположенной в данном месте карты) до одной и той же выбранной нами популяции. Эта популяция, от которой отсчитываются генетические расстояния до всех точек карты, в геногеографии называется «реперной популяцией». Реперную популяцию можно выбрать произвольно: англичане, угличане, смоляне, куряне, пене-ги, печенеги, немцы, ненцы, талыши, латыши, или же, например, «средние показатели Восточной Европы». Карта расстояний покажет, население каких территорий генетически сходно с реперной популяцией, а где генофонд резко отличен от генофонда реперной популяции.
Этот подход может применяться к любым признакам. Но если при анализе генов мы говорим о «генетических расстояниях», то при анализе антропологических данных используются другие формулы расчёта расстояния (степени различий двух популяций). Для геногеографии словосочетания «генетические расстояния», «многомерные расстояния», «обобщённые расстояния» — синонимы. Метод картографирования генетических расстояний описан в Приложении, а также главах 8 и 9.
КАРТЫ РАЗНООБРАЗИЯ — третий тип обобщённых карт — ещё проще и очевиднее. Тем удивительнее, что, хотя показатели генетического разнообразия популяций рассчитываются всеми популяционными генетиками, эти значения наносились на карту обычно лишь в отечественных геногеографических работах. Карты разнообразия показывают уровень генетического разнообразия для каждой точки карты. Есть несколько показателей разнообразия, например — гетерозиготность. Или гаплотипическое разнообразие, карты которого могут быть двух видов: 1) карты общего гаплотипического разнообразия популяции (аналог гете-розиготности для гаплоидных однородительских ДНК маркёров) и 2) карты разнообразия гаплотипов в пределах одной гаплогруппы (показатель возраста гаплогруппы).
Большинство карт разнообразия, рассматриваемых в этой книге, отражают внутрипопуляционное разнообразие. Однако иногда мы создаём и карты межпопуляционной изменчивости. Такие карты полезны как для выявления различий в степени межпопуляционной изменчивости в разных регионах, так и для поиска «генетических границ», то есть зон резких изменений в генофонде (близкий подход использован в работах [Barbujani, Sokal, 1990; Rosser et al., 2000]). Наконец, особым видом карт разнообразия являются карты случайного инбридинга (см. раздел 7.6.).
«КОМБИНИРОВАННЫЕ» КАРТЫ. Кроме карт главных компонент, карт генетических расстояний и карт разнообразия в этой книге использованы и иные карты, представляющие алгебраическую комбинацию нескольких «простых» карт.
Суммарные карты. Эти карты являются суммой отдельных карт, объединяемых по характеру их генетического ландшафта или иным свойствам. При построении таких карт суммируются значения, находящиеся в аналогичных узлах всех исходных карт (карт отдельных признаков). Мы приводим карты суммарной частоты западно-евразийских и восточно-евразийских гаплогрупп мтДНК (разделы 8.2. и 9.2.).
«Карты прародины» (см. раздел 9.2.) являются произведением двух карт: карты частоты гаплогруппы и карты разнообразия той же гаплогруппы. «Карты прародины» показывают, где одновременно высоки и частота, и разнообразие, то есть оконтуривают возможную область прародины гаплогруппы.
Карты генетического риска (раздел 5.2.) рассчитываются по алгебраическим формулам из карт аллелей. Они показывают уровень генетической предрасположенности населения к тем или иным заболеваниям с учетом взаимодействия генов.
В зависимости от задач исследования, можно создавать множество различных комбинированных карт — «алгебраичность» цифровых моделей и разработанное нами программное обеспечение GGMAG и MAPSTAT предоставляют для этого неограниченные возможности.
ЧТО ТАКОЕ АТЛАС
Рабочее название этой книги звучало так: «Атласы русского генофонда». Карты переполняют её, являются тем стержнем, который объединяет анализ всех типов признаков — антропологии, классической генетики, молекулярной генетики, фамилий. Но случайная подборка бесчисленных карт ещё не позволяет ни сравнить разные типы признаков, ни понять генофонд. Для этого нужны картографические атласы.
Необходимым инструментом геногеографии служат «простые» карты — карты распределения признака по ареалу популяции. Однако каждая отдельно взятая «простая» геногеографическая карта заранее неизвестным образом соединяет в себе как бы две карты. Одна составляющая («общий ландшафт») отражает универсальные свойства пространственной структуры генофонда, его каркас, его архитектонику. Общий ландшафт одинаков во всех «простых» картах, он как бы является подстилающей основой. Вторая составляющая («особенное») простой карты вбирает все особенности в географии данного признака — особенности взаимодействия отдельного гена с окружающей средой, особенности истории дрейфа генов и отражения миграций. Чтобы отделить общее от особенного, надо от создания «простых» карт перейти к созданию геногеографического атласа изучаемого генофонда.
Картографический атлас представляет собой «систематическое собрание географических карт, выполненное по общей программе как целостное произведение» [Салищев, 1982]. Чтобы стать геногеографическим атласом, собрание геногеографических карт должно удовлетворять следующим требованиям, сформулированным еще 15 лет назад [Балановская и др., 1990]:
1) Должны быть соблюдены единые критерии организации исходных популяционно-генетических данных в отношении автохтонности населения, популяционных ареалов и других параметров.
Это означает, что ко всем популяциям надо предъявить одни и те же требования (например, коренное сельское население, в пределах «исконного» ареала, объём выборки не ниже такого-то, данные только по маркёрам определённого типа). И включить в анализ только те популяции из имеющихся в банке данных, которые удовлетворяют этому единому набору критериев. Если часть данных не удовлетворяет этим критериям (например, не коренное население) — такие данные нельзя включать в тот же атлас, но можно создать отдельный «атлас современного населения».
2) Должны быть выдержаны единые принципы построения карт, единая техника их расчёта и приёмов изображения, унификация географического и генетического масштабов, легенды карты и т. д.
Все карты должны быть построены одной программой, с одними и теми же параметрами картографирования. Все карты атласа должны относиться к одному региону. При наложении таких карт друг на друга все моря и реки совпадают. Шкалы должны подбираться по общим принципам, например, только равномерные шкалы, постоянное число интервалов для всех карт данного типа.
3) Выполнение этих требований должно обеспечивать единство правил прочтения и анализа всех ге: ногеографических карт, высокий и единый уровень воспроизводимости всех карт атласа.
Все карты одного типа читаются одинаково — например, тёмно-окрашенные (на цветных картах коричневые) области на любой карте означают максимальные значения признака. Но карты разного типа читаются по-разному. Например, на картах генетических расстояний минимальные значения означают сходство с реперной популяцией (и близки к нулю), а на картах главных компонент — область одного из двух экстремумов (отрицательные значения).
4) Геногеографический атлас должен завершаться картографическим обобщением частных карт, дающим интегральные характеристики географической структуры генофонда популяции.
Действительно, именно раздел обобщённых карт несет важнейшую информацию о генофонде. Это обычно небольшое количество обобщающих карт.
КАК УСТРОЕНЫ АТЛАСЫ
В нашем исследовании по каждому типу признаков создан отдельный картографический Атлас: по одному атласу на данные каждой науки. Все Атласы являются геногеографическими. Именно это их объединяет — методы построения, цели их создания, способ интерпретации. А сами данные различны: антропологические признаки, классические генетические маркёры, ДНК маркёры, фамилии.
Полностью совместимые электронные картографические Атласы русского генофонда по данным соматологии, дерматоглифики, антропонимики, классической и молекулярной генетики созданы впервые — и впервые эта книга дает возможность напрямую сопоставить результаты, полученные всеми этими науками.
Масштаб Атласов русского генофонда задан историческим ареалом русского народа — все карты построены в пределах «исконного» русского ареала. Однако для ряда признаков мы создали и картографические Атласы в масштабе двух других регионов: Восточной Европы и Евразии. Карты Восточной Европы особенно важны для понимания взаимодействия русского генофонда с соседями. Эти карты показывают изменчивость во всех популяциях Восточной Европы, включающих наряду с русским генофондом и популяции всех других генетически изученных народов этого региона. Карты Евразийского генофонда позволяют рассмотреть русский генофонд в общемировом масштабе изменчивости, позволяют определить его место в системе генофондов человечества.
В разделе 5 Приложения мы приводим основную «техническую» информацию о картографических атласах, на которых построена книга. Эта информация справочного характера — к ней можно обращаться по необходимости, читая интересующую главу. Однако она может служить и путеводителем, позволяя решить — стоит ли заглядывать в ту или иную главу? Поэтому для каждого атласа мы указали, в каких главах рассматриваются его карты.
Антропологические измерения предоставляют историку чрезвычайно обильный и многочисленный, но однообразный и односторонний материал.
Этнический ареал русского народа на протяжении столетий неуклонно расширялся, включая в себя сначала окраины Восточно-Европейской равнины, а потом Урал, Сибирь, Кавказ и многие иные отдалённые территории. Но популяции, сформировавшиеся исторически недавно в результате переселений или смешений, мало информативны для понимания этногенеза и истории становления русского генофонда. Если мы хотим заглянуть в прошлое, то намного важнее проследить историю формирования основной «исконной» части этнического генофонда, чем судьбы отдельных, поздно выделившихся или смешанных субпопуляций. Поэтому для целей нашей книги важнее ограничиться этническим ядром русского народа — «исконной» территорией формирования генофонда. В геногеографическом разнообразии населения именно этой территории отражены основные события этногенеза и этнической истории. Ведь мы ищем следы событий, сформировавших генофонд народа, а не следы его последующего расширения и смешения.
Если наша книга — это взгляд в прошлое, то для изучения истории становления русского генофонда нет необходимости рассматривать русское население на тех территориях, где оно появилось исторически недавно — в XX веке, в XIX, в XVIII. Все эти популяции мало информативны для решения основной задачи книги, и поэтому мы их касаться не будем.
Недаром при планировании Русской антропологической экспедиции, доныне остающейся образцом антропологического изучения, Виктор Валерьянович Бунак указывал, что её цель — характеристика «основных антропологических элементов, вошедших в состав русского населения, и изучение общих вопросов его этногенеза, поэтому в плане работ экспедиции первое место занимала этническая зона формирования русского населения в XI–XIV веках» [Происхождение…, 1965, с. 24]. Иные территории — Поволжья, Дона, Урала и т. д. «были прочно заселены русскими в эпоху, когда этнический тип русских уже сформировался. Все эти территории… при всём их антропологическом интересе не имеют решающего значения» для изучения состава русского населения [Происхождение…, 1965, с. 24].
Аналогично и М. В. Битов, изучая антропологию Русского Севера, охватывал лишь те территории, которые были колонизированы в хронологических рамках XII–XVII веков — от Уставной грамоты Святослава Ольговича 1137 г. до окончания значительных массовых передвижений русского населения XVII века [Битов, 1997]. Он не включал в своё исследование последние этапы этого процесса: «Я имею в виду, конечно основную территорию Русского Севера, или Поморья, как именуют эту область документы XVII столетия, т. е. Заонежье, бассейн Двины с Сухоной и Югом, побережья Белого моря, бассейн Мезени, и оставляю в стороне окраинные области, заселённые в значительной степени позднее: Кольский полуостров, Вятку и Пермь Великую. Впрочем, последние две области лишь административно входили в число поморских уездов в XVII в., а с историко-географической и с историко-культурной точки зрения долгое время представляли собой особые, отличные от Поморья территории» [Битов, 1997, с. 9].
И мы, определяя основной («исконный», «исторический») ареал русского народа, следуем авторитетному мнению В. В. Бунака и М. В. Витова. Как мы видим из приведённых цитат, конкретные временные рамки могут варьировать для разных территорий. Но смысл один — это те территории, где формировался русский народ (а не те, где он впоследствии расселился). Картографирование данных о русском генофонде мы проводим именно в пределах «исконного» ареала, как его понимали В. В. Бунак и М. В. Битов.
Трудности сравнения классификаций — Возможность сравнения карт — Карты соматологии и дерматоглифики Карты простые и обобщённые — Коннексия — Традиционность и новизна приводимых карт
Картографические атласы изменчивости признаков антропологии в историческом ареале русского народа включают разнообразные компьютерные карты — как распространения отдельных признаков, так и разные виды обобщённых карт. Атласы являются своеобразным итогом многолетнего изучения антропологии русского народа. Отдельно проведён картографический анализ признаков соматологии, отдельно — признаков дерматоглифики. Наша задача — во-первых, отыскать наиболее общие черты в структуре фенофонда (фенофонд — совокупность антропологических признаков населения). А во-вторых — проверить, есть ли сходство в изменчивости фенофонда и генофонда русского народа?
Антропология всегда привлекалась генетиками для объяснения своих результатов. Поиск аналогий между популяциями, близкими по частотам генов, и антропологическими типами региона — постоянный мотив такого рода исследований. Но при этом поле взаимодействия двух наук очень узко: генетики просто проверяют, соответствуют ли их результаты антропологической классификации. Но ведь она была разработана совсем другими методами и для иных целей! К тому же генетики далеко не всегда могут уследить за причудливой иерархией антропологических типов. Отсутствие жёсткой и однозначной классификации антропологических типов является несомненным достоинством антропологии. Оно отражает объективную картину — между антропологическими вариантами действительно нет резких границ. Потоки миграций и смешения, чутко выявляемые антропологией, создают плавный узор антропологического покрова. Однако лабильность антропологических классификаций порой приводит генетиков в отчаяние. Оттого они порой применяют классификации, созданные антропологами, не всегда умело, или же используют лишь те варианты или разделы, которые «подходят» к их генетическим данным. По-видимому, есть лишь один путь для корректного применения антропологических классификаций в генетике: нужна совместная, рука об руку, работа антропологов и генетиков. Этим путём мы и шли.
ГЕНОГЕОГРАФИЯ
Нам помогло очень важное обстоятельство: методы обобщённого анализа применимы в обеих науках. Это значит, что можно не просто сравнивать результаты, но и сам анализ исходных данных обеих наук — антропологии и генетики — проводить одним и тем же методом, параллельно. Иными словами, можно сравнивать не окончательные итоги (выводы, классификации, кластеры), а сами первичные данные обеих наук изучать строго одними и теми же методами. Тогда полученные результаты будут сопоставимы на всех шагах анализа. Именно такой подход, когда методические различия между анализом генетических и антропологических данных сведены к минимуму, и применён нами для изучения генофонда (и фенофонда) русского народа.
СТРУКТУРА КАРТОГРАФИЧЕСКИХ АТЛАСОВ
Устройство двух антропологических атласов русского народа описано ниже (раздел 5 Приложения). Мы провели картографический анализ двух систем антропологических признаков: соматологии (физического облика) и дерматоглифики (кожных узоров). Под термином «антропологические» часто имеют в виду данные только соматологии, и мы тоже порой будем использовать их в этом привычном значении. Но правильнее все же различать сома-тологические, дерматоглифические, одонтологические, палеоантропологические признаки, объединяемые под общим понятием «антропологических» данных.
В основу анализа данных соматологии легла сводка, составленная профессором кафедры антропологии МГУ В. Е. Дерябиным (раздел 5 Приложения). В нее вошли все основные данные по антропологии русского населения (работы В. В. Бунака, Т. И. Алексеевой, М. В. Витова, В. П. Алексеева). В основу анализа данных дерматоглифики легла сводка, составленная известным специалистом в этой области — сотрудником Института этнологии и антропологии РАН к.б.н. Н. А. Долиновой. В нее вошли все основные данные по дерматоглифике русского населения. Работа по составлению сводок и их включению в геногеографический анализ велась в сотрудничестве генетиков и антропологов в рамках проектов РФФИ[25].
Напомним (глава 3, раздел 3.2., раздач 5 Приложения), что картографические атласы антропологии включают несколько разделов «простых» карт и «обобщённых» карт.
1) География каждого признака соматологии по данным Русской антропологической экспедиции («РАЭ»): 107 популяций, 30 признаков. Изученные РАЭ популяции охватывают весь «исконный» ареал русского народа. Лишь Русский Север изучен менее подробно. Он был основным предметом исследований М. В. Витова, работавшего почти одновременно с РАЭ.
2) География каждого признака соматологии по объединённым данным РАЭ и М. В. Витова («АБВ»[26]): 180 популяций, 18 признаков. Совместный анализ этих массивов данных выполнен впервые. С 1953 по 1957 годы М. В. Битовым были обследованы около восьми с половиной тысяч русских мужчин (82 популяции). Чтобы включить в единый анализ все популяции, изученные РАЭ и М. В. Битовым, нам пришлось сократить перечень признаков: далеко не все они поддаются коннексии. Объединив данные из двух источников, и анализируя уже не 107, а 180 русских популяций, мы можем создать карты лишь 18 признаков. Однако эти признаки являются ведущими и дают весьма полное представление об антропологическом облике русского народа.
3) География каждого признака дерматоглифики: 28 популяций, 7 ведущих признаков дерматоглифики. Дерматоглифические данные по русскому народу картографируются впервые.
4) География ведущих закономерностей антропологии. Эти разделы Атласа включают: обобщённые карты многомерных расстояний (РАЭ и АБВ) и канонических переменных (РАЭ и АБВ) по соматологии; обобщённые карты главных компонент по дерматоглифике. Именно эти разделы Атласа мы рассматриваем как основные. Они позволяют, во-первых, обобщить антропологические данные, и, во-вторых, сравнить данные антропологии со свидетельствами прочих «очевидцев».
Фрагменты Атласа представлены на сайте www.genofond.ru. Общая характеристика карт разделов «отдельные признаки соматологии (АБВ)» и «отдельные признаки дерматоглифики» приведены в таблице 4.1.1.
«Простые» карты (для каждого отдельного признака) позволяют наглядно изобразить, рассмотреть и проанализировать изменчивость тех черт, которые составляют физический облик населения.
Обобщённые карты выявляют основные закономерности, скрытые в картах изменчивости отдельных признаков соматологии и дерматоглифики. Именно обобщённые карты выявляют пространственную структуру фенофонда.
Формально, уже карты отдельных признаков антропологии можно напрямую сравнивать с картами классических и ДНК маркёров. Ведь все они построены по одной технологии, по единой методике. Но намного информативнее и привлекательней будет сравнение иных — обобщённых карт антропологии и генетики. Здесь мы уже отвлекаемся от множества исходных признаков и переходим к признакам обобщённым, к обзору того единого здания, которое до этого рассматривалось каждой наукой со своей стороны. Такое сравнение пространственных структур генофонда и фенофонда русского народа позволит нам отделить «частное» (выявляемое только данной наукой) от «общего» каркаса генофонда, его архитектоники, его истории, который должен проявиться и в антропологических, и в генетических итогах изучения русского народа. Сравнение фенофонда и генофонда, сравнение свидетельств разных «очевидцев» является одной из главных задач нашей книги и её «многоочего» подхода.
Сопоставить антропологическую и генетическую обобщённые карты, когда они уже получены, несложно. Но когда генетик пытается создать антропологические карты, его поджидают как минимум две трудности.
Первая вызвана необходимостью в коннексии разных антропологических данных (в генетике коннексия обычно не нужна). Вторая — в методике многомерного анализа: для данных соматологии (связанных внутригрупповыми корреляциями) необходимо рассчитывать канонические переменные вместо привычных генетикам главных компонент.
КОННЕКСИЯ ДАННЫХ
Особенностью антропологических исследований является неизбежная поливариантность при измерениях одних и тех же признаков, причём разные антропологические школы используют несколько отличающиеся правила измерений. Поэтому при сопоставлении данных, полученных разными антропологическими школами (или даже одной, но в разные годы), возникает необходимость в коннексии данных. Коннексия — это пересчёт, приведение «к общему знаменателю», сведение в единую систему, перевод на «единый язык» данных разных исследователей. Для возможности такой коннексии разные авторы намеренно изучают ряд одних и тех же популяций — это даёт возможность найти коэффициенты для пересчёта данных в единую систему. Генетикам важно знать, что прямое объединение опубликованных антропологических данных (без коннексии) может привести к резкому искажению результатов. Немаловажно поэтому, что в нашем случае коннексия данных проведена специалистом-антропологом — профессором В. Е. Дерябиным.
КОМПЬЮТЕРНАЯ КАРТОГРАФИЯ
Напомним, что первые (значковые) карты изменчивости отдельных антропологических признаков в русском населении были созданы и описаны В. В. Бунаком и Т. И. Алексеевой в 1965 г. [Происхождение…, 1965], а их обобщённые значковые карты созданы недавно В. Е. Дерябиным [Дерябин, 1999,2002]. Однако значковые карты являются лишь иллюстрацией уже выявленных закономерностей — они не могут служить объектом дальнейшего статистического анализа. Их нельзя напрямую сопоставлять с данными генетики. Напротив, компьютерная геногеография, создаёт полностью сопоставимые интерполяционные карты любых признаков — и генетики, и антропологии. Поэтому методами геногеографии мы можем объективно сравнить антропологический и генетический портреты русского народа, у нас появляется возможность картографического синтеза данных антропологии и генетики.
Созданные картографические Атласы антропологии русского народа имеют и самостоятельную ценность: в них впервые представлены интерполяционные (а не значковые) карты отдельных признаков и обобщённых параметров фенофонда. Полезная особенность Атласов еще и в том, что в них впервые построены карты для соматологических признаков, учитывающие данные и В. В. Бунака, и М. В. Витова. Поэтому раздел атласа (по данным АБВ) является наиболее полным на данный момент источником картографической информации об изменчивости соматологических признаков в русском населении.
Таблица 4.1.1.
Статистические характеристики карт антропологических атласов
§ 1. Рост бороды и длина тела: Бородатый Юг — Бороды и реки — Высокорослый Запад — Без акселерации — Северные минимумы
§ 2. Скуловой диаметр, цвет глаз и волос: Широколицый Запад — Темноглазый Юг — От Поволжья на Русский Север — Различия карт цвета глаз и волос — Широтная изменчивость
§ 3. Горизонтальная профилировка лица и форма носа: Полосатая карта — Юго-западные спинки
Многие карты антропологического Атласа можно будет просмотреть на сайте www.genofond.ru. Поэтому здесь приведем карты лишь семи соматологических признаков (рис. 4.2.1–4.2.7), построенных по объединенным данным экспедиции В. В. Бунака и Т.П. Алексеевой и экспедиции М. В. Витова («АБВ»).
РОСТ БОРОДЫ
Рассмотрение антропологических признаков стоит начать с самого примечательного — роста бороды.
Для каждого мужчины старше 30 лет он измеряется в баллах так, как показано на рис. 4.2.1.А. Балл 1 соответствует наименьшему росту бороды, а балл 5 — наибольшему, причём в общемировом, а не в региональном масштабе.
Рис. 4.2.1. А. Рост бороды. Схема определения баллов роста бороды (по [Рогинский, Левин, 1978]).
1 — очень слабый, 2 — слабый, 3 — средний, 4 — сильный, 5 — очень сильный.
Рис. 4.2.1.Б. Карта распределения роста бороды
Географические закономерности в распределении роста бороды показывает карта на рис. 4.2.1.Б. Картографируется популяционный показатель: для каждой популяции берется средняя величина между всеми индивидуальными баллами роста бороды (полученными для каждого из мужчин, обследованных в данной популяции). На карте светлые тона означают малые значения признака. Тёмные тона — большие значения признака.
Мы видим в «исконном» русском ареале чёткий градиент в направлении «север<=>юг». Малые значения роста бороды (с минимальным показателем 2.1 балла в Пермской, Вологодской и Архангельской областях) сосредоточены в северной части ареала русского народа. Тёмные тона, указывающие на более интенсивный рост бороды (с максимальным показателем 3.1 балла), находятся в южной части ареала. Условная граница легко проводится примерно по 59 параллели. Таким образом, условный рубеж проходит примерно по широте Новгорода Великого, а более южные Тверь и Кострому уже можно отнести к области более интенсивного роста бороды.
В таком элегантно простом распределении признака можно выделить два симметричных исключения: северо-восточный и юго-западный «коридоры» среднерусских значений (интервал от 2.5 до 2.6 балла, включающий в себя среднее значение карты 2.59). Северо-восточный «коридор» тянется вдоль Двины, Мезени и Печоры до самого побережья Баренцева моря. Юго-западный «коридор» средних и несколько пониженных значений роста бороды проходит в основном по Смоленской области, по границе России и Белоруссии.
Любопытный «язык» высоких значений тянется вдоль верхней Волги, тогда как Волго-Окское междуречье характеризуется промежуточной интенсивностью роста бороды.
Ту же закономерность можно описать и несколько иначе — менее схематично, пробуя найти географические факторы в изменчивости признака. Условная граница, разделяющая области с малыми и средними (конечно же, в «русском» масштабе) показателями роста бороды, достаточно точно следует извивам Волги. Популяции, расположенные на самой Волге и по её правым (южным) притокам, характеризуются среднерусскими баллами роста бороды. Популяции по левым, северным притокам Волги и вообще все северные популяции (т. е. бассейнов Белого и Балтийского морей) характеризуются низкими показателями роста бороды. Любопытно, что граница между областями со средними и высокими баллами роста бороды, в свою очередь, проходит по Оке. То есть при таком рассмотрении мы опять видим три области: северную (севернее Волги) с низкими показателями роста бороды, среднюю (Волго-Окское междуречье) со средними значениями роста бороды и южную (южнее Оки) с высокими баллами роста бороды. «Юго-западный коридор» пониженных значений хорошо укладывается в такую «речную» схему, поскольку популяции «коридора» относятся к бассейну Днепра, то есть они (как и северные популяции с низкими баллами роста бороды) не входят в бассейн Волги. Высокие баллы роста бороды свойственны в особенности популяциям на правобережье Оки и в территориально смежном бассейне Дона.
ДЛИНА ТЕЛА
Другие антропологические признаки не имеют столь ясного географического распределения, как только что рассмотренная интенсивность роста бороды. Коэффициент вариации (табл. 4.1.1.) позволяет сравнить степень изменчивости признаков, измеренных в разных шкалах (например, сантиметры длины тела и баллы роста бороды). Коэффициент вариации длины тела составил только 0.7, а для роста бороды — на порядок больше (7.9). Возможно, именно из-за этой небольшой изменчивости, карта длины тела (рост, измеряемый в сантиметрах, рис. 4.2.2.) не обнаруживает таких чётких закономерностей, как для роста бороды. Можно лишь указать общий тренд уменьшения длины тела в направлении с запада на восток и на север.
Рис. 4.2.2. Карта распределения длины тела
Напомним, что все приводимые антропологические карты описывают мужское население. Подчеркнём, что картографировались «послевоенные» показатели: обследования РАЭ и М. В. Витова проведены в пятидесятые годы. Для такого признака, как рост, это имеет решающее значение. Экспедиции проведены еще в то время, когда процессы акселерации мало затронули русское на- селение: наиболее интенсивна акселерация была в 60е-70е годы, а к 90м годам её процесс уже стал затухать [Харитонов и др., 2004]. Поэтому воплощённые на карте «послевоенные» данные «АБВ» информативны для изучения этногенеза. Они отражают интересующую нас историю формирования русского населения, а не временные флуктуации длины тела, по-разному проявляющиеся не только в разных регионах, но и в разных популяциях одного региона — на селе или же в городах.
Максимальные значения «послевоенной» длины тела у русских мужчин (более 168.2 см) встречаются на самом западе русского ареала. Цепочка популяций с высокими значениями тянется по западной границе ареала — от Финского залива до Брянской области. Следующий интервал (значения выше среднерусской величины 167 см) формирует обширное плато, объединяющее Волго-Окское междуречье и северо-западные области. Это плато, как подковой, охватывается с востока областью со значениями ниже среднерусских. На остальной территории русского ареала значения выше и ниже среднерусских сменяют друг друга неупорядоченно. Минимальные значения (длина тела ниже 165.8) концентрируются главным образом на севере. Первая из этих областей охватывает Онежское озеро и бассейн Онеги (с минимумом 164 см у онежских русских, обследованных РАЭ); вторая — низовье Мезени и бассейн Печоры (с минимумом 164.8 см у русских мужчин Нарьян-Мара). Эти две области низких значений разделяются полосой повышенных значений, тянущейся вдоль Северной Двины. Карта показывает области низких значений также на Ветлуге и на востоке той же Брянской области, на западе которой мы видим максимальные значения длины тела.
СКУЛОВОЙ ДИАМЕТР
В распределении скулового диаметра (ширина лица, измеряемая в мм) также не прослеживается явных географических закономерностей в ареале русского народа (рис. 4.2.3).
Можно лишь указать, пожалуй, что максимальные значения тянутся полосой на западе русского ареала. Самые широкие лица встречаются на границе с Белоруссией и странами Прибалтики. К северу от 60й параллели лица более узкие — характерны значения скулового диаметра меньше среднерусского. Наименьшие значения ширины лица обнаруживаются на северо-западе ареала, в области, расположенной западнее Онеги и к северу от Онежского озера. В целом карта показывает треугольник повышенных значений, имеющий основание на западе ареала и направленный вершиной на восток. Но эта картина значительно осложнена локальными максимумами значений на Ветлуге и в Поволжье. Как показывает гистограмма карты, два интервала значений, близких к среднерусским, занимают больше половины всей площади карты. Это выражается и в небольшом коэффициенте вариации, равном 0.8 (табл. 4.1.1).
Рис. 4.2.3. Карта распределения скулового диаметра.
ЦВЕТ ГЛАЗ
В сравнении с картой скулового диаметра, географическое распределение цвета глаз (рис. 4.2.4) представляется довольно выразительным.
Рис. 4.2.4. Карта распределения цвета глаз (средний балл).
Окраска радужины глаз измеряется шкалой, состоящей из 12 номеров, от № 1 — радужина настолько темно пигментирована, что не отличается от зрачка, до № 12 яркого синего цвета без каких-либо вкраплений других тонов [Рогинский, Левин, 1978]. Однако для вычисления популяционной оценки — среднего балла всей популяции — 12 номеров группируются в три класса. Светлые глаза — балл 0 (№ 9-12); смешанная пигментация радужины — балл 1 (№ 5–8); тёмные глаза- балл 2 (№ 1–4). Таким образом, признак имеет общемировой размах от 0 до 2.
В русских популяциях выражен достаточно отчётливый градиент увеличения тёмной пигментации глаз в направлении с северо-запада на юго-восток, хотя мы и не видим неразрывного ареала сходных значений пигментации на обширной территории. Самые тёмные (в русском масштабе) оттенки глаз сосредоточены, главным образом, на юге и на востоке «исконного» ареала русского народа. Здесь расположены значения выше среднерусского показателя — 1.6 балла. К западу и к северу от Москвы становятся более распространёнными оттенки глаз светлее среднерусских значений — смоленские, тверские, новгородские популяции попадают в эту область значений. Наименьшие значения признака (т. е. наиболее светлые оттенки радужины) вновь, как и для скулового диаметра, находятся в области, расположенной западнее Онеги и к северу от Ладожского озера. К востоку от этой области светлых оттенков глаз расположен «коридор» темноглазого населения, тянущийся от верхней Волги в северном направлении и доходящий почти до Мезени.
Этот и некоторые другие признаки, обнаруживающие схожее распределение (большее развитие третичного волосяного покрова, округлая форма головы, сравнительно невысокая верхняя губа и ряд иных признаков), позволили М. В. Витову выделить верхне-волжский комплекс, очень близкий к валдайскому антропологическому типу Е. М. Чепурковского. М. В. Витов указывает, что «верхневолжский комплекс распространен вдоль южных пределов Русского Севера. В собственно поморские области он как бы устремляется через Сухону и Юг — далее через Кокшеньгу и верхнюю Вагу на среднюю Двину и Пинегу» [Витов, 1997, с. 13].
ЦВЕТ ВОЛОС
Следующая карта (рис. 4.2.5) даёт представление о распределении цвета волос в ареале русского народа. Для этого признака характерен наибольший коэффициент вариации среди всех рассмотренных карт соматологии — 49.6 (табл. 4.1.1).
Рис. 4.2.5. Карта распределения цвета волос (частота тёмных волос).
К сожалению, в Русской антропологической экспедиции и в полевых исследованиях М. В. Витова цвет волос определялся с помощью разных стандартных шкал: М. В. Битовым — по шкале Фишера; в РАЭ — по шкале Бунака. Однако тёмные волосы (номера 4, 5 и 27 по шкале Фишера) определялись обеими группами исследователей одинаково. Поэтому на карте приведена частота (в %) встречаемости именно тёмных волос в русских популяциях.
Прежде всего, отметим, что географическое распределение цвета волос не только более чётко, чем для цвета глаз, но и отлично от него по географическому направлению изменчивости. Это хотелось бы особо подчеркнуть. Два показателя пигментации — глаз и волос — географически распределены в русском ареале достаточно независимо. Для пигментации волос мы видим ярко выраженную широтную изменчивость «север<=>юг». Наибольший процент тёмных оттенков волос (более 18 %) сосредоточен в южной части русского ареала, достигая в Воронежских, Брянских, Тульских, Тамбовских землях 25 % и выше. Причём территория с несколько более тёмной пигментацией волос, чем средний русский показатель (равный 12 % тёмных волос) занимает области к югу от Оки и основную часть Волго-Окского междуречья. В ряде северных популяций тёмные оттенки волос практически не встречаются. Частота тёмных волос составляет менее 6 % во многих популяциях Архангельской и Вологодской, а также Смоленской, Тверской, Новгородской, Ленинградской, Кировской областей.
Примечательны два «коридора» низких значений признака (т. е. более светло пигментированного населения), идущих к югу. Восточный коридор огибает Волго-Окское междуречье с востока и тянется с севера к Мордовии. Западный коридор огибает Волго-Окское междуречье с запада и тянется к Смоленску (частота тёмных волос менее 6 %). Однако в целом, можно провести условную границу между «светловолосыми» и «темноволосыми» (опять-таки в русском масштабе) популяциями — она проходит примерно по 58 широте. Конечно же, есть исключения из этого правила — они хорошо видны на карте. Например, ядро тёмной пигментации волос на самом северо-востоке русского ареала (21–22 %). Оно определяется двумя популяциями Печоры (русские Нарьян-Мара и Усть-Цилемского района Коми) и может быть объяснено процессами метисации: эта область по многим признакам (см., например, рис. 4.2.4.-4.2.7) выпадает из основных направлений изменчивости русского генофонда.
Ц е з а р ь: Клеопатра, ты хорошо видишь мое лицо? (Зловеще) Ты не находишь, что у меня очень длинный нос?
К л е о п а т р а (отшатываясь от него и замирая в ужасе): Ой!
Ц е з а р ь: Это римский нос, Клеопатра.
ГОРИЗОНТАЛЬНАЯ ПРОФИЛИРОВКА ЛИЦА
Этот признак отражает степень ушющённости лица — обычно по нему в быту различают европеоидов и монголоидов. В антропологии для каждого индивида горизонтальная профилировка оценивается по трехбалльной системе в общемировом масштабе: балл 1 — уплощённое лицо типичного монголоида (когда, например, карандаш будет лежать на скулах, и нос не будет мешать этому!); балл 3 — резко выдающееся относительно горизонтальной плоскости лицо типичного римлянина или перса.
Карта распределения горизонтальной профилировки лица в русском генофонде (рис. 4.2.6.) отличается сложным, но очень любопытным рельефом: в нём чередуются широтно расположенные области пониженных и повышенных значений. На самом юге ареала расположена область значений несколько ниже среднерусских (менее 2.1). За ней между 52–55 параллелями следует область высоких значений (более профилированные лица). Далее вновь широкая область средних и пониженных значений признака (несколько уплощённые лица). А на севере (и на побережье Онежского озера) вновь отмечаются повышенные значения профилировки лица. В целом выделяется одна область пониженных значений (на востоке, по Ветлуге и Каме) и две области повышенных значений: одна на юге, по Днепру и Оке, другая, напротив, на севере вокруг Онежского озера и Белого моря. Однако основную часть карты занимают популяции со средней профилировкой лица и в целом колебания горизонтальной профилировки лица невелики — интервалы значений, близких к средней (от 2.05 до 2.15) занимают почти 60 % площади ареала. Соответственно, и коэффициент вариации для этого признака составляет не очень большую величину 3.8 % (табл. 4.1.1).
Рис. 4.2.6. Карта распределения горизонтальной профилировки лица.
ФОРМА НОСА
И, наконец (рис. 4.2.7.), последний из рассматриваемых карт признаков соматологии — форма носа (частота выпуклой спинки носа). Хотя размах изменчивости этого признака в «исконном» русском ареале четырехкратный (от 7 % до 28 %), но интервалы значений, близких к среднерусской (от 12 % до 18 %) занимают 70 % площади ареала. Коэффициент вариации при этом велик — 27.8 (табл. 4.1.1). Может быть, поэтому картографированием удаётся выявить достаточно чёткий тренд. Выпуклые спинки носа чаще встречаются на юго-западе русского ареала, простираясь и к центральным областям: популяции с частотой более 26 % встречены в Брянской, Калужской, Тверской областях. Реже выпуклая форма носа встречается на севере (около 7 % в Архангельской области и Карелии) и на востоке ареала — здесь становятся более частыми, напротив, варианты с вогнутой спинкой носа.
Рис. 4.2.7. Карта распределения формы носа (частота выпуклой спинки носа).
§ 1. Кожные узоры: Узоры на кончике хвоста — Дуги, петли, завитки — Наследуемость — Изученные популяции
§ 2. Пальцевые узоры: дельтовый индекс: Уменьшается с юго-запада к северу — Четкий тренд при малой изменчивости
§ 3. Европеоидно-монголоидный комплекс: Круги на воде — Нет влияния Востока!
§ 4. Индекс основных ладонных линий: Широтные волны
Среди всех антропологических признаков наследственная компонента особенно велика у признаков дерматоглифики [Гладкова, 1966; Хить, 1983; Ящук (Балановская), 1985; Хить, Долинова, 1990]. Поэтому они могут служить своеобразным мостом между данными соматологии и генетики.
Мы переходим к рассмотрению карт второй системы антропологических признаков — кожных узоров. Обычно изучается дерматоглифика ладоней и пальцев рук; реже — дерматоглифика стопы, и (для приматов) узоры на кончике хвоста.
Рельеф кожных узоров на них разнообразен и неповторим. Однако и его можно систематизировать и свести к определённым типам узоров и их комбинаций. Таких признаков выделено довольно много, но они обычно коррелируют друг с другом. Поэтому известными российскими специалистами в области дерматоглифики и этнической антропологии Г. Л. Хить и Н. А. Долиновой были выделены семь ведущих признаков, не связанных между собой внутригрупповой корреляцией [Хить, 1983; Хить, Долинова, 1990]. Вот эти признаки: дельтовый индекс пальцевых узоров; характеристики ладонных узоров — узоры на гипоте-наре, узоры на тенаре/I межпальцевой подушечке, дополнительные межпальцевые трирадиусы, положение осевых трирадиусов, индекс Камминса; а также общий показатель европеоидно-монголоидного комплекса признаков. Карты семи ведущих признаков мы и анализировали для русского генофонда.
ЧТО ЖЕ ТАКОЕ «КОЖНЫЕ УЗОРЫ»?
Приглядевшись к собственным кожным узорам (к кружеву кожных гребешков, а не к пересекающим их грубым линиям ладонных складок), можно различить непрерывные потоки кожных гребешков, которые растекаются по поверхности, не пересекаясь. А также несколько точек, где такие потоки сходятся, образуя так называемые дельты или трирадиусы. На рис. 4.3.1. представлены три основных типа пальцевых узоров — дуга (А — “arch”), петля (L — “loop”) и завиток (W — “whorl”) [Гладкова, 1966]. Простейший из узоров — дуги — дельт не образует. Петля образует одну дельту. Завиток обычно — две дельты, но может и три, поскольку к этому типу обычно относят и сложные составные узоры — из двух или трёх петель, из петли и завитка, из петли и Т-образных узоров и так далее. Обобщённый показатель — дельтовый индекс — рассчитывается как DL10=10(L + 2W)/(A+L+W). Если на всех пальцах только дуги (что является редчайшим исключением), то DL10=0. Если на всех пальцах только петли (что у европеоидов встречается довольно часто), то DL10=10. Если на всех пальцах только завитки (что часто встречается у монголоидов), то DL10=20.
Рис. 4.3.1. Три основных типа пальцевых узоров (из [Рогинский, Левин, 1978])
Для характеристики ладонных узоров поверхность ладони разбивается на 13 полей (рис. 4.3.2): узоры на гипотенаре — поле 4; узоры на тенаре/I межпальцевой подушечке — поле 1; дополнительные межпальцевые трирадиусы расположены на межпальцевых подушечках — поля 7, 9, 11; положение осевых трирадиусов — поля 2 и 3. Индекс Камминса служит обобщённым показателем направления линий А, В, С, D на ладонях. Например, на рис. 4.3.2. линия D оканчивается в 11 поле, С — в 9 поле, В — в 7 поле, А — в 5 поле.
Рис. 4.3.2. Схема выделения ладонных узоров и линий (из [Рогинский, Левин, 1978])
Рис. 4.3.3. Карта распределения дельтового индекса.
НАСЛЕДУЮТСЯ ЛИ «КОЖНЫЕ УЗОРЫ»?
Хотя тип наследования пальцевых узоров так окончательно и не установлен, однако общепризнанно, что компонента их наследуемости очень велика, причём за них отвечает небольшое число локусов [Хить, Долинова, 1990; Гладкова, 1966; Ящук (Балановская), 1985]. Для ладонных узоров наследуемость ниже, чем для пальцевых узоров. Однако в целом для признаков дерматоглифики она, несомненно, выше, чем для признаков соматологии. Именно поэтому признаки дерматоглифики особенно интересны и потенциально информативны при изучении генофонда.
По-видимому, комплекс генов, ответственных за кожные узоры, не так велик, как для остальных признаков антропологии. Не потому ли известно множество расхождений между классификациями популяций, основанными на признаках дерматоглифики, и привычными расовыми классификациями, основанными на соматологических признаках? Для дерматоглифики «…при значительной межгрупповой изменчивости нет полного совпадения с традиционными классификациями. Это вполне согласуется с фактом отсутствия взаимосвязи между дерматоглифическими и расоводиагностическими признаками. Некоторая географическая упорядоченность есть в признаке так называемого гребневого счёта, при котором делается подсчёт числа гребешков от дельты трирадиуса до центра узора» [Хрисанфова, Перевозчиков, 1999, с. 244–245].
ПРОСТЫЕ КАРТЫ
Приведём лишь три карты (рис. 4.3.3.-4.3.5.) для ведущих признаков дерматоглифики (полностью дерма-тоглифический Атлас будет представлен на сайте www.genofond.ru). Число изученных по дерматоглифике русских популяций намного меньше, чем для признаков соматологии — 28 популяций. Соответственно меньше и «надёжный» картографируемый ареал.
Следуя правилу анализа «исконного» ареала, мы не включили данные по русским Симферополя — Крым находится за пределами «исконного» русского ареала. Другую удалённую от Центральной России выборку (г. Чердынь в бассейне Камы, Пермская обл.) мы, напротив, включили в анализ, поскольку эта территория, хотя и с натяжкой, может включаться в зону этногенеза русского народа. Сошлёмся здесь на авторитет В. В Бунака, включившего Пермскую область в программу Русской антропологической экспедиции. Эта популяция, расположенная далеко от основного массива данных, видна на картах как отдельный островок значений на востоке ареала. Остальные 27 популяций, по которым имеются дерматоглифические данные, без сомнения, относятся именно к «исконному» ареалу русского народа.
Дельтовый индекс DL10 равен сумме дельт на всех десяти пальцах рук, обобщая в количественной форме все пальцевые узоры человека. Чем больше у человека дуговых узоров — тем меньше DL10, чем больше завитковых узоров — тем больше DL10. Дельтовый индекс DL10 — единственный представитель пальцевых узоров среди семи ведущих признаков дерматоглифики. Остальные признаки описывают узоры на ладонях.
Карту географического распределения DL10 в русском ареале (рис. 4.3.3.) отличает чёткий рельеф и достаточно ясно выраженный градиент уменьшения дельтового индекса (т. е. уменьшения доли завитковых узоров) в направлении с юго-запада на север. Только две популяции несколько осложняют эту закономерность — на самом западе ареала Островский район Псковской области (низкие значения дельтового индекса) и на самом севере ареала Холмогорский район Архангельской области (средние значения). Такой чёткий тренд тем более удивителен, что размах изменчивости дельтового индекса невелик — от 11.7 до 13.3 при среднем значении для русских популяций DL10=12.5. Область средних значений занимает всего лишь 25 % площади ареала, подтверждая наличие двух зон: на юге высоких (в «русском масштабе») значений DL10, на севере — пониженных значений DL10.
Рис. 4.3.4. Карта распределения европеоидномонголоидного комплекса признаков.
Рис. 4.3.5. Карта распределения индекса Камминса.
Можно было ожидать, что наиболее яркие закономерности проявятся на карте европеоидно-монголоидного комплекса признаков, ведь этот показатель объединяет в себе наиболее информативные расово-диагностические признаки дерматоглифики. Градиент европеоидно-монголоидных признаков обычно следует направлению «западовосток». Однако оказалось (рис. 4.3.4.), что распределение этого комплекса в ареале русского народа не имеет ожидаемой клинальной изменчивости «западовосток». Напротив, при первом взгляде на карту мы вообще не видим никакой закономерности! Лишь вглядевшись, можно заметить своеобразный паттерн «кругов на воде». В центре ареала, охватывающем Москву, Калугу, Рязань, Тверь, Ярославль и доходящем на севере до Белозерья, находится область минимальных значений комплекса. Его окружает плотное кольцо максимальных (конечно же, в «русском» масштабе) значений комплекса. Однако на самой окраине картографируемого ареала вновь намечается новое кольцо — минимальных значений, которые мы видим и на севере, и на западе, и на юге русского ареала.
Отсутствие клинальной изменчивости по оси «европеоиды запада<=>монголоиды востока» может говорить о том, что для выявления внутренней подразделённости русских популяций нужен иной «диагностический» комплекс признаков. Иными словами, по вектору «монголоидности-европеоидности» кожных узоров русские популяции достаточно близки друг к другу и чёткие географические тренды отсутствуют. Это означает, что мы не обнаруживаем никаких «монголоидных» влияний на русский фенофонд — вопреки мифу о мощном влиянии «татаро-монгольского ига» на антропологический тип русского народа.
Индекс Камминса, обобщающий ход всех основных линий на ладонях, также на первый взгляд не обнаруживает чётких географических закономерностей (рис. 4.3.5). Тем не менее, за исключением трёх популяций Брянской, Курской и Воронежской областей с высокими значениями индекса, его рельеф можно смело отнести к типу широтно чередующихся волн высоких и низких значений (как, например, у горизонтальной профилировки лица, рис. 4.2.6). Значения индекса Камминса варьируют в русских популяциях от 8 до 9 условных единиц. Однако площадь, занятая популяциями со средними значениями признака (Jc=8.48) невелика — 19 % картографируемого ареала, что указывает на выраженную дифференциацию русских популяций по этому признаку.
На севере ареала (Архангельская область) мы видим высокие значения индекса Камминса. Южнее, вдоль 60й параллели, простирается широкая зона низких значений, охватывающая значительное число популяций: от Псковской области на западе — через новгородские, вологодские, костромские популяции — вплоть до Пермской области на востоке. Эта зона включает в себя и популяции с минимальными значениями индекса Камминса (Jc=8) — в Вологодской и Пермской областях. Южнее она сменяется вновь широтно тянущейся волной повышенных значений признака — с максимальными значениями для русского народа, фиксируемыми в Смоленской области. Еще южнее — вновь намечается широтная волна пониженных значений индекса Камминса, включающая в себя орловские, тамбовские и саратовские популяции.
§ 1. Обобщённые расстояния: Карта отличий от «среднерусского» генофонда — Меняем исходные данные — Меняем методы — Паттерн карты неизменен!
§ 2. Главные сценарии: Синтетические карты — 107 популяций по 30 признакам соматологии — Широтная изменчивость — 180 популяций по 18 признакам соматологии — Широтная изменчивость — 28 популяций по 6 признакам дерматоглифики — Широтная изменчивость — Верхневолжская и северная аномалии — Фенофонд и генофонд
§ 3. Географический метод: Полвека назад — И сейчас — Необходимость обобщённых карт — Карты расстояний — На них следы племен — Карты сценариев — Их единство — И все же генофонд!
«Когда с кого-нибудь снимут оковы, заставят вдруг встать, повернуть шею, пройтись, взглянуть вверх — в сторону света… он не сможет смотреть при ярком сиянии на те вещи, тень от которых он видел раньше. И что он скажет, когда ему начнут говорить, что раньше он видел пустяки, а теперь, обратившись к более подлинному, он обрёл правильный взгляд? Не считаешь ли ты, что это крайне его затруднит и он подумает, будто гораздо больше правды в том, что он видел раньше, чем в том, что ему показывают теперь?»
Мы не будем описывать все 55 карт отдельных признаков из Атласа антропологии русского народа — достаточно и десятка примеров! Хотя распределение каждого признака является фактом антропологической науки, но для нас все они в равной степени вспомогательные, все они служат промежуточными ступенями для достижения цели нашего исследования — выявления общей архитектоники генофонда. Именно поэтому мы привели десять не связанных между собою признаков кожных узоров и соматологии. Выбор мы осуществляли «не глядя», т. е. независимо от распределения признака по ареалу. Поэтому и можно считать, что такая небольшая выборка из многих антропологических признаков даёт некое общее представление об их изменчивости в «исконном» русском ареале. Во всяком случае, этой выборки оказалось достаточно, чтобы увидеть, сколь разные типы и направления изменчивости можно обнаружить, разглядывая лишь десяток карт!
Каждый из признаков по-своему рассказывает о генофонде. Гены, лежащие в основе этих признаков, имеют свою историческую судьбу, и потому каждый из них описывает лишь одну из многих сотен или тысяч версий истории народа и его генофонда. Каждый из них фиксирует лишь часть миграционных потоков, сложных переплетений межэтнических и внутриэт-нических взаимодействий, случайных событий дрейфа генов. Каждый даёт своё видение, свою проекцию генофонда. Пытаться проследить по отдельной карте судьбу генофонда — все равно, что описывать судьбу страны по биографии отдельного её жителя. Можно представить, сколь будут различаться описания многострадальной России, созданные пусть даже современниками, но представителями разных слоев населения. А карта отдельного признака сложнее — она включает напластования разных времён… Поэтому, если у нас нет оснований считать, что какие-то из признаков более правдивы, то надо пытаться выявить то общее и объективное, что есть во всем множестве признаков — рассказов «очевидцев».
Такие общие черты можно было разглядеть уже в описании отдельных карт — просматривая их, улавливаешь какие-то общие мотивы, часто встречающиеся паттерны. Видишь, как сквозь случайности начинают проступать некие общие черты. Но это видение может оказаться субъективным — оно зависит и от проницательности, и от опыта исследователя, и от многих часто не осознаваемых установок. Поэтому для описания общих закономерностей генофонда необходимо тем или иным образом объективно обобщить информацию по всем признакам.
Но как обобщить? Обычные статистические оценки дадут лишь одинокие цифры — единственный показатель для всего этноса, для всего многообразия его межпопуляционной изменчивости. Но для понимания пространственной структуры генофонда, понимания его географии необходимо знать, как конкретно эта изменчивость реализуется в каждой части русского ареала. Поэтому, чтобы не терять из вида всю сложность антропологического ландшафта, нам надо своими глазами увидеть обобщённую изменчивость для каждой части ареала, то есть увидеть карты обобщённых признаков.
Для такого обобщения и созданы карты фенофонда русского народа. Они составили последнюю и главную часть Антропологического атласа, к рассмотрению которой мы переходим. Главный вопрос, на который мы будем искать ответ с помощью карт генетических расстояний — насколько устойчивы выявляемые элементы структуры фенофонда? Насколько они зависят от метода построения карт и их анализа? От анализируемых признаков и популяций? Затем рассмотрим главные сценарии в изменчивости русского фенофонда — карты канонических переменных и их аналогов — главных компонент. И в заключение мы вспомним о традициях географического подхода в антропологии русского народа и рассмотрим, как они продолжаются в создаваемых геногеографией обобщённых ландшафтах карт.
Рис. 4.4.1. Карта генетических расстояний от общерусских характеристик по объединённым данным «АБВ» (РАЭ и М. В. Витова).
Карта многомерных расстояний уже описывалась в главе 2 (рис. 2.3.5.). Там же приведена её интерпретация — выявление западных и восточных ядерных структур (связанных соответственно со славянскими и финно-угорскими племенами, вошедшими в состав русского народа) и срединной «рифтовой зоны» — зоны интенсивных смешений обоих пластов населения.
Но на самом деле мы построили не одну, а целую серию карт обобщённых расстояний русского фенофонда. С одной стороны, все карты этой серии должны быть похожи друг на друга. Ведь все они отражают одно и то же важнейшее свойство: степень сходства значений каждой точки русского ареала со среднерусскими показателями, со средним русским «портретом». Но с другой стороны, все карты и отличаются друг от друга — методом построения, числом анализируемых признаков или популяций. Сравнивая разные карты этой серии, можно своими глазами увидеть и оценить, насколько различия в материалах и методах влияют на закономерности, выявляемые картой. Но мы не будем утомлять читателя всей серией карт — не все склонны к методическим изыскам.
Пролистнём все промежуточные карты и заглянем в конец этой части Атласа. Там находится карта (рис. 4.4.7.), отличающаяся от предыдущей (рис. 2.3.5.), почти по всем параметрам.
Во-первых, отличаются исходные данные. Для построения этой карты использованы не данные РАЭ, а объединённые («АБВ», см. раздел 4.1. и раздел 5 Приложения).
Во-вторых, отличается число популяций. Мы включаем в анализ более обширной круг русских популяций: 180 вместо 107 популяций.
В-третьих, и это главное — отличается ареал. Теперь мы охватываем более широкий ареал, ведь М. В. Битов основное внимание уделил Русскому Северу, менее представленному в данных РАЭ. Мы можем заглянуть теперь, как продолжаются (и продолжаются ли?) выявленные нами закономерности на Русском Севере.
В-четвертых, отличается число признаков. Число признаков стало больше: 18 вместо 8. Все эти признаки являются ведущими и дают достаточно полное представление об антропологическом облике русского народа.
В-пятых, отличается мера расстояний. При построении этой карты использованы наиболее корректные для анализа антропологических признаков многомерные расстояния Махаланобиса.
Итак, карта по всему массиву данных о русском фенофонде («АБВ», рис. 4.4.1.) отличается от карты, приведённой в главе 2 (рис. 2.3.5.), практически по всем мыслимым исходным параметрам. Насколько это сказалось на её ландшафте? Насколько он устойчив к изменению числа популяций, признаков, размера ареала, мер расстояний? Если ландшафт совершенно меняется при изменении каждого параметра, то говорить о том, что мы познали основные черты строения фенофонда русского народа, нельзя. Если же есть некие константы, есть неизменные структурообразующие элементы, которые не зависят от перемены параметров — то можно считать, что мы разглядели каркас пространственной структуры фенофонда. Тогда дальнейшее изучение антропологии русского народа будет «наращивать» информацию на этот каркас, уточнять выявленную картину, но не менять её кардинально.
Что же показывает сравнение этих карт?
Мы не будем подробно описывать картину, которую читатель может оценить и сам. Главный вывод налицо: обнаруживается удивительная устойчивость ландшафта.
Нам представляется крайне важным, что подробно рассмотренная ранее (глава 2) «рифтовая зона», следующая вдоль 38 меридиана (светлые области на черно-белых картах), становится еще более чётко выраженной (рис. 4.4.1). Это важно потому, что «рифтовая зона» отражает среднерусские значения. Именно эта область, её паттерн, должны быть наиболее чувствительны к малейшим изменениям параметров карты. Причём среднерусские значения, после введения данных М. В. Витова по Русскому Северу изменились — средняя величина теперь рассчитана не по 107, а по 180 популяциям, и северные русские популяции представлены более равноправно. Однако положение и характер «рифтовой зоны» остались прежними, несмотря на все изменения.
Для «ядерных структур» соотношение иное. Если два ядра отличаются от средних значений (тёмные ядра на черно-белых картах), это совершенно не означает, что они похожи друг на друга, поскольку они могут различаться, образно говоря, «в разные стороны». Подобно двум кометам, удаляющимся от эпицентра взрыва, которые могут следовать параллельным курсом или же стремительно разлетаться друг от друга, так же и значения «ядерных структур» могут быть сходными между собой или диаметрально различными. Поэтому близость или отдалённость тёмных ядер друг к другу/ от друга выявляется по их антропологическому «содержанию». Описание антропологического облика для всех «ядерных структур» мы дали в работе [Рычков, Ящук (Балановская), 1988]. Западные и восточные «ядерные структуры» приобрели большую чёткость и локализацию в пространстве на картах «АБВ», то есть при дополнении данных РАЭ данными М. В. Витова (рис. 4.4.1.). Введение в анализ столь большого массива новых популяций (он увеличился почти в два раза!) не изменило самих основ прежней картины, но прояснило многие её черты.
Такая устойчивость основных черт обобщённой карты достойна удивления! Мы в серии карт изменяли всё: метод построения исходных карт («компьютерные» или «ручные»), способ их обобщения (расстояния по Бунаку, по Махаланобису), количество анализируемых признаков (8 или 18), количество изученных популяций (107 или же 180). Но структурообразующие элементы не исчезали! Они меняли контуры и интенсивность проявления, но присутствовали на всех картах.
Это убеждаёт исследователя в объективности картографического анализа. Этот вывод важен для всего последующего изложения, для всего анализа генофонда. Мы будем помнить, что, используя те или иные маркёры, популяции, методы, способы обобщения, мы стремимся выявить те общие элементы каркаса генофонда, его структуры, его архитектоники, которые не сводимы к особенностям конкретных изученных маркёров, популяций, методов, способов обобщения.
Убедившись в объективности картографического анализа, в качестве следующего шага рассмотрим главные сценарии в изменчивости фенофонда. Так образно именуют [Cavalli-Sforza et al., 1994] «синтетические» карты, за то, что они выявляют самые главные направления изменчивости генофонда, свойственные большинству признаков. Обобщённые карты предыдущего раздела отражали близость каждой точки ареала к средним показателям. Такие карты расстояний являются очень чутким, но вовсе не единственным методом картографического обобщения множества признаков. Из палитры этих методов наибольшей популярностью пользуются как раз синтетические карты — главных компонент или же их аналогов, канонических переменных (см. Приложение, раздел 3.).
Карты главных компонент создаются на основании карт исходных признаков. Эти новые карты обладают двумя важными свойствами — они не скоррелированы друг с другом и ранжированы по их «важности»: карта каждой последующей компоненты отражает меньшую долю изменчивости (дисперсии) всех исходных признаков, чем предыдущая компонента. Поэтому карта первой главной компоненты описывает «самый главный» сценарий изменчивости всех признаков — ту закономерность, которая встречается в изменчивости большинства признаков. Карта второй главной компоненты — второй по важности сценарий и так далее.
Для ведущих признаков дерматоглифики, не коррелирующих между собой [Хить, Долинова, 1990], нами созданы карты главных компонент. Для признаков соматологии, связанных внутригрупповой корреляцией, вместо главных компонент рассчитаны их математические аналоги — канонические переменные.
Карты главных «сценариев» изменчивости всех рассмотренных систем признаков — соматологии, дерматоглифики и генетики — построены с помощью одной и той же картографической технологии и потому полностью сопоставимы. Хотя анализировались первые три главных компоненты, здесь для краткости рассмотрим только «самые главные» сценарии (первой канонической переменной для соматологии и первой компоненты для дерматоглифики).
I. Данные соматологии: «РАЭ». Число популяций: 107. Число признаков: 30
С помощью многомерного статистического анализа данных Русской антропологической экспедиции ранее было показано, что первая каноническая переменная характеризуется изменчивостью, близкой к широтной [Дерябин, 2002]. Эта закономерность иллюстрировалась значковой картой.
Однако объективность значковых карт эфемерна. Значковые карты помещают «значок значения» только в те точки, где расположены изученные населённые пункты. Эти карты предлагают каждому читателю произвести интерполяцию на всю прочую территорию «в уме», причём эта процедура не всегда даже осознается создателями и читателями карт. Субъективные картины, возникающие в читательских умах, обычно не сравниваются — предполагается, что все видят то же самое, что и создатель значковой карты. К сожалению, нам не раз приходилось сталкиваться с тем, насколько по-разному интерпретируют значковую карту её читатели. А порой — и сами создатели. Оказывается, что при формальной объективности значковой карты (сама по себе она не содержит никакой интерполяции), её прочтение всегда субъективно. А ведь карта для того и строится, чтобы все читатели увидели объективно существующие пространственные закономерности во всём ареале. Конечно же, и компьютерные карты не могут избежать субъективности в их интерпретации — все мы видим мир по-разному! Но это происходит уже на следующем, неконтролируемом автором карты этапе, когда мировоззрение читателя берет верх над очевидностью карты. Самый важный этап — интерполяция данных из точек на ареал — проводится на наших картах однозначно, строго и объективно, позволяя нам всем интерпретировать одну и ту же карту, а не каждому из нас обсуждать с собой своё же собственное создание.
Поэтому рассмотрим интерполяционные карты, отражающие «главные сценарии» изменчивости фенофонда (антропологического покрова) в «исконном» ареале русского народа. Карта первой канонической переменной (рис. 4.4.2., 19.4 % общей изменчивости 30 признаков) описывает общую изменчивость 107 популяций, изученных Русской антропологической экспедицией. Основное направление ландшафта можно описать как широтное: максимальные значения расположены на юге «исконного» русского ареала, минимальные — на севере, а промежуточные значения тянутся между ними (рис. 4.4.2). От этой закономерности есть лишь одно, но чрезвычайно любопытное отклонение: гряда высоких значений тянется вдоль верхней Волги. К югу от Оки мы видим основное плато высоких значений первой канонической переменной. В Волго-Окском междуречье значения резко снижены, но по северной границе междуречья, вдоль Волги, тянется эта гряда высоких значений. Она как бы ответвляется от основного южного плато и заходит далеко на север. Наличие этой гряды было отмечено В. Е. Дерябиным и на значковых картах [Дерябин, 1999, 2002].
Обнаруженный широтный сценарий можно сопоставить с данными лингвистики — с подразделением на северные и южные русские говоры. Причём эта изменчивость чуть более сложна, чем просто «север<=>юг», — на самом севере, уже выходя за пределы надёжного пространства, намечается иная группа, возможно, указывающая на отличия поморов. Итак, первый главный сценарий изменчивости показывает, что в русском фе-нофонде основные различия обнаруживаются между северными и южными популяциями. Это не подразделение в таксономическом смысле, поскольку зоны экстремумов (максимальных и минимальных значений) на карте невелики, и основная часть ареала занята переходными значениями. Скорее можно говорить, что генофонды локальных русских популяций постепенно изменяются при движении по оси «юг-север».
Рис. 4.4.2. Карта первого сценария (первой канонической переменной) изменчивости по данным РАЭ (Русской антропологической экспедиции).
Впрочем, с тем же основанием эту закономерность можно обозначить и как «север-юг». Дело в том, что такие обобщённые признаки, как канонические переменные и главные компоненты позволяют выявить “ось” изменчивости, но её направленность, вектор можно интерпретировать, лишь привлекая косвенные данные смежных наук.
II. Данные соматологии; «АБВ». Число популяций: 180. Число признаков: 18
Рассмотрим теперь, какие общие закономерности можно выявить по объединённым данным РАЭ и М. В. Витова — «АБВ» (рис. 4.4.3.,
18.5 % общей дисперсии 18 признаков). Напомним, что эти карты опираются на число популяций, почти в два раза большее. На них хорошо представлен Русский Север, лишь фрагментарно отраженный на предыдущих картах. Резко меняется и спектр признаков — сценарии РАЭ основаны на картах 30 отдельных признаков антропологии, но сценарии по данным «АБВ» опираются лишь на 18 карт признаков. В связи со столь значительным изменением фактографической базы можно ожидать, что и карты резко изменятся.
Однако мы вновь видим, сколь велика устойчивость ландшафтов главных сценариев! Все структурообразующие элементы карт «АБВ» остаются теми же, что и на картах по данным РАЭ. Но данные М. В. Витова уточняют и проясняют многие закономерности, которые лишь намечались на картах РАЭ.
Так же, как основной сценарий РАЭ (рис. 4.4.2), эта карта характеризуется изменчивостью, близкой к широтной (рис. 4.4.3). Но это не просто “север-юг”. На карте РАЭ (рис. 4.4.2) лишь намечалась «северная аномалия» — при неуклонном снижении значений вдруг на самом севере вновь начиналось повышение рельефа, указывая на наличие иного антропологического варианта. Карта канонической переменной, построенная с учетом многочисленных данных М. В. Витова о населении Русского Севера, подтвердила наличие «северной аномалии», которая занимает значительную территорию по берегам Белого моря, в низовьях Двины и Печоры (рис. 4.4.3). Предположение о её связи с поморами кажется наиболее вероятным, хотя и требует проверки.
Отметим, что на карте сохраняется также и гряда повышенных значений вдоль верхней Волги, огибающая небольшое ядро пониженных значений в Волго-Окском междуречье.
III. Данные дерматоглифики. Число популяций: 28. Число признаков; 6.
Главный сценарий изменчивости признаков кожных узоров (рис. 4.4.4., 31.1 % общей дисперсии шести признаков) вновь выявляет все тот же уже знакомый ландшафт. Конечно, ведущих признаков дерматоглифики немного. К тому же, в отличие от соматологии, они отражают лишь один канал фенотипических проявлений генофонда — только кожные узоры пальцев и ладоней. Тем важнее, что основной сценарий по данным дерматоглифики следует той же закономерности, что и данные соматологии — широтной изменчивости. При этом «северная аномалия», выявленная по данным соматологии, здесь проявилась очень ярко, причём проявилась точно там же — в низовьях Северной Двины.
Рис. 4.4.3. Карта первого сценария (первой канонической переменной) изменчивости признаков по объединенным данным «АБВ» (РАЭ и М. В. Витова).
Другая особенность дерматоглифики: ядро максимальных значений, которое на карте соматологии располагалось на юго-востоке, в междуречье Волги и Дона (рис. 4.4.3), на карте первой компоненты дерматоглифики сместилось на запад, к бассейну Днепра.
Напомним крайне важное обстоятельство. При анализе данных соматологии и дерматоглифики мы использовали не только разные системы признаков, но и совершенно разные популяции! Более того, разнится не только спектр изученных популяций, но и их количество: по дерматоглифике изучено в шесть раз меньше популяций, чем по данным «АБВ». Поэтому, хотя и стоит обратить внимание на перечисленные особенности дерматоглифической карты, но частные элементы карты требуют проверки при дальнейшем увеличении числа изученных популяций. А вот характер основного ландшафта карты — в данном случае широтной изменчивости — чрезвычайно устойчив. Основная закономерность обычно выявляется даже при ограниченном числе популяций.
IV. Сходство «портретов» русского генофонда по разным типам маркёров
Можно ли оценить количественно степень сходства «портретов» русского генофонда, обрисованных двумя очевидцами — соматологией и дерматоглификой? И имеем ли мы вообще право говорить о русском генофонде, изучив только его фенофонд? Ведь мы пока оперируем только данными антропологии и используем только «внешние» черты облика русского населения. Оба вопроса столь важны, что мы, забегая вперёд, приведём из общей таблицы связей всех карт главных компонент (глава 10) ту её часть, которая имеет прямое отношение к антропологии (табл. 4.4.1). В таблице приведены коэффициенты корреляции между всеми картами первых, вторых и третьих главных компонент всех пяти очевидцев. Мы имеем редкую возможность сравнить показания антропологии с показаниями еще трёх свидетелей — фамилий, классических и ДНК маркёров. Наиболее важны в нашем случае последние двух очевидца, показывающие связь антропологии и генетики в их изучении русского генофонда.
Мы видим удивительную картину: антропологический портрет русского генофонда оказался очень сходен с портретами, нарисованными другими, столь разными очевидцами! Коэффициенты связи (г) варьируют от 0.52 до 0.85, в среднем составляя р=0.7! Причём самый низкий показатель связи оказался между главными сценариями самой антропологии — соматологии и дерматоглифики (r=0.52). Связь соматологии (1РСА) с обоими генетическими портретами очень велика — r=0.85 с классическими маркёрами и r=0.73 с гапло-группами Y хромосомы.
Этот результат — один из важнейших итогов книги. Именно он позволяет нам использовать данные антропологии как важнейший источник информации о генофонде. Это возможно лишь благодаря картографическому методу — карты впервые позволили антропологии и генетике заговорить на одном языке. И результат диалога оказался впечатляющим — обе науки рассказывают об одной и той же структуре русского генофонда.
Рис. 4.4.4. Карта первого сценария (первой главной компоненты) изменчивости признаков дерматоглифики.
Однако не оба раздела антропологии одинаково информативны — к данным генетики (1PCG и 1РСу) намного ближе оказались данные соматологии (1РСА: средняя корреляция с генетикой r=0.79), чем данные дерматоглифики (1PCD: средняя корреляция с генетикой r=0.46). Поэтому портрет русского генофонда, созданный дерматоглификой, отходит как бы на второй план. Он помогает увидеть особые своеобразные черты генофонда, но при характеристике «общей модели» генофонда, его архитектоники нам следует обращаться в первую очередь к соматологии.
Антропология русских популяций — хорошо разработанная область. Уже само число изученных популяций показывает, что русский народ изучен подробнее большинства народов мира. Имена исследователей, которые изучали антропологию русского населения, широко известны и говорят сами за себя. Что же может добавить наше исследование? Свою задачу мы видели в том, чтобы ввести антропологические данные в изучение генофонда. И сделать это можно благодаря использованию карт.
ГЕОГРАФИЧЕСКИЙ МЕТОД В АНТРОПОЛОГИИ
При рассмотрении хорошо изученного русского народа исследователей привлекала не столько изменчивость отдельных признаков, сколько выделение ареалов антропологических типов. Поэтому в работах и М. В. Витова (1997), и В. Е. Дерябина (2002) анализ отдельных признаков целиком подчинён выделению антропологических комплексов (описания изменчивости отдельных признаков можно найти только в коллективной монографии РАЭ [Происхождение…, 1965]).
Позволим себе привести один пример эффективности географического подхода для выделения антропологических типов и для анализа истории генофонда. Этот подход применён более полувека назад — до появления компьютерной картографии. Его элегантность и широта мышления показывают, что компьютерные технологии — лишь техническое усовершенствование. Они показывают и то, что традиция «географического мышления», берущая начало от Е. М. Чепурковского — самый прочный фундамент для современных геногеографических построений.
Успешное использование географического подхода в антропологии продемонстрируем на одном лишь примере — на характеристике М. В. Битовым ильменско-беломорского антропологического комплекса. Он был выделен М. В. Битовым в Приильменье, по южному берегу Белого моря, на Мезени, в бассейне Двины. Этот тип отличают светлая пигментация глаз и волос, относительно высокий рост, удлинённая форма головы и лица, большие размеры головы и ряд иных особенностей. М. В. Битов связывает распространение этого антропологического типа с процессом новгородской колонизации, предполагая, что его первоначальными носителями были новгородские словене. Его антропологическая близость к населению северной Европы объяснима тем, что в состав и того, и другого типа вошли одни и те же элементы, восходящие к верхнепалеолитическому населению [Битов, 1997]. Аргументируя связь ильменско-беломорского комплекса с новгородской колонизацией, М. В. Битов приводит ряд доказательств.
К первому ряду доказательств относится сопоставление ареала ильменско-беломорского типа с древнейшим документом, описывающим ареал новгородских территорий в XII веке — Уставной грамотой Святослава Ольговича. Такой «палеогеографический» анализ выявил очень хорошее совпадение ареала ильменцев и территории «Святославовых погостов», главный сгусток которых был сосредоточен на нижней Двине, а также по южному и восточному берегам Онежского озера, на Онеге, верхней Сухоне и Ваге. Полного совпадения, конечно, не могло быть. В частности, «южные пределы территории, описанной в Уставе (земли по Сухоне и верхней Ваге), были перекрыты низовской колонизацией, шедшей с юга из бассейна верхней Волги, которая не могла не изменить физического облика первоначальных русских насельников» [Битов, 1997, с. 16].
Таблица 4.4.1.
Сходство главных компонент изменчивости антропологии, генетики и фамилий
Примечания:
1) Рассчитаны ранговые коэффициенты корреляции между картами первых трёх главных компонент пяти типов признаков: соматологии, дерматоглифики, классических маркёров, фамилий, гаплогрупп Y хромосомы.
2) Значения ниже 0.2 не показаны (обозначены как «-»).
3) Значения около 0.5 и выше выделены шрифтом и заливкой.
4) Коэффициент корреляции указан по модулю.
Корреляции между компонентами одного ранга (например, между всеми первыми компонентами) выделены прямоугольниками.
Второй ряд доказательств относится к данным лингвистики. Ареал ильменско-беломорского антропологического типа почти полностью соответствует распространению трёх близких северных диалектов — новгородского, поморского и олонецкого (частично). Убедительно звучит элегантное исследование М. В. Битовым географии диалектных терминов. Так, на Русском Севере широко используется термин «шелонник» — как особое имя для юго-западного ветра. Конечно же, крестьяне Поморья, рыбаки Белого моря и Мезени давно забыли происхождение этого диалектного слова. Но исторически оно легко объяснимо: этот термин «мог возникнуть только в Новгороде, река Шелонь впадаёт в Ильмень как раз с юго-западной стороны. На этот чрезвычайно важный распознавательный признак для истории колонизации обратил внимание известный русский этнограф Д. К. Зеленин» [Битов, 1997, с. 17]. Мы не можем отказать себе в удовольствии привести карту распространения диалектного термина «шелонник» (рис. 4.4.5), составленную М. В. Битовым [1997]. Население, называющее юго-западный ветер «шелонником», доныне характеризуется преобладанием ильменско-беломорского антропологического комплекса.
Рис. 4.4.5. Распространение названия «шелонник» для юго-западного ветра (по [Битов, 1997]).
Рис. 4.4.6. Распространение былинной традиции на Русском Севере (по [Битов, 1997]).
К третьему ряду доказательств относится сопоставление антропологических ареалов с этнографическими и фольклорными. Самым ярким и впечатляющим является сравнительный картографический анализ ареала распространения былинной традиции, которая характерна только для Русского Севера. На рис. 4.4.6. приведены центры распространения былин [Битов, 1997]. Территории, на которых записаны былины, обнаруживают замечательное совпадение с беломорской половиной ареала ильменцев. Это совпадение «с высокой степенью вероятности свидетельствует о том, что распространение ильменско-беломорского типа и былинной традиции является отражением одного и того же исторического процесса — новгородской колонизации» [Битов, 1997, с. 18]. При этом на исконной новгородской территории былины исчезли, что может быть одним из печальных последствий известных исторических причин — борьбы Москвы и Новгорода. Напомним, что и антропологический след новгородских словен — в отличие от остальных славянских племен — не обнаружен при геногеографическом анализе (раздел 2.3.)
Таким образом, географический метод в приложении к данным антропологии позволил разглядеть ход исторических процессов при формировании русского генофонда.
Мы ограничились лишь одним примером — обоснованием выделения ильменско-беломорского типа. Однако географический метод был применён для решения целого ряда вопросов формирования фенофонда русского народа. Это и путь расселения новгородцев. И борьба Новгорода и низовских земель за северные территории. Вдоль основной линии их борьбы в Подвинье удалось выявить постепенный переход в антропологическом типе населения — например, процент светлых оттенков глаз закономерно падает вдоль этой линии с севера на юг — от 67 % до 40 %. «Эта картина постепенной смены антропологического типа соответствует медленному освоению древних новгородских земель на Двине, которое шло со стороны Ростова, а позднее Москвы… Использование данных антропологии в сочетании с показаниями письменных источников даёт возможность проследить…» географию и историю русского народа [Битов, 1997, с. 29].
Приведённый пример показывает необходимость географического мышления при изучении истории народонаселения. Именно географический метод лежит в основе современной геногеографии. Но, кроме испытанного географического метода, у современной геногеографии появилась и мощная картографическая технология, то есть совокупность алгоритмов построения, преобразования и анализа карт, а также программная реализация всех этих функций.
Применение нашей картографической технологии к антропологическим данным имеет особую историю. Как рассказывалось в главе 2, начальный этап создания технологии был связан именно с данными по русской антропологии [Рычков, Ящук (Балановская), 1988]. Сознавая перспективы нового инструмента-обобщённого картографического анализа, обобщённых ландшафтов карт — авторы стремились показать то новое, что открывается на этом пути даже в столь тщательно и авторитетно разработанной области, как этническая история русского народа. Соединение географического, картографического и генетического подходов позволило извлечь из антропологических данных информацию по истории формирования русского населения. Мы имеем в виду и обнаружение трёх зон в ареале генофонда, соответствующих трёмэтапам его формирования, и обнаружение следов летописных славянских племен.
Геногеографическая технология из данных об антропологии современного населения извлекает информацию об его историческом прошлом — то есть осуществляет именно то, что пока не удавалось выявить в прямом палеоантропологическом изучении. Одно дело — дать краниологическую характеристику каких-либо курганных серий. Совсем иное — доказать, что это характеристика именно славян, а не славянизированного, образно выражаясь, «обращённого в славянство» населения, принявшего славянский язык и культуру. И, наконец, еще сложнее доказать, что те, кто погребён по позднему славянскому курганному обряду, передали свои гены длинной цепочке поколений, и их потомки составляют ныне ядро в антропологическом составе русского народа. От прошлого к настоящему — такая задача не имеет строгого решения. Мы никогда не знаем, дошла ли эта «эстафета» до нас, или же цепь передачи генетической информации прервалась на каком-то этапе. В этом случае до нашего времёни не дошли «гонцы» из изученных палеоантропологами популяций, разорвалась связь времён.
Зато постановка задачи и решение возможны, когда исследование ведется в обратном направлении — от современности к истокам.
Такая логика — чисто генетическая в своей основе, ведь последующие эпохи наследуют от предыдущих именно гены, а не антропологические признаки. Как же именно сочетать генетический подход, антропологию и картографирование? Ответ мы обсуждали выше — ключевым здесь является использование обобщённых карт. Карты отдельных признаков слишком разнообразны. Хотя на нескольких картах мы встретили четкую кли-нальную изменчивость, но этот тип рельефа карт оказался довольно редок. На других картах чередуются полосы высоких и низких значений, причём эти полосы могут идти как в широтном, так и в долготном направлении. Встретился и тип изменчивости, при котором области высоких и низких значений, также чередуясь, образуют концентрические круги. На некоторых картах вообще не удаётся увидеть никакой географической закономерности, столь сложен рельеф этих карт — мы отнесли их к типу «лоскутного одеяла».
Среди карт, которые мы не приводим в книге, встречаются самые разные типы изменчивости. Возможно, даже на приведённых картах читатель разглядит иные закономерности, нежели мы. Но вот что абсолютно невозможно: нет никакой надежды, что обнаружится какой-то один частный признак (будь то форма носа или гаплотип мтДНК), в карте которого раскроется общая история всего генофонда. Этого можно ожидать лишь от всей совокупности признаков, от всей совокупности карт. Чтобы из всего этого многообразия отдельных признаков извлечь информацию о структуре генофонда, нужно применить тот или иной метод обобщения.
ОБОБЩЁННЫЙ ЛАНДШАФТ: МНОГОМЕРНЫЕ РАССТОЯНИЯ
Первым типом обобщённых карт стали карты расстояний. Как говорилось, самая первая такая карта выявила три зоны в русском населении. Срединная «рифтовая зона» — близка к среднерусским характеристикам, а западная и восточная — отличаются от них. Чтобы проверить объективность этого результата, впервые опубликованного еще в 1989 году, мы построили целую серию таких карт, варьируя исходные данные и метод построения. Оказалось, что на всех картах выявляются эти три зоны.
Что же представляют собой западная и восточная зоны скопления «ядерных структур»? По самой технике анализа это территории, которые существенно отличаются от среднерусских величин, причём отличаются не по одному, а по совокупности антропологических признаков. Такие области с антропологически особенным русским населением включают целый ряд компактных «ядер», отделённых друг от друга «среднерусским» по антропологическому облику населением. Была предложена гипотеза, хорошо объясняющая такую картину: каждое из ядер представляет собой след одного из племен, населявших эту территорию. Тогда становится понятным, почему ядра разделены областями с характеристиками, близкими к среднерусским. При смешении населения, относившегося к разным ядрам (разным племенам), локальные популяционные характеристики нивелировались, усреднялись, что мы и видим сейчас на границах между ядрами. Это первое, что бросается в глаза при взгляде на карту — её составленность из многих «ядер».
Предложенная гипотеза хорошо объясняет и наличие западного и восточного скоплений ядер: западное скопление она связывает со славянскими племенами, причём расположение многих ядер соответствует локализации конкретных летописных славянских племен (см. главу 2). Восточное скопление — связывается с финно-угорскими племенами. А срединная полоса — с той зоной, где происходило интенсивное перемешивание этих двух пластов народонаселения, и как следствие — формирование обширной полосы среднерусских значений.
ГЛАВНЫЕ СЦЕНАРИИ
Вторым типом рассмотренных обобщённых ландшафтов стали карты канонических переменных или главных компонент. По выражению известного генетика Луиджи Луки Кавалли-Сфорца, каждая из карт главных компонент показывает один из главных сценариев, одну из основных схем, по которым шло формирование генофонда. Такие карты первых (по важности) сценариев, построенные по данным соматологии и по данным дерматоглифики, оказались удивительно похожи. По сути, это один и тот же сценарий постепенных изменений в населении при движении в широтном направлении (с юга на север или наоборот). То есть наиболее различаются южные и северные популяции, а посредине расположена широкая область постепенных переходов.
Итак, главные сценарии антропологии — как соматологии, так и дерматоглифики (а также и данные генетики, представленные в следующих главах) выявляют один и тот же тип ландшафта. Мы видели (табл. 4.4.1) что корреляция между главными сценариями антропологии и классических маркёров достигает r=0.85, а между главными сценариями антропологии и ДНК маркёров r=0.73. Если совершенно разные признаки, изученные по совершенно разному набору популяций, выявляют один и тот же строй в архитектонике генофонда, это может указывать лишь на одно: именно эта, пробивающаяся сквозь все несовершенства наших исследований, структура генофонда существует объективно.
Выявленное широтное направление изменчивости русского народа известно по данным лингвистики — северные, южные и промежуточные среднерусские говоры. В таком случае можно предположить, что широтная изменчивость отражает иной процесс, чем описанные ранее три зоны («славянская», «рифтовая» и «финно-угорская). Обобщённые антропологические карты расстояний (выявляющие три зоны) отражают расселение восточнославянских племен и смешение их генофонда с местным финно-угорским населением. А обобщённые карты главных компонент (выявляющие широтную изменчивость) выявляют либо два разных (северный и южный) потока славянской колонизации, либо две разных (северную и южную) субстратные группы финно-угорского населения. Можно выдвинуть и третью гипотезу — что широтная изменчивость, как некая поляризация внутри единого поля, возникла или же усилилась уже после формирования русского народа, параллельно с формированием северного и южного наречий единого русского языка.
Важно и иное. Говоря не об обобщённых картах, а о картах отдельных признаков, можно заметить, что, хотя в целом карты русского народа подчиняются тенденциям изменчивости того же признака на картах населения Восточной Европы, однако — благодаря внутриэтниче-скому антропологическому масштабу — они позволяют уловить и иные, собственно русские, закономерности (см., например, карты роста бороды и горизонтальной профилировки лица). Это значит, что в антропологической структуре русского народа геногеографические карты позволяют видеть не только результаты взаимодействия монголоидов и европеоидов, населения леса и степи, Прибалтики и Приуралья, но и структуры, связанные с этногенезом собственно русского народа. В следующей главе, рассматривая классические маркёры популяционной генетики, мы вновь увидим «особенную стать» русского генофонда.
АНТРОПОЛОГИЯ + ГЕНОГЕОГРАФИЯ=ГЕНОФОНД
И в заключение этой главы скажем о примечательной терминологической путанице, проходящей по главе красной нитью. Например, в предпоследнем абзаце: «антропологические карты… отражают… генофонд». Конечно же, правильнее было бы везде говорить об «антропологическом покрове» или возрождать термин «фенофонд». Формально правильнее, но вовсе не точнее. И хотя в названии раздела нам пришлось использовать понятие «фенофонд», мы предпочитаем подчёркивать, что антропологические данные несут прямую информацию именно о генофонде. Это признается большинством генетиков, судя хотя бы по тому, сколь охотно они привлекают данные по физической антропологии [см., например, самую основную и толстую геногеографическую монографию Cavalli-Sforza et al., 1994]. И если лингвистическое сходство или географическое соседство популяций рассматривается как указание на возможную общность их генофондов, то тем более за антропологическими данными надо признать право на прямую связь с генофондом. Необходимо лишь найти язык изложения научных знаний, на котором антропология и генетика могут объективно сравнить свои результаты и обсудить свои итоги. И мы надеемся, что карты, и в особенности обобщённые ландшафты антропологических и генетических данных, послужат таким общим языком, могут стать тем искомым «общим аршином», который позволит измерить, наконец, «особенную стать» русского генофонда.
Никем не выявленной загадкой было утверждение, что группы крови равномерно распределены на земном шаре… Трагедия мировой войны помогла разрешить эту загадку. На македонском фронте было великое скопление народов и рас: солдаты английские, французские, сербские, русские, войска цветных — мальгашей, индусов и негров. Весь этот калейдоскоп рас и народов жил вместе в одном климате, все одетые одинаково и болевшие одними болезнями. В итоге различия в группах крови обнаруживались ярчайшим образом…
Обрисовав в предыдущей главе черты антропологического портрета русского генофонда (глава 4) мы переходим к следующему его портрету — генетическому. Его мы восстанавливаем уже не по чертам внешнего облика русского населения, а по данным об изменчивости генов. Мы, наконец, делаем решительный шаг от фенофонда к генофонду. Поэтому в этой главе следует задать генофонду именно те вопросы, на которые лучше всего смогут ответить именно классические, а не иные генетические маркёры.
В чем достоинства классических генных маркёров, этих свидетелей, рассказывающих нам о генофонде? Есть ли у них недостатки? Насколько подробный портрет генофонда смогут они нарисовать? Каким способом лучше проанализировать эти данные, чтобы извлечь полную и достоверную информацию о генофонде? Что даёт статистический способ анализа? И почему мы всё же отдаём предпочтение картографическому способу? Если мы будем изучать генофонд с помощью карт, то изменятся ли при этом статистические параметры (средние частоты, разнообразие)? И если изменятся, то как? Попытки ответить на эти и иные вопросы, общие для всех генетических маркёров, даны в разделе 5.1.
Какова географическая изменчивость каждого из классических генетических маркёров? Их изменчивость в пределах «исконного» русского ареала рассмотрена в разделе 5.2. В нём приведены карты распространения аллелей, предложено их описание и интерпретация. Отметим одну особенность. В предыдущей главе — при анализе антропологии — мы строго ограничили себя только русскими популяциями, не включая в анализ даже ближайших иноэтничных соседей. Такое ограничение позволительно в области антропологии, где имеются прекрасные обобщающие работы по сравнительной антропологии народов Восточной Европы [см., например, коллективные монографии Происхождение…., 1965; Восточные славяне, 2002; а также Дерябин, 1998, 2002]. Однако по генетике русского народа и его соседей обобщающих работ практически нет. Поэтому, геногеографию русского народа мы рассматриваем не изолированно, а на фоне генетической изменчивости соседних народов, регионов или порой всей ойкумены. Это позволяет понять, какие черты русского генофонда объясняются обменом генами с соседями, а какие — собственной историей русского народа.
На сайте www.genofond.ru и в Приложении (раздел 6) приведены сводки данных о средних частотах и показателях межпопуляционной изменчивости (GST) классических маркёров как в русских популяциях, так и в крупных регионах мира. В сводке представлены Европа и Юго-Западная Азия, Индостан, Восточная Азия, Америка, Меланезия, Океания, Австралия, Африка, Северная Евразия. Для Северной Евразии приведены также данные и по субрегионам — Восточной Европе, Кавказу, Уралу, Средней Азии, Сибири. Пользуясь этими данными, читатель сможет сам сравнивать изменчивость классических маркёров в любых, интересующих его регионах.
Однако анализ карт отдельных генов (основное содержание раздела 5.2) — не самоцель, а лишь промежуточный этап для познания русского генофонда, его географии, его структуры, его истории. Насколько генетически различны популяции русского народа? Одинакова ли такая генетическая гетерогенность для русского и других народов Евразии? Различаются ли по уровню гетерогенности «типичные» народы Западной Европы, Восточной Европы, Кавказа, Урала, Сибири? Каковы основные географические закономерности в структуре русского генофонда? Эти главные вопросы рассматриваются в разделе 5.3.
Вопрос о том, каково положение русского генофонда среди окружающих народов Евразии, также требует ответа — хотя авторы сознают, что пока ответ может быть только предварительным. Этим вопросам посвящены заключительные главы книги (главы 8 и 9) где привлечены данные разных наук и рассмотрение проведено на широком фоне генофондов Евразии.
§ 1. Смещены ли оценки разнообразия по классическим маркёрам? Описывают генофонд — Подробно изучены — Смещение оценок — миф! — Но живучий
§ 2. Зачем нужны карты? У каждого гена свои популяции — Статистик отрубит неизученное — Картограф изучит недоизученное — Искать закономерности в толпе цифр? — Лучше увидеть их на карте!
§ 3. Кого изучать? Только «исконный» ареал — Все его части — Коренные популяции — Коренные семьи — Правило третьего поколения — Одного из семьи
§ 4. Как устроены карты? Построение карты — Анализ карты — Выбор генов для атласа — Сорок четыре карты — Шагреневая кожа надёжного ареала.
§ 5. Что мы увидим на картах? Исходные данные и карты — Карты точнее! — Фактор числа точек — Фактор неравенства ареалов — Замечаем действие отбора — По отклонению от селективно-нейтральной изменчивости — Замечаем действие истории — По величине селективно-нейтральной изменчивости — А также по рельефу карты — Сфинкс
§ 6. Иерархия популяций: «матрёшки». В ойкумену вложены регионы — В регионах этносы — В этносах локальные популяции — Промежуточные матрёшки — Такова модель генофонда — Частота в локальной популяции — Этническая частота как средняя локальных — Региональная как средняя этнических — Но никак не средняя всех локальных! — Дисперсия локальных частот — Дисперсия этнических частот — Когда внутриэтническая нулевая — Можно прыгать через матрёшку — Но лучше проходить их все подряд — Всё это важно знать!
В этом разделе мы объединили общие вопросы, которые всегда возникают при изучении генофонда. На многие из этих вопросов из всех разнообразных генетических маркёров пока могут дать ответ именно классические маркёры.
КЛАССИЧЕСКИЕ МАРКЁРЫ
Классическими маркёрами принято называть гены, изучаемые не по их строению, а по их проявлению на уровне белков, на уровне фенотипа. Поэтому к группе «классических» маркёров (см. главу 1) относят все те многообразные генетические маркёры, с которыми работала популяционная генетика до наступления «ДНК-эры». Это и иммунологические маркёры, в длинный список которых входят всем известные группы крови (АВ0, Резус). Это и физиологические маркёры — генетически заданные особенности ощущения цвета и вкуса. Это и генетико-биохимические маркёры — различные ферменты эритроцитов и сыворотки крови (изредка — других тканей).
Все эти признаки объединяет то, что по их фенотипическому полиморфизму (разным проявлениям у разных людей) можно однозначно судить о генетическом полиморфизме — о конкретных вариантах генов (генотипах этих людей). Поэтому эти признаки фенотипа и называются генетическими маркёрами — ведь они маркируют гены, то есть дают нам знать, какой аллельный вариант гена скрывается за данным внешним проявлением признака.
И классические маркёры, и антропологические признаки мы определяем по их проявлению, по фенотипу. Однако разница есть, и немаловажная. Изучая антропологические признаки, мы знали, что за ними скрываются группы генов, но не знали — какие именно, не могли назвать эти гены по именам, узнать их «в лицо», не могли извлечь чисто генетическую информацию. Переходя к классическим маркёрам, мы переходим к столь простым признакам, что за каждый из них отвечает всего лишь один ген. Считается, что у классических генных маркёров путь от гена до признака столь невелик, что другие гены (или условия среды) не успевают вмешаться в результаты работы гена. И поэтому по внешнему проявлению, по фенотипу мы можем однозначно судить о генотипе. Следовательно, по множеству классических маркёров мы можем восстанавливать структуру самого генофонда, а не его преломление в фенофонде, как по признакам антропологии.
В следующей главе мы сделаем ещё один шаг и рассмотрим генетический портрет русского генофонда уже по молекулярно-генетическим (ДНК) маркёрам. Для них нам уже не надо будет знать даже фенотипического проявления генов — многие из ДНК маркёров такого проявления и не имеют. Для ДНК маркёров мы напрямую отслеживаем изменения самого генетического материала. Это проще и удобнее. Однако пока наиболее изученные в русских популяциях ДНК маркёры, на которые можно опереться — это гаплогруппы митохондриальной ДНК и Y хромосомы (глава 6). Но при всех их достоинствах, только двух — и столь своеобычных!
— генных локусов явно недостаточно для изучения всего генофонда. Поэтому до тех пор, пока не накопится достаточно данных по остальным ДНК маркёрам, наиболее надёжные данные о русском генофонде можно добыть, только опираясь на классические маркёры.
ОЦЕНКА РАЗНООБРАЗИЯ ГЕНОФОНДА
«Нет в мире совершенства» — справедливо считал Лис [Сент-Экзюпери, «Маленький принц»]. Наверное, и у классических маркёров есть изъяны? Надо сразу сказать, что основной упрёк классическим маркёрам
— смещение оценок разнообразия относительно всего генофонда — оказался несправедливым. Этот упрёк основывался на том, что классические маркёры тестируются по их белковым продуктам, которые обычно подпадают под действие естественного отбора. А ДНК маркёры тестируются прямо по нуклеотидным последовательностям, которые могут быть не подвержены отбору. И предполагалось, что из-за действия отбора различия между популяциями, рассчитанные по классическим маркёрам, искажены. Поэтому на заре «ДНК эры» широко распространилось мнение, что пора отрешиться от анализа генофонда по классическим маркёрам!
Оказалось, что этот шаг поспешен и неверен — классические маркёры точно и правильно оценивают разнообразие генофонда. В действительности, предположение, что классические маркёры дают искажённую оценку, неверно даже теоретически: ещё до появления первых оценок по ДНК маркёрам нами теоретически было показано, что среднее разнообразие популяций GST должно быть одинаково и по ДНК, и по классическим маркёрам [Рычков, Балановская, 1987, 19906]. Самая первая работа по межпопуляционной изменчивости ДНК маркёров, осуществленная коллективом L. L. Cavalli-Sforza ([Bowcock et al., 1987], см. подробно Приложение) подтвердила этот прогноз. И с тех пор все корректно проведённые сравнительные исследования давали тот же результат (см. Приложение и главу 8): полное соответствие межпопуляционной изменчивости, рассчитанной по классическим и по ауто-сомным ДНК маркёрам.
Уж скоро минет пятнадцать лет, как с классических маркёров было полностью «снято обвинение» в смещённости оценок [Bowcock et al., 1987; 1991а; Bowcock, Cavalli-Sforza, 1991; Cavalli-Sforza, Piazza, 1993]. И, тем не менее, до сих пор из диссертации в диссертацию кочует поверье, что по классическим маркёрам разнообразие не определишь. Научные мифы живучи. И эхо необдуманных предсказаний может десятилетиями тормозить развитие науки. До сих пор многие учёные, работающие с ДНК маркёрами, из-за этого поверья считают себя вправе не знать всё, что было получено по классическим маркёрам их предшественниками. Образовавшийся разрыв в преемственности науки создаёт ту свободу от прошлого, которая рождает легковесность и необязательность утверждений: «Свобода веток от ствола и корня, свобода плеч от тяжкой головы…».[27]
НЕРАВНОМЕРНОСТЬ ИЗУЧЕННОСТИ
Итак, упрёк в смещённости оценок разнообразия оказался неоправданным. Однако у классических маркёров всё же есть существенный изъян, хотя совсем иной — это крайняя неравномерность их изученности. Антропологические маркёры, как мы видели в главе 4, исследованы в большинстве популяций по единой программе — это обеспечивает полную сопоставимость популяций по всему набору признаков. По панелям однородительских ДНК маркёров также многие популяции изучены идентично. А по классическим маркёрам и аутосомным ДНК маркёрам программа исследований не была стандартизирована: в одних популяциях изучались одни маркёры, в других популяциях — другие маркёры. Если составить сводную таблицу, то мы увидим, что для каждой популяции изучен свой набор маркёров, а для каждого из маркёров изучен свой набор популяций. Это делает популяционную информацию по классическим маркёрам плохо сопоставимой.
Например, наше геногеографическое изучение генофонда Восточной Европы (глава 8) опирается на данные по 100 аллелям (34 локусов) в 1586 популяциях. Но ни одна из полутора тысяч популяций не изучена по всем 34 генам. Поэтому напрямую провести статистический анализ невозможно: в матрице 1586x100 большинство ячеек пустуют.
Эта проблема несопоставимости данных по разным популяциям постоянно возникает при анализе классических маркёров и затрудняет использование методов многомерного статистического анализа — главных компонент, генетических расстояний и так далее.
ГОРДИЕВ УЗЕЛ
Обычный выход из этой ситуации — резкое сокращение числа анализируемых популяций и числа анализируемых генов. В результате в анализ включаются лишь немногие подробно изученные популяции и немногие общепринятые маркёры
Например, из матрицы 1586x100 останутся в лучшем случае только 20x8, но зато все ячейки будут заполнены — каждая из 20 оставшихся популяций изучена по каждому из 8 аллелей.
Решение простое. Оно уничтожает не только проблему, но и информацию, с трудом собранную поколениями генетиков. Такой способ обращения с гордиевыми узлами могут позволить себе полководцы, а не исследователи. «Македонское решение» приводит к анализу лишь малой части всего генофонда и, следовательно, к малой надёжности результатов. Ведь несколько случайных популяций, которым посчастливилось быть изученным по этой панели маркёров, не могут надёжно представлять всю популяционную систему. А малый набор маркёров также не может служить характеристикой генофонда. В этом случае анализируется лишь случайный ряд популяций по нескольким генам, но не сам генофонд.
Иной — «не македонский» — выход из этой ситуации даёт геногеография. Она осторожно распутывает гордиевы узлы классических и аутосомных ДНК маркёров. По сведениям о популяциях, изученных по данному аллелю, геногеограф прогнозирует частоту этого аллеля в остальных, «пропущенных» популяциях. Специальные процедуры картографической интерполяции помогают найти наиболее вероятные значения признака для тех популяций, по которым исходная информация отсутствует. В результате заполняются «пробелы» вырожденной матрицы и в анализ включаются все изученные популяции и репрезентативный набор генных маркёров. Карты «надёжности» [Нурбаев, Балановская, 1997, 1998] позволяют выбрать из всей совокупности интерполированных (прогнозируемых) значений лишь те, которые обладают высокой надёжностью (см. Приложение).
ОБЪЕКТИВНОСТЬ КАРТЫ
Есть и ещё одно важное достоинство карт. Сравним таблицу исходных данных и карту, построенную на её основе. Сводку всех основных данных по изменчивости классических генных маркёров в русских популяциях мы привели в Приложении (раздел 6) и на сайте www.genofond.ru. Однако читатель, заглянув туда, сразу убедится, сколь непросто проследить по этим табличным
— Сколько дипломов надо иметь, чтобы считаться интеллигентным человеком?
— Нужны три диплома о высшем образовании: дедушкин, папин и свой собственный.
Поскольку мы перешли к «настоящим» генетическим маркёрам, перечислим первые вопросы, которые следует задать при создании их картографического атласа. В пределах какого ареала нужно изучить генофонд данного народа? Какая территория может считаться этническим ареалом при исследовании его истории? Какие необходимо изучить популяции, чтобы выявить реальные генетические различия в пределах ареала? Каковы должны быть выборки? Иными словами, какие части этнического ареала и какие части населения мы непременно должны изучить, чтобы выявить реальную структуру генофонда? Перечисленные ниже правила формирования выборок относятся не только к классическим — к любым генетическим маркёрам.
ТОЛЬКО «КОРЕННОЕ» НАСЕЛЕНИЕ
В подавляющем большинстве геногеографических исследований — не только наших, но и в мировой науке — используется принцип изучения «только коренного населения». Он включает несколько правил, которые помогают решить: какие ареалы, какие популяции и каких именно индивидов стоит включить в обследование, чтобы удалось реконструировать историю генофонда? Расскажем о некоторых из этих правил.
ПРАВИЛО ПЕРВОЕ: ИСТОРИЧЕСКИЙ АРЕАЛ ЭТНОСА
Этим правилом задаётся круг генетически обследуемых популяций. Обычно анализируются только популяции в пределах «исконного» ареала этноса, то есть той территории, на которой этот народ исторически сформировался.
Подчеркнём: границы «исконных» этнических ареалов определяются не генетиками, а специалистами в области этнографии, лингвистики и других гуманитарных наук. Генетики всегда только используют данные гуманитарных наук и никогда не определяют «исконность» ареала по данным генетики! Не потому, что не хотят (кто-то, может быть, и захочет…) — а потому, что это невозможно по определению.
Для определения «исконного» ареала не так важно, что народ после своего формирования мог расширить, сузить или сменить территорию расселения.
Примером могут служить адыги, после Кавказской войны переселившиеся не только в Турцию, но и во многие страны Передней Азии, Ближнего Востока и даже Мадагаскара. Однако их «исконный» ареал по-прежнему остается на Западном Кавказе, несмотря на то, что ныне там плотность славянского населения намного превышает плотность коренных народов.
Важно учесть и то, что набор анализируемых популяций должен представлять все основные части этнического ареала. Если все изучаемые популяции будут сосредоточены лишь в одной части ареала (например, все изученные русские популяции будут только из Саратовской области), то мы получим характеристику не всего народа, а лишь изученной части (подменим русский генофонд генофондом русских Поволжья).
ПРАВИЛО ВТОРОЕ: АРЕАЛ ПОПУЛЯЦИИ
Этим правилом задаётся круг населённых пунктов, которых можно изучить для характеристики локальной популяции, принадлежащей к данному этносу и живущей в пределах его исторического ареала. Например, в нашей экспедиционной работе из всех населённых пунктов в пределах изучаемой популяции обследуются те, которые в наименьшей степени были подвержены влиянию миграций и потому могли сохранить наиболее древний, коренной генофонд.
Для выполнения этого правила необходимо каждый раз чётко формулировать, какая именно популяция представляет интерес для изучения генофонда. И уже в пределах её ареала отбирать индивидов для включения в выборку.
Например, если мы хотим изучить популяцию коренного населения Краснодарского края, то корректнее изучить не всё проживающее там русское население, а только потомков кубанских казаков. Они могли сохранить те генетические черты, которые помогут реконструировать веками складывавшуюся структуру русского генофонда. Современное же население Краснодарского края (в котором потомки кубанских казаков составляют лишь очень малую часть) из-за мощных ветров миграций скорее внесёт путаницу в деле реконструкции истории генофонда. Поэтому для изучения истории русского народа в выборку индивидов, представляющих Краснодарский край, мы включили только потомков кубанских казаков.
Если же встанет иная задача — изучение недавних событий в русском генофонде — то правила выбора индивидов и ареала, из которого они должны происходить, станут совсем иными. Если нам потребуется изучить «мгновенный» (сиюминутный, эфемерный) срез генофонда Краснодарского края — мы должны будем обеспечить создание такой выборки.
Но даже в этом случае нельзя брать первых попавшихся представителей населения края — они не создадут случайную репрезентативную выборку даже для «сиюминутного» среза. Ведь всё будет зависеть, где эти люди нам «попались» — ведь та часть края (или та поликлиника, в которой мы решили собирать выборку) может быть совершенно отличной от реальной структуры генофонда. Например, если мы организуем наш сбор образцов в аэропорту, всё будет зависеть, откуда или куда отправлялись в «сию минуту» самолеты.
ПРАВИЛО ТРЕТЬЕ: «ПРАВИЛО ТРЕХ ПОКОЛЕНИЙ»
При изучении истории русского генофонда мы старались следовать «правилу трёх поколений»: включению в выборку только тех индивидов, ВСЕ предки которых до третьего поколения (все бабушки и деды) не только относились к данному этносу, но и родились в пределах ареала данной популяции.
Конечно, для этого надо составлять родословные. Соблюдение этого требования позволяет избежать влияния недавних миграций. Следуя ему, мы исключаем из генетико-исторического исследования, например, тех людей, чьи родители переселились на эту территорию из иных областей. Пока ещё неизвестно, оставят ли они свой генетический след в популяции? Поэтому «правило трёх поколений» позволяет учесть только те миграции, которые уже оставили реальный след в генофонде (например, ныне многочисленных потомков семьи, переселившейся на изучаемую территорию столетие назад).
Применение этого правила можно проиллюстрировать следующим примером. При изучении генофонда Псковской области мы выбрали для обследования две популяции, в которых и ныне сохраняется коренное население и которые достаточно полно представляют сложную историю русского населения Псковской земли: отражают и собственно псковское, и новгородское население. Первая популяция — Островский район, собственно псковитяне. И обследуя её, мы формируем выборку так, чтобы в нее попали только те индивиды, все бабушки и дедушки которых родились в Островском районе. Вторая популяция — Порховский и Дедовиче-ский районы — сначала входили в земли Новгородские, и лишь после падения Новгорода отошли ко Пскову. Поскольку оба района (и Порховский, и Дедовический) представляют популяцию с единой историей и в равной степени отражают интересующее нас население, то, обследуя эту популяцию, мы формируем выборку так, чтобы в нее попали только те индивиды, все бабушки и дедушки которых родились в пределах этих двух районов (Порховского и Дедовического). В этом случае мы не требуем принадлежности предков к одному району, как в случае Островского района — а к любому из двух, соседних и исторически сходных. Этот пример показывает, что выбор популяций определяется целиком историей формирования народа — не имея возможности генетически изучить все популяции, мы выбираем для анализа ключевые для понимания истории и структуры генофонда. Ареал изучаемой популяции в первом примере равен одному району, а во втором — двум.
ПРАВИЛО ЧЕТВЁРТОЕ. ИСКЛЮЧЕНИЕ РОДСТВА
Родословные надо знать и для того, чтобы не включать в выборку родственников — родство между индивидами в выборке также исключается до третьего поколения.
Например, если на обследование пришли два индивида, и обнаружилось, что их бабушки или дедушки являются друг другу братьями или сестрами, то мы включаем в выборку лишь одного из двух пришедших. Это и понятно — если мы включим в выборку родственников, то повторно возьмём одни и те же гены. Из-за этого реальная выборка становится меньше, да к тому же может произойти «смещение» частот генов популяции в сторону какой-либо семьи. В русских селах такое смещение может произойти даже тогда, когда мы обследуем только один край села — ведь родственники чаще селятся рядом.
ПОПУЛЯЦИИ ДЛЯ АНАЛИЗА КЛАССИЧЕСКИХ МАРКЕРОВ
При картографировании классических маркёров в русских популяциях мы сочли возможным — в порядке эксперимента — несколько отклониться от буквы первого из правил. В историческую территорию формирования и «исконного» расселения русского народа никак не могут быть включены территории Прибалтики, Причерноморья, Предкавказья, Нижней Волги, Приу-ралья, не говоря об Урале и Кавказе. С другой стороны, последние столетия характеризуются массовым распространением русского населения на этих обширных территориях, их смешением с автохтонным населением и даже формированием новых популяционных образований (например, камчадалы, изоляты сибирских староверов, Ленские старожилы и др.). Поэтому в анализ мы включили данные не только по территории формирования русского народа, но и некоторые популяции из смежных областей, оставаясь при этом в пределах Восточной Европы. Результаты такого эксперимента подробно описываются во многих разделах данной главы.
Мы отобрали для анализа русские популяции, расположенные от 43° до 70° северной широты и от 24° до 60° восточной долготы[28]. При всей условности такого отбора данных, он позволил автоматически исключить из рассмотрения многие территории, оторванные от основного ареала. Хотя при этом мы несколько вышли за пределы «исконного» ареала, подчеркнём, что только такая особенность русского народа, как его массовое расселение на огромных территориях Евразии, вынудила нас рассматривать, строго говоря, и некоторые «некоренные» популяции. В заданную область пространства попадает небольшая часть территории соседних с Россией государств — Прибалтики, Белоруссии, Украины. Однако особо подчеркнём: только русское население этих территорий включалось в анализ! Так что и в статистическом анализе, и на картах русского генофонда присутствуют только русские популяции, расположенные в пределах заданной области.
ИНДИВИДЫ ДЛЯ АНАЛИЗА КЛАССИЧЕСКИХ МАРКЕРОВ
Что же касается третьего правила (формирование выборки индивидов), то здесь мы ограничены подходом авторов, публикации которых использованы при создании Банка данных о русском генофонде. В отечественных генетических исследованиях выборка из популяции обычно составляется из неродственных лиц, которые рождены на данной территории и родители которых относятся к данному этносу. Некоторые авторы, к сожалению, определяли принадлежность к популяции и этносу лишь по происхождению самого индивида, а не его предков. Однако многие другие авторы собирали данные много тщательнее — учитывались места рождения и этническая принадлежность всех четырех бабушек и дедушек пробанда. Это позволяло избежать случайных колебаний миграционного потока и учесть в выборке только наиболее устойчивые миграции, генетический след которых сохранился в популяции и по прошествии двух поколений. Именно такие выборки дают наиболее полное представление об исторически сложившейся структуре генофонда.
Главным «прибором», показывающим структуру русского генофонда, служат геногеографические карты. Технология создания карт достаточно подробно описана в Приложении. Для читателя, не заглядывающего в другие разделы, кратко повторим основные моменты, необходимые для лёгкого чтения и понимания карт, приведённых в этой главе и всей второй части книги.
СТРОИМ КАРТУ
Для построения карты используется информация об изученных русских популяциях. Каждая из этих популяций служит «опорной точкой». По совокупности опорных точек рассчитываются значения частоты аллеля в каждой точке карты. Для карт классических маркёров число изученных популяций (опорных точек — К) варьирует от 8 (локус HLA*B) до 182 (группы крови АВ0). Число же точек карты (узлов сетки) очень велико — 9064, и значение в каждой точке карты рассчитывается по данным обо всей совокупности опорных точек (К) — исходных популяций, изученных по данному маркёру.
Географическое положение опорных точек указано (тёмными кружками с белым обрамлением) на самой карте. Понятно, что в тех областях карты, где опорных точек много, можно получить надёжно прогнозируемые значения во всех узлах сетки, во всех точках этой области. А там, где опорных точек мало (например, в периферийных областях карты), рассчитанные значения в узлах сетки карты будут ненадёжны. Такие «ненадёжные» точки карты мы не анализируем. Поэтому, хотя общее число узлов сетки одинаково для всех карт русского генофонда (9064 точек), число надёжных точек намного меньше — от 895 (локус KEL) до 4355 (локус АВ0). Именно это число — число надёжных точек карты — указано в легенде карты (N). Только эти точки отображаются на карте и включаются в любые виды статистического анализа. Число опорных точек (К) также приведено в легенде карты.
Чтобы карта была информативна, важно легко на ней ориентироваться, соотносить выявляемые зоны генетического рельефа с другими географическими объектами — странами, областями, городами, реками, природными зонами, этническими ареалами и так далее. Для этого на всех картах приведены береговые линии морей и гидрографическая сеть (озера, реки), горные хребты, государственные границы, несколько крупных городов (значимых, согласно замыслу книги, скорее для средневековой, чем современной, России), а самой надёжной привязкой карты к реальному географическому пространству служит, разумеется, градусная сетка.
ЦИФРОВАЯ МОДЕЛЬ КАРТЫ. Процедуры построения и анализа компьютерных карт подробно описаны в Приложении. Здесь напомним лишь, что в основе компьютерных карт лежат их цифровые модели (ЦМ) — двумерные числовые матрицы частот аллеля, а значения частоты аллеля прогнозируются для каждого узла сетки карты. Для создания такой матрицы пространство карты было покрыто густой равномерной сетью, состоящей из 9064 узлов. Для каждого узла сетки с помощью интерполяционной процедуры рассчитано значение частоты аллеля. В расчёте значений каждого узла участвовали все изученные русские популяции в пределах заданного радиуса, взятые с весом, обратным расстоянию от популяции до данного узла сетки. Параметры картографирования для русского генофонда: использована нулевая степень полинома, шестая степень весовой функции и учитывалась информация об исходных популяциях в радиусе 2000 км. Такой расчёт проводился независимо для каждого узла сетки. Это означает, что для каждого из 9064 узлов сетки учитывались одни и те же опорные точки (реально изученные популяции), но расстояния до популяций и, следовательно, вес каждой популяции при определении частоты аллеля в данном узле сетки — менялись. Часто спрашивают: зависит ли карта от того, с какого угла мы начнём её строить? Еще раз подчеркнём — рассчитанные значения в каких-либо узлах сетки никак не влияют на определение частоты аллеля в других её узлах. Отвечаем на вопрос: поэтому-то совершенно неважно, откуда мы начнём и в каком порядке будем проводить расчёт для разных узлов карты.
СОЗДАНИЕ ИЗОБРАЖЕНИЯ. Но цифровая модель — это матрица, таблица. Чтобы отобразить её в виде карты, каждое значение окрашивается своим цветом — в зависимости от того, в какой из интервалов попадает это значение. Шкала интервалов задаётся исследователем-автором карты. Понятно, что образ одной и той же карты (одной и той же ЦМ) может различаться в зависимости от избранной шкалы. Поэтому так важно следовать определённым правилам выбора шкалы (см. Приложение). Шкала обязательно приводится в легенде каждой карты. Граничные значения интервалов шкалы приводятся под гистограммой. Сама гистограмма и числа над столбцами гистограммы указывают долю площади карты, занятой точками, значения в которых попали в данный интервал.
НАДЁЖНОСТЬ. Карта каждого аллеля сопровождается специальной картой надёжности — она для каждого узла сетки указывает достоверность рассчитанного значения частоты аллеля [Нурбаев, Балановская, 1998]. Значения принимались как достоверные, когда вероятность правильного прогноза составляла Р>0.95 при уровне строгости[29] r=0.3. «Ненадёжные», то есть слабоизученные области, залиты на картах белым цветом и заточкованы, и все характеристики карты рассчитываются только по надёжному пространству. Число узлов карты (N), вошедших в «надёжное пространство» данного аллеля, указано в легенде каждой карты.
После того, как для каждого «надёжного» узла сетки получен независимый прогноз частоты аллеля, создание цифровой модели (ЦМ) карты завершено. Далее с ЦМ (как с обычными матрицами) проводим все дальнейшие преобразования и статистические расчёты — корреляций, трендов, главных компонент, получая количественные оценки связей и закономерностей. При этом карта, содержащая прогнозированные значения для каждой точки, становится не иллюстрацией, а математической моделью пространственной изменчивости. Карта служит инструментом количественного анализа генофонда. Это значит, что карта становится не «графическим», а «алгебраическим» объектом.
КОРРЕЛЯЦИИ. Связь частоты аллеля с широтой и долготой оценивалась не только обычным — единственным — значением коэффициента корреляции, но ещё и строились три корреляционных карты. Одна такая карта содержала в каждом узле показатели корреляции значения признака с широтой. Другая — с долготой. Третья — показатель множественной корреляции с широтой и долготой. Среднее значение корреляции по всем точкам карты является аналогом обычного коэффициента корреляции. Сама же карта показывает, какова теснота связи в том или ином регионе, в той или иной части карты. Ведь вполне возможна ситуация, когда в одном регионе изменчивость аллеля широтна, а в другом — коррелирует с долготой. Более того, при переходе от региона к региону может измениться даже знак корреляции. В этом случае обычный коэффициент корреляции неэффективен, и реально существующую закономерность может выявить только корреляционная карта.
Для построения корреляционных карт используется разработанная нами процедура «плывущего окна» (см. Приложение, а также [Балановская и др., 1994а, б; Балановская, Нурбаев, 1995]). В каждом узле сетки указан показатель корреляции, рассчитанный для «плывущего окна» — области карты заданной площади, в центре которой находится данный узел. Иными словами, для совокупности всех узлов сетки, попавших в это «окно», рассчитывался коэффициент корреляции между частотой аллеля в этих точках и географическими координатами (широтой, долготой) этих точек. И полученное значение коэффициента корреляции заносилось в центральный узел окна. Затем окно перемещалось на один узел сетки, и операция повторялась. После того, как окно «проплыло» по всей карте и все её узлы побывали центральными, каждый из «надёжных» узлов получил свое значение корреляции признаков. Из этих значений построена карта корреляций, показывающая, как меняется уровень связи (корреляции) в различных частях карты. В таблице 5.2.1 приведены MIN, MEAN, МАХ, — соответственно минимальное, среднее и максимальное значения коэффициента корреляции. Напомним, что в статистике коэффициенты частной корреляции меняются от -1 до +1, а множественные — всегда положительны (от 0 до 1).
ТРЕНДЫ. Для большей простоты и наглядности в работе приведены карты, полученные при небольшом окне сглаживания (фоновые карты или «карты трендов», см. Приложение, а также [Балановская, Нурбаев, 1995]). Эти карты, также как и корреляционные, получены с помощью процедуры «плывущего окна». Только в центральный узел заносились не коэффициенты корреляции, а средняя частота по всем узлам сетки, попавшим в «плывущее» окно. В результате «сглаживались» резкие колебания частоты гена — ведь такие колебания частоты между соседними популяциями обычно связаны с несовершенством популяционных выборок. В таблице 5.2.1. и в легендах соответствующих карт раздела 5.2 приведены статистические характеристики исходного (несглаженного) генетического рельефа.
СТАТИСТИКИ КАРТ. Использованы следующие обозначения: MIN, MAX, MEAN — соответственно минимальное, максимальное и среднее значения частоты аллеля, GST — межпо-пуляционная изменчивость, HS — вклад данного аллеля в общую гетерозиготность локуса. Построенные нами компьютерные геногеографические карты характеризуют изменчивость 44 классических генетических маркёров в русском ареале. Конечно, в данной главе мы можем обсудить лишь часть этих карт. Однако в сводной таблице 5.2.1. приведены основные характеристики всех 44 аллелей. Напомним также, что многие карты Атласа русского генофонда, в том числе и раздел классических генных маркёров, представлены на сайте www.genofond.ru.
АТЛАС
Картографический Атлас русского народа по классическим генным маркёрам состоит из двух основных разделов — «простых» и обобщённых карт (глава 3 и Приложение, раздел 5).
Первый раздел Атласа вобрал карты географического распределения в «исконном» русском ареале частот отдельных аллелей, а также результаты их анализа. Каждую простую карту (каждого аллеля) сопровождают карты трендов различной степени «сглаженности» и корреляционные карты — с географической широтой и долготой.
Второй раздел Атласа содержит карты, обобщающие изменчивость не одного аллеля или локуса, а всех вместе. Они отражают средние показатели разнообразия всего русского генофонда по классическим маркёрам: карты гетерозиготности и межпопуляционных различий, карты корреляционных связей, карты генетических расстояний и главных компонент изменчивости в историческом «исконном» ареале.
При создании Атласа из банка данных «Русский генофонд» по классическим маркёрам были выбраны гены, по которым изучено хотя бы около десятка популяций. При этом мы учитывали географию изученных популяций — они должны представлять самые разные части «исконного» русского ареала. Иначе — если все популяции относятся лишь к одной части ареала — то, хотя бы этих популяций было и много, но такая информация не охватывает всю реальную изменчивость гена. И такой ген лучше не включать в анализ русского генофонда (это относится к локусам АK, C3F, GD, КР, LU, Р). В итоге, хотя карты были построены для всех 66 аллелей, в картографический Атлас вошли карты 44 аллелей 17 локусов — ABO, АСР, ESD, GC, GLO1, HP, MN, 6PGD, PGM1, PI, PTC, RH*d, TF, CV, KEL, LEW и HLA. Для всех 17 локусов был проведён картографо-статистический анализ, но в обобщённый анализ последние 4 локуса (CV, KEL, LEW и HLA) мы не включали — слишком слаба их изученность в «исконном» русском ареале.
Подробная информация о каждой из карт — частоты (минимум, максимум, средняя), гетерозиготность и межпопуляционная изменчивость, корреляция с широтой и долготой, число изученных популяций и величина «надёжного» ареала картографирования — приведена в разделе 5.2. Даже эта информация показывает, насколько неравно изучены классические маркёры! Из таблицы 5.2.1. мы видим, что локус LEW представлен всего лишь 9 русскими популяциями, в то время как локус АВ0 (известный всем как «группы крови») — 182 русскими популяциями. Среднее число популяций, изученных по 17 локусам, составило 35. Много это или мало? Конечно, по сравнению с данными антропологии, охватывающими 180 популяций (см. главу 4) классические маркёры изучены в пять раз хуже. Однако всё познаётся в сравнении — классические маркёры в среднем изучены в два-три раза лучше, чем ДНК маркёры (см. главу 6).
На всех картах значения показаны только для «надёжной» зоны, а все остальные территории показаны как «белые пятна» в изученности русского генофонда. «Надёжная» зона — это территория, хорошо обеспеченная исходными данными, которую карта надёжности оценивает как область достоверного прогноза. Если карты антропологии (глава 4) охватывали одну и ту же территорию, а их «надёжные» зоны были всегда одинаковы, то для классических маркёров всё переменчиво: по одним маркёрам «надёжные» зоны оказываются в пять раз меньше, чем по другим. Это привело к тому, что обобщённые карты русского генофонда, представленные в разделе 5.3., по площади невелики. Их «надёжная» зона, как шагреневая кожа, сокращается при включении слабо изученных маркёров. Она определяется надёжным ареалом наименее изученных генов — только так можно обеспечить надёжность карт, обобщающих изменчивость всех генов.
ОТ ТАБЛИЦЫ — К КАРТЕ
Но прежде, чем переходить к анализу карт, следует представить: а что же собственно происходит с исходной информацией, когда мы её картографируем? Ведь мы как бы возвращаем табличные популяционные данные, безразличные к пространству, в собственный географический ареал этих популяций, где эти данные вновь начинают жить в двумерном пространстве карты и соотноситься в нём с другими популяциями. Они находят своих географических соседей, и лишь в согласии (или в споре) с ними рождается карта. Но что при этом происходит с исходными оценками популяционных частот? Изменяются ли статистические параметры признаков (средние частоты, разнообразие), когда мы их картографируем? И если изменяются, то как?
Вопрос не праздный. Мы недаром приводим в разделе 5.3. две средние оценки гетерогенности русского народа (генетических различий между русскими популяциями — GST). Одна из них (GST=2.00) получена по табличным данным для того, чтобы сравнить её с табличными данными по другим народам Евразии. Вторая оценка гетерогенности (GST=1.36) получена по картографированным значениям для того, чтобы сравнить её с изменчивостью каждой из карт русского народа (см. раздел 5.1). Причём мы специально рассчитали обе оценки строго по одним и тем же популяциям и строго по одним и тем же генетическим маркёрам (44 аллеля 17 локусов). Однако, как мы видим, различия между этими двумя оценками велики (GST=2.00 и GST=1.36). И возникают эти различия в результате процедуры картографирования.
Так какая же оценка более «правильная»? Решающим аргументом служит то, что при картографировании учитывается новый параметр — география, учитывается важнейший атрибут популяции — её ареал. Если до этого для изменчивости гена было как бы одно измерение — лишь его частота, то теперь появляются ещё два измерения — двумерное пространство геногеографической карты. Карта учитывает географию гена. И поэтому мы считаем, что оценка, полученная по карте, является более точной — она уточняет статистические параметры изменчивости гена, рассчитанные просто по табличным данным, при игнорировании реального географического пространства, в котором живут популяции.
Но чтобы это утверждение не было голословным, рассмотрим на конкретных примерах, что в действительности происходит при переходе от таблицы к карте.
ЕСТЬ ЛИ РАЗЛИЧИЯ МЕЖДУ СТАТИСТИКАМИ КАРТ И ТАБЛИЦ?
Для ответа на этот вопрос проведём моделирование на разных генофондах. Возьмём в качестве модельных объектов три иерархически соподчинённых генофонда: 1) Белоруссия; 2) Черноморо-Балтийский регион (для краткости назовём его «Западным»), который включает в себя, кроме Белоруссии, также Украину, Молдавию, Литву, Латвию, Эстонию; 3) Северная Евразия, которая включает в себя и Черноморо-Балтийский, и все остальные регионы бывшего СССР. Мы видим, что каждый последующий генофонд включает в себя, как матрёшка, предыдущий и позволяет прослеживать закономерности более высокого порядка. Такой «принцип матрёшки» позволяет выявлять общее и особенное в пространственной структуре каждого из генофондов, а с методической стороны даёт возможность провести анализ с внутренним контролем. В качестве модельных генетических маркёров возьмём два самых подробно изученных. Это, конечно же, группы крови — всем известные как I, II, III и IV группы локуса АВ0 и резус (RH).
Таблица 5.1.1.
Сравнение средних частот (М) и межпопуляционных различий (GST) для исходных («таблица») и картографированных («карта») значений признаков
Примечание: состав регионов указан в тексте.
Чтобы критически оценить новую информацию, которую вносит учёт географического ареала популяций, рассмотрим для каждой из «матрёшек» по два распределения. Первое распределение («табличное») характеризует данные таблиц до картографирования — частоты гена в изученных популяциях. А второе распределение («карточное») характеризует карты — картографированные значения. Мы не будем утомлять читателя гистограммами (они приведены на картах модельных регионов в [Балановская и др., 1994; Балановская, Нурбаев, 1995]), и приведем только средние значения частоты аллеля (М) и межпопуляционные различия (GST) до и после картографирования (табл. 5.1.1).
Сравнение таблиц и карт показывает, что нет единой закономерности изменений при картографировании: всё зависит от самого гена, от особенностей его распределения и изученности. Каждый из показателей (М и GST) при переходе от таблиц к картам может как уменьшаться, так и увеличиваться!
В чем причина таких разночтений? То новое, что вносит карта, связано с двумя основными факторами, действующими противоположно.
Первый фактор — большее число анализируемых точек. На карте всегда больше число промежуточных значений, чем в таблице: число узлов сетки N всегда намного больше числа исходных популяций К. Поэтому только за счёт появления множества промежуточных значений между опорными точками дисперсия (и, соответственно, GST) картографированных значений уменьшается (по сравнению с дисперсией табличных значений), а гистограмма на карте становится более плавной.
Второй фактор — неравенство популяционных ареалов — обычно сказывается противоположным образом, то есть увеличением разнообразия карты (GST). Этот фактор оказывается ведущим тогда, когда есть связь между частотой признака и площадью, занятой данным интервалом частоты. Этот фактор не только увеличивает разнообразие, но и меняет среднюю частоту признака на карте, сдвигая его в сторону значений, распространённых на большем ареале.
Например, пусть зоны с минимальными (частота равна 0) и зоны с максимальными (частота равна 1) частотами признака резко различаются по площади их ареалов. Пусть площадь зоны минимумов (Nmin) в 10 раз меньше, чем площадь зоны максимумов (Nmax):(Nmin)=10. А в таблице число изученных популяций для каждой из зон одинаково: Kmax=Kmin. Тогда из таблицы мы получим среднее значение частоты равное 0.5.
А на карте — среднее значение частоты будет близко к единице (0.91). И карты дадут более корректный результат — он учитывает географическое пространство и размер популяционных ареалов. И этот пример невыдуманный. Например, мы можем изучить множество популяций кавказских народов на небольшом пространстве Кавказских гор — и столько же популяций на бескрайних просторах Сибири. Причём изученность народов (среднее число популяций, изученных для одного народа) может быть одинаковой — просто размеры этнических ареалов резко различны на Кавказе и в Сибири. И, характеризуя изменчивость Евразии, мы не имеем права смещать её средние оценки в сторону меньшего по площади Кавказа только потому, что на этой небольшой территории проживает множество народов.
Есть и третий фактор — влияние интерполяционной процедуры. Но его воздействие на изменчивость карты неоднозначно и зависит от параметров интерполяции.
При интерполяции ортогональными полиномами нулевой степени узлы сетки могут содержать только значения частот аллеля, промежуточные между значениями в опорных точках. Например, узлы сетки, расположенные вокруг исходных популяций с частотами 0.2 и 0.6, будут нести только промежуточные значения — 0.21, 0.30, 0.40, 0.50, 0.59. Это уменьшает дисперсию (и GST) при переходе от таблиц к карте. Однако при интерполяции ортогональными полиномами первой степени картина иная. При продолжении географического тренда признака на области, не обеспеченные опорными точками, в этих областях формируются значения не промежуточные, а соответствующие продолжению тренда. Например, увеличение частоты аллеля от 0.2. до 0.6 может сопровождаться продолжением тренда в узлах сетки — частотами 0.70,0.80, 0.90. Это увеличивает дисперсию карты (GST).
Рассмотрим действие первых двух факторов в наших модельных регионах.
Действие первого фактора ярко проявляется для населения Белоруссии и Западного региона (табл. 5.1.1): разнообразие карт (GST) примерно в полтора раза меньше табличных, хотя средние частоты (М) не изменились при создании карт обоих генов (АВ0 и RH). В этих регионах различия в популяционных ареалах не очень велики, а потому и действие второго фактора сведено к минимуму. Он практически не действует и тогда, когда нет систематических различий в частоте гена между популяциями с резко различными ареалами. Именно это характерно для гена АВ0*0 в Северной Евразии (табл. 5.1.1). Поэтому картографирование гена АВ0*0 в Северной Евразии не изменило ни его среднюю частоту, ни межпопуляционное разнообразие.
Иной случай отражён на карте распределения частоты гена RH*d в Северной Евразии (табл. 5.1.1.), где большое число европейских и кавказских популяций с высокими значениями частоты гена обладает малыми ареалами, в то время как для популяций Сибири и Казахстана характерны низкие значения признака при обширных популяционных ареалах. Поскольку задача карты — представить распределение признака по всему географическому пространству, «вес» азиатских популяций при построении карты настолько выше, насколько больше их ареал. Именно это отражено и в различной форме гистограмм карты RH*d (двухвершинной для таблиц, одновершинной для карт), и в увеличении (по сравнению с табличным) разнообразия карты (GST), и в изменении среднего значения (М) в сторону сибирских величин.
Если задать вопрос: а какие значения «правильней»? То ответ будет однозначным — конечно, значения карт. Табличные значения вынужденно «забывают» о популяционных ареалах и потому игнорируют различия в них. Кроме того, европейские популяции с высокими частотами RH*d изучены намного более подробно, чем азиатские, и потому резко «перевешивали» при прямом анализе табличных данных. Возвращение к географическому пространству карт восстанавливает равновесие и справедливость.
Подобное моделирование позволило ответить на вопрос: что происходит с информацией, когда мы картографируем исходные данные? Зная ареалы и частоты, параметры интерполяции, можно предсказать, как изменятся статистические параметры признаков (средние частоты, разнообразие) при построении карты. При этом статистические показатели карты, как мы видели, более точны и справедливы.
МЕНЯЮТСЯ ЛИ ИСХОДНЫЕ ЧАСТОТЫ В
ИЗУЧЕННЫХ ПОПУЛЯЦИЯХ?
Но остался ещё один вопрос, который всегда нам задают: что происходит с исходными популяционными данными? Меняются ли при переходе от таблицы к карте частоты генов в самих изученных популяциях? Здесь ответ всегда однозначен — нет!
При любых параметрах интерполяция всегда затрагивает только промежуточные точки пространства (картографический прогноз), а сами изученные популяции (опорные точки) всегда сохраняют на карте ту частоту, которая была указана в таблице. Это одно из основных условий алгоритма построения карты. А вот последующие трансформации карты уже могут затрагивать исходные популяционные частоты, поскольку при всех последующих операциях все узлы карты равноправны — как те, которые были изучены при экспедиционном обследовании, так и узлы с интерполированными значениями. Например, при создании «сглаженных» карт для выявления трендов (основных направлений изменчивости) происходит усреднение в пределах заданного окна карты. Это помогает найти «золотую середину», когда соседние популяции из-за ошибок выборки дают разные показания, при этом значения в опорных точках немного сдвигаются в сторону среднего значения.
ЕСТЕСТВЕННЫЙ ОТБОР
Теперь зададимся иным вопросом. В какой степени карты классических маркёров могут отражать действие естественного отбора в популяциях?
Эритроциты и сыворотка крови человека содержат целый ряд белков разнообразного функционального назначения. Серия аллелей каждого локуса контролирует синтез серии вариантов белка, причём эти варианты могут различаться активностью, термостабильностью, степенью сродства к субстрату, количеством соответствующего белка в организме, различными иммунными характеристиками и другими особенностями. Поэтому география аллелей может быть вызвана — наряду с эффектами дрейфа и миграций — и действием отбора на тот или иной аллель (см. Приложение). Если действие отбора различно в разных частях ареала (дифференцирующий отбор), то разнообразие картографируемых значений возрастает. Если же действует стабилизирующий отбор
— то разные популяции становятся более похожими друг на друга, чем при селективной нейтральности, и мы видим на карте сниженное разнообразие. Однако «отделить» эффекты отбора от действия иных факторов микроэволюции — задача непростая [Алтухов, 2003; Динамика популяционных генофондов…., 2004]. Целый цикл работ [Балановская, Нурбаев, 1997, 1998а, б, в] мы посвятили технологии выявления эффектов отбора через анализ генетических различий между популяциями. Но, поскольку это большая и самостоятельная тема, то мы откладываем её рассмотрение на будущее. А в этой книге возможное действие отбора оцениваем лишь предварительно, через сравнение межпопуляционной изменчивости данного аллеля и селективно-нейтрального уровня дифференциации (см. Приложение, раздел 2).
Селективно-нейтральная изменчивость русского генофонда оценена в среднем по всем картам: GST=1.36 (44 аллелей 17 локусов, наиболее подробно изученных в русском генофонде). Карты аллелей, демонстрирующие более низкую изменчивость (GST<1.36) позволяют предположить действие стабилизирующего отбора, а более высокие межпопуляционные различия (GST>1.36) — действие дифференцирующего отбора (см. Приложение, раздел 2.; а также [Алтухов, 2003; Динамика популяционных генофондов…., 2004]).
Отвечая на вопрос «Зачем нужны карты?», мы обсуждали в § 2, насколько неравномерно изучены популяции по разным классическим маркёрам. Достаточно взглянуть на таблицу 5.2.1., чтобы убедиться, что число изученных популяций по одним генам в двадцать раз меньше, чем по другим. Конечно же, поэтому неодинаковы и «надёжные» ареалы этих генов, достигая пятикратных различий. Тогда возникает вопрос: сравнивая межпопуляционные различия GST с селективно-нейтральной GST, действительно ли мы оцениваем отбор? Не может ли так случиться, что гены, картографированные на меньшем ареале, только по этой причине будут и менее изменчивыми, то есть обладать меньшей величиной GST? А гены, детально изученные и с большим картографируемым ареалом, — обладать большей величиной GST? Чтобы разрешить это сомнение, мы рассчитали коэффициенты ранговой корреляции между изученностью и GST для 44 анализируемых карт по данным таблицы 5.2.1. Оказалось, что связи нет — корреляция между величиной межпопуляцион-ных различий GST и числом изученных популяций К равна r=0.041. А корреляция между GST и размером ареала (измеряемым в числе узлов равномерной сетки карты N) составила r=0.096. Это означает, что сравнивая межпопуляционные различия GST с селективнонейтральной GST, мы действительно оцениваем эффект отбора, а не изученность гена.
ИСТОРИЯ
Другим фактором, отражённым на картах, является история населения. Если действие отбора «индивидуально» для каждого аллеля, то история одинаково беспристрастна к любым генам. Лишь однородительские маркёры (митохондриального генома, Y хромосомы) однобоко — или только с материнской, или только с отцовской стороны — описывают историю генофонда. Но в случае с классическими маркёрами мы практически всегда имеем дело с основным массивом генов — с аутосомными генами, регистрирующими миграционные события независимо от пола мигрантов.
Разумеется, те или иные исторические миграции могут быть ярче отражены на карте какого-либо отдельного аллеля, чем генофонда в целом. К примеру, если родина «исхода» мигрантов и принявшее их автохтонное население различаются по частоте какого-то аллеля, а по остальным маркёрам неразличимы, то такая миграция может быть выявлена только с помощью карты этого единственного аллеля. Но такие случаи нечасты и, главное, неважны — такая миграция генетически не эффективна и не важна для истории генофонда в целом. Чем по большему числу генов и резче различаются генофонды — «исхода» и «новой родины» — тем больше генетическая эффективность миграции, тем больше её влияние на генофонд. Но и обнаруживаем мы тогда следы миграции на картах практически всех маркёров!
Поэтому в общем случае, когда мы ставим целью изучение истории сложения генофонда, для нас важны лишь генетически эффективные миграции, отражённые в изменчивости большинства генов. В тех частных случаях, когда генетика выступает как исторический источник для изучения истории конкретных миграций населения, карты некоторых генов, зафиксировавших эти миграции, могут оказать неоценимую помощь. Важно только очень осторожно пользоваться этим инструментом, учитывая все особенности карты и гена. Слишком часто желаемое принимается за действительное, и тогда начинает казаться, что чуть ли не каждая карта каждого гена сообщает об интересующем историческом событии. Много миграций протекло за века. И при достаточной исторической эрудиции можно на карте любого гена увидеть отражение той или иной миграции: в распоряжении истории миграций больше, чем в нашем распоряжении — хорошо изученных генов. Такие авторы не учитывают бедность фактографического материала, лежащего в основе карт, и действие других факторов микроэволюции — дрейфа генов, включая эффекты основателя, бутылочного горлышка, да и просто ошибки выборки! Нам бы хотелось уберечь читателя от искуса в каждой особенности карт видеть след той или иной исторической миграции. Не зря Теодор Иоаннович Тютчев предупреждал:
Природа — сфинкс. И тем она верней
Своим искусом губит человека,
Что, может статься, никакой от века
Загадки нет и не было у ней.
В целом, два главных фактора микроэволюции — дрейф генов (через генетически эффективный размер популяции Ne) и миграции генов (через генетически эффективные миграции Ме), — противодействуя друг другу, задают исторически устойчивый уровень межпопуляционных различий GST. Эти же факторы формируют и генетический рельеф распространения гена, те черты его географической изменчивости, которые мы видим на картах. Карта показывает нам сам генетический рельеф, а величина межпопуляционной изменчивости GST — среднюю степень «гористости», разнообразия этого рельефа.
И дрейф, и миграции, одинаково безразличны к любым генам и одинаково обращены только к истории генофонда, к истории народа. Поэтому основная наша задача — рассматривая калейдоскоп генов, найти то общее и неизменное, что есть на всех картах, что просвечивает сквозь индивидуальную биографию гена — архитектонику русского генофонда.
И ещё одно пояснение, необходимое для понимания главы. Как уже не раз говорилось, мы пользуемся двумя подходами — статистическим и картографическим. И если важнейшая для нас картографическая методология описана во многих местах книги, то скажем, наконец, несколько слов и о нашем статистическом подходе. В его основе лежит концепция иерархических популяционных систем (см. Приложение). Её можно назвать и попроще: концепция «матрёшек». Это означает, что всё человечество мы рассматриваем как систему популяций, вложенных одна в другую — меньшая в большую: локальные популяции — вложены в этносы, этносы — в регионы, регионы — в ойкумену. Может быть и множество «матрёшек» промежуточного размера. Это неважно. Здесь главное — иерархичное устройство популяций, то есть важна сама возможность вложить одну «матрёшку» в другую.
ПОПУЛЯЦИИ КАК «МАТРЁШКИ»
ЛОКАЛЬНАЯ ПОПУЛЯЦИЯ (или просто «популяция») — это самый нижний уровень. Обычно к ней относят население какого-либо конкретного небольшого района, чаще всего это небольшая группа селений, тесно переплетённых взаимными браками, или даже один населённый пункт. Для такой популяции обычно сложно или не имеет смысла выделять более мелкие субпопуляции[30]. Популяционные выборки — то есть те данные о генофонде, которые появляются в научных статьях — чаще всего относятся именно к локальным популяциям.
ЭТНИЧЕСКИЙ УРОВЕНЬ. Все локальные популяции данного народа в совокупности образуют этническую популяцию. Этнический уровень определить всё же проще других — благодаря этническому самосознанию членов этноса. Люди обычно сами говорят, к какому этносу их следует относить.
УРОВЕНЬ РЕГИОНОВ. Если этнический уровень объективно задан (хотя и бывают сложности с различением этносов и субэтносов), то выделение регионов целиком подвластно произволу (таланту, научной интуиции) исследователя. Мы обычно выделяем девять основных регионов мира (табл. 4.4. Приложения). А в пределах регионов выделяем субрегионы разных уровней. Например, в регионе Северной Евразии можно выделить пять субрегионов — Восточную Европу, Урал, Кавказ, Среднюю Азию, Сибирь (глава 8). Далее в пределах Сибири — Западную Сибирь, Среднюю Сибирь, Восточную Сибирь (см. Приложение, рис. 4.2.).
Нередко популяции регионального уровня мы выделяем и чуть иначе — не чисто географически, а комбинируя географическую и лингвистическую классификации. Например, в главе 8 в пределах субрегиона «Восточная Европа» мы выделяем «индоевропейские народы Восточной Европы», «алтаеязычные народы Восточной Европы» и «уралоязычные народы Восточной Европы». В данном случае уровень лингвистических семей встраивается между этническим и региональным уровнями.
ОЙКУМЕНА — это уже самый высокий уровень для популяций человека. Человечество представляет единый вид и является той самой большой «матрёшкой», в которую вложены все остальные.
Если мы освоимся с таким представлением о популяциях человека, то при виде любой генетической характеристики (например, частоты гена) у нас сразу будет возникать вопрос — к популяции какого уровня она относится? Насколько опасны ошибки со смещением популяционного уровня или смешением разных «матрёшек», рассказано, например, в Приложении (раздел 4.).
Но сейчас нас занимает более практичный вопрос. Как же нам описать генетические характеристики популяционной системы? Какие инструменты для этого нужны? Для самого простого описания достаточно элементарных понятий статистики — средней величины и дисперсии.
СРЕДНЯЯ ЧАСТОТА
Чтобы узнать этническую частоту гена, нужно просто усреднить все частоты в локальных популяциях этого этноса.
Предположим, что имеются данные по частоте какого-то гена q в пяти украинских популяциях: Староконстантиновского района Хмельницкой области (частота аллеля составляет q=0.1), г. Стрый Львовской области (частота q=0.2), Ивано-Франковская область (q=0.1), Полтавская область (q=0.3) и Черкасская область (q=0.3). Тогда частота у «украинцев вообще» — этническая частота — составит q=(0.1+0.2+0.1+0.3+0.3)/5=0.2. Именно эта среднеэтническая частота q=0.2 и будет характеризовать украинский народ — популяцию этнического уровня. И мы можем на время «забыть» о частотах в локальных популяциях и оперировать в дальнейших рассуждениях этнической частотой.
ДИСПЕРСИЯ
Но для полноты картины среднюю величину, как известно, желательно дополнить и дисперсией, которая покажет, как далеко частоты в локальных популяциях уклоняются от своей средней. В популяционной генетике рассчитывают не обычную «статистическую» дисперсию, а родственный ей «генетический» показатель межпопуляционной изменчивости (чаще всего GST или FST). Формулы расчёта приведены в Приложении.
Эта величина и будет представлять межпопуляционные различия. На нее же можно посмотреть и с другой стороны и назвать её с приставкой не «меж», а «внутри». Действительно, эта величина характеризует различия популяций внутри этноса. И так всегда у «матрёшек» — изменчивость между популяциями нижнего уровня одновременно характеризует изменчивость внутри популяции более высокого уровня (что, конечно же, самоочевидно).
Итак, при переходе от локального уровня к этническому нам нужно рассчитать две величины — среднюю частоту q и межпопуляционную изменчивость (внутриэтническую изменчивость, гетерогенность этноса) GST.
ВАРИАЦИОННЫЙ РАЗМАХ
Добавим, что иногда бывает полезен и третий показатель — вариационный размах (разность между максимальной и минимальной частотой). По смыслу он близок к дисперсии, поскольку отвечает на тот же вопрос: как сильно локальные популяции различаются между собой?
ОТ МЕНЬШЕЙ МАТРЁШКИ — К БОЛЬШЕЙ: РАСЧЕТ СРЕДНЕЙ ЧАСТОТЫ
Итак, получены характеристики этнической популяции. Как же теперь перейти от этносов на следующий уровень — регионов? И как описать региональную популяцию — например, Восточной Европы? Нам опять нужны все те же две величины — средняя частота и межпопуляционная изменчивость. Применительно к региональной популяции — мы должны рассчитать среднерегиональную частоту (как среднюю по всем этносам данного региона) и внутрирегиональную изменчивость (между этносами данного региона).
Например, для Восточной Европы, кроме украинцев, у нас есть данные по двум популяциям литовцев (литовцы-аукшайты с частотой q=0.6 и литовцы-жемяйты с частотой q=0.4) и по двум популяциям тундровых ненцев Восточной Европы (частоты q=0.6 и q=0.8). Очевидно, что этническая частота для литовцев составляет q=0.5, а для ненцев q=0.7. Следовательно, чтобы получить среднерегиональную частоту, нам нужно усреднить все три этнические частоты — у украинцев, литовцев и ненцев. Эта региональная частота составит q=(украинская этническая частота + литовская + ненецкая)/3=(0.2+0.5+0.7)/3=0.47.
Но тут обычно рождается вопрос. Мы сказали, что для расчёта региональной частоты нужно усреднить этнические частоты. Но разве нельзя усреднить частоты в локальных популяциях? Разве нельзя получить среднюю частоту региона Восточная Европа как среднюю частоту по всем изученным локальным популяциям этого региона? Рассчитаем её: суммируем 0.1 (Хмельницкая область) + 0.2 (Львовская) + 0.1 (Ивано-Франковская) + 0.3 (Полтавская) + 0.3 (Черкасская) + 0.6 (аукшайты) + 0.4 (жемяйты) + 0.6 (ненцы) + 0.8 (ненцы) и разделим на число популяций (9). Мы видим, что полученная величина — частота 0.38 — заметно отличается от первой оценки (0.47). Какая же оценка правильней? Конечно же, первая — рассчитанная по этническим частотам. Почему?
Подробно этот вопрос разбирается в Приложении (раздел 4). Но и без специальных пояснений в нашем простом примере читатель легко заметит, что при втором способе расчёта (по локальным популяциям) восточно-европейская частота приблизилась к украинской — и только лишь потому, что по украинцам у нас больше изученных популяций. Мы не можем избежать неравномерности изученности разных народов — кому-то из них повезло больше, кому-то — нет. Но, рассчитывая региональные частоты не из частот в локальных популяциях, а из этнических частот, мы можем ослабить влияние этой неравномерности.
Итак, рассчитывая среднюю частоту на каждом последующем уровне, мы усредняем частоты в популяциях предыдущего уровня. Средняя частота по Восточной Европе — это средняя по этническим частотам (а не по локальным популяциям), средняя по Северной Евразии — это средняя по региональным частотам (а не по этническим) и так далее.
ОТ МЕНЬШЕЙ МАТРЁШКИ — К БОЛЬШЕЙ: РАСЧЕТ ДИСПЕРСИИ
Для региона мы также должны рассчитать не только среднюю, но и показатель межпопуляционной изменчивости. И тут мы сталкиваемся с чрезвычайно полезным аддитивным свойством GST: изменчивость, рассчитанную для разных уровней, можно суммировать! Рассмотрим получившуюся систему.
В нашем примере Восточная Европа состоит из украинцев, литовцев и ненцев. Но украинцы, в свою очередь, состоят из пяти популяций, со своей величиной внутри-украинской изменчивости между этими пятью популяциями; литовцы состоят из двух популяций, со своей внутри-литовской изменчивостью, ненцы состоят из двух популяций, со своей внутри-ненецкой изменчивостью. Усреднив эти три показателя внутриэтнической изменчивости, мы получим среднюю величину изменчивости — внутри «среднего» восточноевропейского народа. Теперь суммируем эту величину (изменчивость на внутриэтническом уровне) и изменчивость межэтническую (между средними частотами у украинцев, литовцев, и ненцев) и получим общую изменчивость Восточной Европы.
Важно лишь всегда отслеживать, по каким частотам рассчитана изменчивость региона. И если она рассчитана по этническим частотам, то необходимо понимать, что мы имеем лишь часть (межэтническую часть) региональной изменчивости (Приложение, раздел 4.). Чтобы узнать величину всей региональной изменчивости, нам нужно приплюсовать средний уровень внутриэтнической изменчивости (либо, как описывается ниже, пересчитать региональную изменчивость по популяционным, а не этническим частотам).
ЕСЛИ НАРОД ИЗУЧЕН ТОЛЬКО ПО ОДНОЙ ПОПУЛЯЦИИ
В нашем примере у нас было по несколько изученных популяций на каждый народ. Но бывает, что таких подробных данных нет. Допустим, в дополнение к имеющимся, появились данные по одной популяции удмуртов (частота q=0.6). Тогда среднеэтническая для удмуртов, очевидно, останется той же — 0.6. Но как быть с дисперсией? Формально, мы должны приписать удмуртам нулевую внутриэтническую изменчивость. Хотя понятно, что как только появятся данные по ещё одной популяции удмуртов, у них появится ненулевая внутриэтническая изменчивость (обнаружатся генетические различия между этими популяциями). Но пока таких данных нет, изменчивость удмуртов остается «условно-нулевой», и если мы теперь учтем удмуртов при расчёте средней внутриэтнической изменчивости, мы занизим эту величину за счёт «условно-нулевых» удмуртов. И если в наших данных многие народы будут изучены лишь по одной популяции, эта особенность данных сильно исказит результат. Поэтому мы пользуемся правилом — популяции, представленные единственной субпопуляцией, не учитываются при анализе GST.
ПРЫГАЯ ЧЕРЕЗ ОДНУ «МАТРЁШКУ»
Повторимся, что величину изменчивости в пределах Восточной Европы мы получили сложением изменчивости между этническими частотами и изменчивости между локальными популяциями внутри этносов. Но разве не могли мы её получить более прямым способом — рассчитав изменчивость между всеми локальными популяциями, не обращая внимания на этническую принадлежность этих популяций? Могли бы, и получили бы примерно ту же величину GST. Именно в этом и состоит одно из преимуществ GST статистики — общая изменчивость многоуровневой системы складывается из изменчивости на всех её уровнях (свойство аддитивности). Если же мы проигнорируем все промежуточные уровни и рассчитаем изменчивость среди локальных популяций («прыгая» через уровень), то получим ту же самую величину.
Отметим, что для совпадения оценок изменчивости, полученными двумя методами (последовательным иерархическим и «прыгая» через уровень), нужно пользоваться «правильными» средними частотами. Например, изменчивость локальных популяций Восточной Европы должна рассчитываться не относительно средней частоты в этих девяти популяциях, а относительно средней между тремя этническими частотами. Это необходимо для того, чтобы избежать влияния неравной изученности народов или регионов — для того, чтобы наиболее изученные народы не «перетягивали одеяло» на себя. Мы уже упоминали об этой сложности при расчёте региональных частот — для большей «матрёшки» брать частоты у «матрёшки» поменьше. Итак, даже прыгая через «матрёшку», для расчёта «правильной» изменчивости надо всё равно использовать частоты пропущенной «матрёшки». Надо всегда брать частоты у популяций предыдущего уровня (этнические частоты — при расчёте субрегиональной средней, субрегиональные частоты — при расчёте региональной средней, и так далее).
ЗАЧЕМ ВСЁ ЭТО ЗДЕСЬ НУЖНО?
Потому что иначе нельзя описать изменчивость русского народа среди его соседей по Евразии. Мы вкратце описали общие свойства иерархических популяционных систем (подробнее см. Приложение). Человечество действительно представляет собой такую популяционную систему, и чтобы ориентироваться в его генетической изменчивости, очень полезно освоиться с такой терминологией и таким способом мышления. Локальные популяции — и этнические. Этнические — и региональные. Далее регионы могут вкладываться в макрорегионы, а те — в ойкумену. На каждом уровне мы рассчитываем среднюю частоту и «дисперсию» — меж-популяционную изменчивость. В таких терминах мы и описываем изменчивость русского народа по каждому гену.
Причём часто полезно бывает сравнить этническую частоту гена у русских с региональными частотами для Урала, Кавказа, Сибири… Или частоту в локальной русской популяции — с этническими частотами соседних марийцев, татар, украинцев… Надо только при этом помнить, что чем больше «матрёшка», тем устойчивее её частота (если, конечно, её определили не по одной первой попавшейся популяции). Например, частота в меньшей «матрёшке», скорее всего, изменится сильнее, чем в большой, если мы проведём их повторные генетические обследования.
Но когда мы сравниваем не просто средние частоты, а их диапазон, то здесь забывать о ранге «матрёшек» уже никак нельзя! Например, нам приходится сравнивать диапазон частот в русских популяциях с диапазоном частот в Северной Евразии. Здесь нас подстерегает одна из сложностей, о которых мы предупреждали выше — диапазон частот между локальными русскими популяциями может парадоксальным образом оказаться больше «евразийского», то есть изменчивость части — больше изменчивости целого. И это потому, что оценка «евразийского» диапазона частот будет точнее, если взять этнические частоты — они более устойчивы. Если же мы включим в анализ все известные локальные популяции Евразии (со всеми ошибками их выборок), то «евразийская» изменчивость мгновенно перерастёт «русскую», и парадокс благополучно разрешится.
Когда же все вычисления закончены, мы получаем систему таблиц, в которой в сжатом, логичном и удобном для использования виде представлены основные параметры изменчивости генов. И в этих данных уже нетрудно увидеть и закономерности — что было бы невозможно, имей мы лишь бесконечный перечень частот в локальных популяциях.
Мы надеемся, эти объяснения помогут читателю легко ориентироваться в дальнейшем изложении. При описании изменчивости отдельных генов мы постоянно будем оперировать региональными и этническими частотами, величинами внутриэтнической и межэтнической изменчивости. Сравнение этих показателей оказывается чрезвычайно полезным инструментом, описывающим изменчивость конкретного гена в русских популяциях и показывающим степень изменчивости разных генофондов.
Источники информации и маршрут — Прогулка по «матрёшкам» — Карта — Сравнение с соседями — Гипотезы отбора и истории
§ 1. Биохимические маркёры. HP: Широтная изменчивость — GC: Широтная на глобусе, но не на русской карте — PI: Долготная в Евразии и в русском генофонде (Р1*М2) — Аномалии вне «исконного» ареала — TF: Разный отбор на разные аллели? — Мозаика в Европе — Широтные волны в русском ареале (TF*C2) — ACP1: ACP1*А возрастает к юго-востоку — Но частоты у юго-восточных соседей снижены! — PGM1: Долготная изменчивость в Евразии — Мозаика в русском ареале — ESD: Широтные волны — Незаметно влияние соседей — GLO1: Убывает к периферии русского ареала — Но у соседей обратные тренды! — 6PGD: Сниженная изменчивость
§ 2. Группы крови. MN: «Матрёшки» мира — «Матрёшки» Северной Евразии — Гомогенность Восточной Европы — Снижение у русских Мезени — RH*d: Евразийская карта — Долготная изменчивость в Европе — Мозаика в русском ареале — За деревьями исчезает лес — АВ0: Евразийские карты — «А» убывает на восток — «В» убывает на запад — «О» убывает к середине — Русские карты — «А» убывает на северо-восток — Лоскутное одеяло «В» — «О» убывает на юго-запад — Русский Север — Противоречия по MN и АВ0 — Глобальная закономерность не обязывает этносы к её исполнению — Этнос в своем ареале может её отменить!
§ 3. Риск несовместимости матери и плода по группам крови: Несовместимость по Резус-фактору — Несовместимость по АВ0 — Учет обеих систем — Сто пятнадцать промежуточных карт — Итоговая карта риска — Отличия генетического риска от реальной заболеваемости
§ 4. Обзор «простых» карт: Четкие закономерности для нескольких генов — Сложная география многих генов — Или вовсе мозаика — Окраинные аномалии необязательно связаны с соседями — Принцип «матрёшки»
Напомним ещё раз, что география отдельных генов — не самоцель нашей книги. Карты отдельных генов, рассматриваемые в этом разделе, нужны нам лишь для того, чтобы представлять, сколь велико реальное разнообразие генетических рельефов, свернувшееся потом в генетический ландшафт обобщённой карты генофонда. Но и без «простых» карт разных генов обойтись никак нельзя. Без внимательного рассмотрения карт отдельных аллелей представление о пространственной изменчивости генофонда неизбежно страдает излишней абстрактностью, а порой приводит к переоценке универсальности выявленных закономерностей.
ИСТОЧНИКИ ИНФОРМАЦИИ
В этом разделе мы детально рассмотрим изменчивость каждого из классических маркёров в русских популяциях.
Источником информации послужил банк данных «Русский генофонд» (Приложение, раздел 5). Частоты аллелей и оценки межпопуляционных различий GST для популяций русского народа, для пяти регионов Северной Евразии и для девяти регионов мира приведены в Приложении (раздел 6) и на сайте www.genofond.ru.
Но главным источником информации для нас служат не сами частоты аллелей в русских популяциях, а основанные на них карты (рис. 5.2.1–5.2.22). Карты выявят географию каждого из маркёров, покажут, каковы закономерности его изменчивости в русском ареале. К таблицам же, содержащим частоты генов в русских популяциях, мы будем изредка обращаться лишь затем, чтобы уточнить, что представляет собой популяция, заинтересовавшая нас на карте. Например, если популяция резко отличается от соседей, то стоит проверить, не вызвано ли такое отличие просто малым объёмом её выборки?
Другим источником информации служат результаты статистического анализа карт. Они сведены в таблице 5.2.1. К ним относится, во-первых, GST — степень изменчивости частоты аллеля, рассчитанная по карте. Эту степень изменчивости данного маркёра мы будем сравнивать со средним уровнем изменчивости, рассчитанным по картам всех классических маркёров (GST=1.36). Во-вторых, статистический анализ карт даёт нам частные корреляции частоты аллеля с долготой, широтой и множественный коэффициент корреляции с географическими координатами (табл. 5.2.1). Они рассчитаны по специальным корреляционным картам (см. Приложение), а в таблице указаны среднее, минимальное и максимальное значения коэффициен- еся на картах. Величина дисперсии не приводится, потов корреляции на такой карте. В-третьих, приведены скольку приведён близкий по смыслу показатель GST. и основные статистические показатели: минимальная, средняя и максимальная частоты аллеля, встречающи-
Таблица 5.2.1.
Характеристики пространственной изменчивости наиболее изученных классических генных маркёров
Обозначения: К — число изученных популяций;
N — число узлов сетки в картируемом ареале (с высокой надёжностью прогноза);
MIN, MAX, MEAN — соответственно минимальное, максимальное и среднее значения частоты аллеля или его корреляции с географическими координатами местности;
GST — межпопуляционная изменчивость; HS — вклад данного аллеля в общую гетерозиготность локуса.
Напомним только, что GST рассчитан специально для аллеля. Расчёт для полиаллельного локуса (для двуаллельного локуса он остается таким же) приведён в Приложении, а сами значения GST локуса даны в описании соответствующих карт. В таблице 5.2.1. и показатели гетерозиготности HS приведены своеобразно — показан «вклад» каждого аллеля в гетерозиготность локуса. Для расчёта «правильной» гетерозиготности локуса надо просто сложить аллельные оценки HS.
Наконец, есть и третий источник информации, которым мы будем пользоваться. Это частоты классических маркёров у соседних народов или в соседних регионах. Источником этих сведений служит банк данных «GENEPOOL» (.Приложение, раздел 5), в разделе 6 Приложения приведены средние частоты генов и разнообразие GST для пяти регионов Северной Евразии[31].
Таким образом, мы приводим практически всю исходную информацию и результаты анализа: исходные данные (,Приложение, раздел 6) и результаты анализа на сайте и в табл. 5.2.1., карты на рис. 5.2.1.-5.2.22. Поэтому читатель находится в равных условиях с авторами, располагая той же информацией. И все описания изменчивости классических маркёров, то есть всё последующее изложение в этом разделе 5.2., читатель может проверить, переосмыслить… или переписать иначе.
«МАРШРУТ» РАССМОТРЕНИЯ КАРТ
В описании каждой карты мы старались следовать определенному плану.
1) СПРАВКА. В начале каждого подраздела приводится очень краткая справка о данном гене: его функция, географическое распространение в глобальном масштабе. Эта информация взята главным образом из монографии [Генофонд и геногеография…], при подготовке которой в 1986–1994 годах (с деятельным участием одного из авторов), было учтено и компилировано всё множество доступных на тот момент источников информации по классическим маркёрам.
2) ИЗМЕНЧИВОСТЬ. Описание каждого гена начинается со сведений о размахе его изменчивости. Мы старались следовать принципу «матрёшек» — постепенно доставая из больших «матрёшек» содержащиеся в них всё более дробные регионы. В самых подробных описаниях мы начинали с размаха изменчивости в ойкумене, затем переходили к регионам Евразии, затем рассматривался размах изменчивости между субрегионами Северной Евразии, то есть бывшего СССР, далее — различия между народами Восточной Европы, а завершался маршрут самой маленькой матрёшкой: рассмотрением изменчивости между разными русскими популяциями.
Обратим внимание на важный момент, который может вызвать недоумение. Порой различия между русскими популяциями достигают различий между регионами Евразии. Нет ли здесь ошибки? Нет. Просто надо давать себе всегда отчет, о каких частотах сейчас идет речь — усреднённых (региональных или этнических) или локальных (популяционных). Все региональные частоты и практически все этнические частоты представляют собой усреднённые величины. Например, частота какого-либо аллеля в Сибири представляет собой среднюю по всем изученным сибирским народам. Частота у коми — среднюю по всем изученным популяциям коми. При этом если частота в лишь какой-то одной популяции этноса была необычно высокой или низкой — на средней частоте аллеля в этносе это практически не скажется. И поэтому размах изменчивости между регионами — это различия между устойчивыми, усреднёнными региональными оценками. Для русских же популяций мы приводим размах изменчивости между локальными популяциями. И за счёт отклонений частоты всего в одной лишь популяции размах может стать большим.
3) КАРТА. Главная часть в любом описании — это рассмотрение карты. Сначала мы пытаемся сформулировать первое впечатление от карты — степень сложности рельефа и характер тренда. Затем переходим к деталям и отклонениям от основного увиденного тренда. Смотрим, каковы коэффициенты корреляции с географическими координатами, можно ли описать изменчивость гена в терминах «широтной» или «долготной» изменчивости. Чтобы оценить соответствие карты аллеля генетическому ландшафту всего генофонда, мы приводим и коэффициенты корреляции между данной картой и картами трёх главных компонент. В табл. 5.3.3. перечислены аллели, которые внесли наибольший вклад в главные сценарии генофонда — с коэффициентом корреляции выше 0.4.
4) ЧТО У СОСЕДЕЙ? А что происходит вокруг русского ареала? Эти данные мы берём уже не из карты, а из таблиц. Следует ли изменчивость в русском ареале более общим закономерностям, известным для данного аллеля? В частности, как варьирует частота аллеля у ближайших соседей — других восточноевропейских народов? Если на границе русского ареала частота начинает меняться, то какова частота у соседнего народа? Такое сравнение показывает, может ли это изменение генофонда в окраинных русских популяциях объясняться смешением с соседними народами.
5) ОТБОР. Каков уровень GST для данного аллеля, и как он соотносится со средним уровнем? Может быть, изменчивость данного аллеля сформирована под действием естественного отбора? Если отклонение от среднего уровня велико, то можно предположить действие стабилизирующего или же дифференцирующего отбора.
6) ГИПОТЕЗЫ. Какие ещё особенности видны на карте? Можно ли сформулировать гипотезу, объясняющую обнаруженный геногеографический рельеф? Как правило, нелегко дать объективную интерпретацию карты в терминах истории народа. Для этого необходим особый анализ, специальный инструментарий, совместная работа со специалистами в смежных областях — историками, археологами, этнографами, антропологами. Ассоциативное мышление здесь может сыграть злую шутку — чем оно богаче, чем больше мы знаем об этногенезе и этнической истории данного народа, тем проще любую особенность карты истолковать как древние или недавние миграции, следы прошедших племён и событий. Поэтому те немногие исторические экскурсы, которые мы включили в описания карт, следует рассматривать лишь как одну из множества гипотез.
Этому плану — с теми или иными разумными отклонениями — мы следуем при описании каждого гена. И надеемся дать хотя и краткий, но достаточно объективный обзор его изменчивости.
В конце концов, география отдельных генов — это непосредственная реальность, конкретное воплощение генофонда. Так рассмотрим же её со всем вниманием, ген за геном. И только уже после этого перейдём к самой структуре генофонда — той скрытой от непосредственного наблюдения реальности, которая формирует свои отдельные воплощения, а сама слеплена историей популяции. Её мы попробуем выявить в разделе 5.3., завершающем главу.
Рис. 5.2.1. Карта распределения аллеля НР*1 в русских популяциях.
Сначала мы расскажем о ферментах сыворотки крови (HP, GC, PI, TF), а затем перейдем к эритроцитарным биохимическим маркёрам (ACP1, PGM1, ESD, GLO1, 6PGD).
«Биохимическими» эти маркёры называются по методу их определения: ферменты (обычно крови) опознаются биохимическими методами, такими как электрофорез и изоэлектрофокусирование. Упрощённо говоря, это выглядит так: на дорожке геля между катодом и анодом «разгоняется» специально подготовленный образец крови. Легкие молекулы бегут быстрее и обгоняют более тяжёлые молекулы. В результате мы своими глазами видим, какой генотип у данного человека (ведь в биохимических локусах нет доминирования одного аллеля над другим). Например, если у него гетерозигота по данному локусу, — мы увидим сразу две полоски на геле: одну для более «быстрого» аллеля (полученного им от одного из родителей), а вторую полоску для более «тяжелого» аллеля (полученного им от второго родителя). У гомозигот, получивших от обоих родителей одинаковые аллели, мы увидим, конечно, лишь одну полоску. Но, сравнив её с «образцовой» матрицей, где примерно показано, как быстро должны «бегать» какие аллели, мы можем определить, какой именно аллель данного локуса имеется у данного человека.
Белок гаптоглобин играет важную роль в обмене гемоглобина. Полагают, что одна из функций гаптоглобина состоит именно в снижении потери организмом железа. Отмечены незначительные различия в физиологических свойствах разных типов гаптоглобина [Спицын, 1985].
Относится к группе генетико-биохимических маркёров (ферменты сыворотки крови).
АРЕАЛ РУССКОГО ГЕНОФОНДА
Полиморфизм системы гаптоглобина изучен в русском населении довольно подробно — карта распространения аллеля НР*1 основана на данных о 51 русской популяции (рис. 5.2.1). В среднем же, карты 17 наиболее полно изученных классических маркёров основаны на данных о 35 русских популяциях. Частота аллеля НР*1 в «исконном» русском ареале варьирует значительно: от 0.17 в верховьях Северной Двины и Мезени до 0.51 на юго-западе русского ареала. Столь огромный размах изменчивости в русских популяциях почти достигает пределов вариации во всем народонаселении Северной Евразии — от коряков до украинцев (0.10 Средняя частота в русском генофонде (q=0.37) практически совпала с её уровнем в Западной Европе (q=0.36). Средняя гетерозиготность локуса (HS=0.46) близка к максимально возможному значению для двухаллельного локуса (HS=0.50). Межпопуляционное разнообразие карты (GST=1.68) несколько выше среднего уровня дифференциации в русском генофонде (GST=1.36)[32]. Таким образом, при общем рассмотрении вариации НР*1 в русском генофонде на первый план выходит типичность этого аллеля, его хорошая изученность и огромная изменчивость в русском ареале, что обязывает к внимательному рассмотрению геногеографии НР*1. Карта НР*1 (рис. 5.2.1.) выявляет изменчивость в русских популяциях, близкую к клинальной. Основной вектор изменчивости: падение частоты аллеля в направлении «юго-запад<=>северо-восток» с заметным преобладанием широтной изменчивости над долготной. Этот вектор отражён и в коэффициентах корреляции с географическими координатами (табл. 5.2.1): с широтой r=0.42[33], с долготой r=0.34. Причём в отдельных областях карты тот или другой коэффициент связи превышает уровень r=0.8 (табл. 5.2.1), указывая на преобладание широтной изменчивости (в Причерноморье, на Русском Севере) или же на преобладание долготной изменчивости (например, в Поволжье). ГИПОТЕЗЫ В целом, основной вектор всей карты НР*1 («юго-запад<=>северо-восток») позволяет выдвигать две равноправных гипотезы о природе такой изменчивости. Первая гипотеза — «историческая». Она предполагает, что в геногеографическом рельефе этого гена нашли отражение миграции южных европеоидов на Русскую равнину и диффузия генов, связанная с демографическим давлением из районов с более высокой плотностью населения. Вторая гипотеза — «экологическая» — предполагает прямое влияние климатических факторов. Известно, что максимальные частоты НР*1 характерны для тропического пояса, тогда как в направлении более высоких широт частота аллеля в целом уменьшается. Для выбора между этими гипотезами, или же для выдвижения комплексной гипотезы, учитывающей взаимодействие исторических и экологических факторов, нужны специальные картографические исследования и аргументы. ЛАНДШАФТ СЕВЕРНОЙ ЕВРАЗИИ В связи с этим отметим, что падение частот НР*1 с юго-запада на северо-восток является основным вектором и для всего генофонда Восточной Европы. При средней региональной частоте Восточной Европы q=0.38, наибольшая концентрация НР*1 характерна для восточных славян, населяющих преимущественно юго-западные области (для украинцев в среднем q=0.47, белорусов q=0.44), наименьшая — для финноязычных народов северо-востока Европы — удмуртов, мари и коми-зырян (в среднем 0.31 РУССКИЙ СЕВЕР Чрезвычайно любопытно нарушение основного вектора на самом севере русского ареала (рис. 5.2.1). К северу от широкой зоны низких частот, включающей ядро минимальных значений НР*1 в бассейне Северной Двины и верховьях Мезени (q<0.26), частота вновь возрастает до среднерусского уровня (q=0.36). Эта локальная «арктическая» зона относительно повышенной частоты НР*1 расположена на побережье Баренцева моря, в низовьях Мезени и Печоры. В целом «арктическая» зона соответствует миграциям древнего новгородского населения, торговому пути в Мангазею и ареалу расселения поморов. Считается, что население этой территории сформировано преимущественно потомками новгородцев, а население более континентальных районов Русского Севера (в среднем и верхнем течении северных рек) сформировалось, главным образом, за счёт миграций из Ростово-Суздальской, а не Новгородской Руси. К сожалению, система гаптогло-бина не позволяет дифференцировать новгородский и ростово-суздальский («низовой») миграционные потоки, поскольку сами новгородские и ростовские земли мало различаются по частотам НР*1. Сравнение с общей картиной северо-евразийского ландшафта НР*1 показывает, что повышение частоты в самых северных русских популяциях трудно связать с влиянием «субстратного» населения — поскольку в целом для коренного (дославянского) населения циркумполярной зоны характерны низкие частоты НР*1 (см. карты в работе [Балановская, Нурбаев, 1995]). Русские колонисты осваивали побережье интенсивнее, чем континентальные районы. Потому низкие частоты, выявленные в русских популяциях верховьев Северной Двины и Мезени, можно связать с большим участием «субстрата» (финно-угорских или самодийских племён) в формировании русского населения континентальных районов. Подобная трактовка изменчивости НР*1 на Русском Севере имеет ранг лишь предварительной гипотезы, и для корректных выводов необходимо более полное обследование ряда популяций. ИТОГ Итак, основная закономерность для НР*1 в русском населении — изменчивость, близкая к клинальной: с максимумом на юге и снижением частоты к северо-востоку. Общие закономерности ландшафта аллеля НР*1 в русском населении (включая отличия «арктической зоны») хорошо согласуются с первыми главными компонентами русского генофонда в целом: коэффициенты корреляции со всеми тремя первыми главными компонентами изменчивости классических маркёров варьируют в пределах 0.4 Предполагается, что основная функция группоспецифического компонента GC — связывание и транспорт витамина D3 и его метаболитов. Выделяются два основных аллеля GC*1 и GC*2, причём аллель с большей электрофоретической подвижностью подразделяется на два варианта — GC*1S и GC*1F [Генофонд и геногеография…, 2000]. Локус GC, локализованный на длинном плече 4-й хромосомы в районе сегментов q11-q12, тесно сцеплен с локусом сывороточного альбумина. Есть указания, что некоторые различия в способности аллелей GC связывать витамин D приводят к их корреляции с факторами экологии и климата (тип питания, широта местности, высота над уровнем моря, интенсивность солнечной радиации, среднегодовая температура) [Спицын, 1985]. При этом частота аллеля GC*1 максимальна в наиболее тёмнопигментиро-ванных экваториальных группах населения, а в регионах с относительно низкой солнечной радиацией повышается частота GC*2. Рис. 5.2.2. Карта распределения аллеля GC*2 в русских популяциях. Рис. 5.2.3. Карта распределения аллеля GC*1S в русских популяциях. Относится к группе генетико-биохимических маркёров (ферменты сыворотки крови). ЛАНДШАФТ ЕВРАЗИИ При сравнении населения основных регионов мира максимум частот GC*2 (q=0.28) и GC*1S (q=0.58) приходится на популяции Европы. Для Восточной Европы (без Приуралья и Северного Кавказа) частота GC*2 составила в среднем q=0.31, слабо варьируя от q=0.27 у литовцев до q=0.33 у молдаван и украинцев. На Урале наблюдается общее понижение частоты аллеля GC*2, составляя в среднем q=0.26. Средняя частота аллеля у уральских народов — башкир, чувашей, удмуртов, мари, коми, тундровых ненцев — также варьирует в узких пределах: от 0.25 до 0.28. Исключение составляют коми-пермяки, но они представлены лишь одной популяцией с частотой 0.38. В Зауралье у манси частота GC*2 понижается до q=0.19. Среднерусские частоты аллелей GC*2 (q=0.29 с вариацией от 0.14 до 0.38) и GC*1S (q=0.57 с вариацией от 0.48 до 0.68) — совпадают с размахом изменчивости, характерным для населения всей Европы. Иными словами, частоты этих аллелей в русских популяциях отличаются друг от друга столь же существенно, как среднеэтнические частоты у народов всей Европы — от Скандинавии до Испании! Для Северной Евразии в целом изменчивость GC намного выше, чем в Европе: частоты аллеля GC*2 варьируют от 0.05 до 0.77. Межпопуляционное разнообразие GC*2 (GST=0.90) и GC*1S (GST=114) несколько ниже среднего для русского генофонда по всем классическим локусам уровня (GST=1.36), что может указывать на незначительное давление стабилизирующего отбора. Гетерозиготность локуса GC составила HS=0.57 (табл. 5.2.1). АРЕАЛ РУССКОГО ГЕНОФОНДА Рассмотрим на этом евразийском фоне карты географической изменчивости аллелей GC*2 (рис. 5.2.2.) и GC*1S (рис. 5.2.3), основанные на информации по 22 русским популяциям (К=22). Генетический рельеф карт довольно сложен. Во многом они являются зеркальным отражением друг друга — ранговый коэффициент корреляции между картами составил r=- 0.57. Однако для карты GC*2 (рис. 5.2.2) наиболее характерным элементом является долготный «разлом» (пояс минимальных частот), следующий примерно по 40° долготы. Для карты GC*1S (рис. 5.2.3) наиболее характерна широтная изменчивость с повышением концентрации аллеля к югу от 55° параллели. При этом средняя корреляция частот обеих карт с долготой близка к нулю, а корреляция с широтой для аллеля GC*1S составила r=0.30, достигая в отдельных районах r=0.85 (табл. 5.2.1). Самыми загадочными являются присутствующие на обеих картах диаметральные различия в частотах между соседними популяциями Вологодской области — бассейнов Онеги (GC*2, q=0.17) и Сухоны (две популяции с частотами GC*2 q=0.36 и q=0.37). Отражают ли они реальные различия между генофондами этих популяций или же обусловлены выборочными эффектами (выборки составили 61, 64 и 163 индивида, соответственно), это покажут лишь дальнейшие генетические исследования Русского Севера. Рис. 5.2.4. Карта распределения аллеля Р1*М2 в русских популяциях. ИТОГ Таким образом, панойкуменный тренд (возрастание GC*2 к северу) не прослеживается в русском генофонде. Однако это предварительное заключение полностью зависит от достоверности низкой частоты этого аллеля на Онеге — если резкое понижение частоты GC*2 до 0.17 (и, соответственно, повышение частоты GC*1S) окажется случайностью и не подтвердится при дальнейших исследованиях, карты GC*2 и GC*1S в целом не будут противоречить гипотезе широтной изменчивости. Карта аллеля GC*1F высоко коррелирует с главным сценарием изменчивости классических маркёров в русском генофонде: r=0.63. Все три аллеля коррелируют со второй главной компонентой классических маркёров: для GC*1S r=0.66; для GC*2 r=0.43; для GC*1F r=0.37. Белок обеспечивает до 90 % всей активности ингибитора протеаз в отношении трипсина, ингибируя также ещё целый ряд ферментов — химотрипсин, эластазу, коллагеназу, тромбин и протеазы лейкоцитов. О функциональной важности PI свидетельствуют достоверные ассоциации дефицита этого фермента с рядом заболеваний легких и печени. Система включает три субтипа (Р1*М1, Р1*М2, Р1*МЗ с суммарной частотой более 90 %) основного варианта и значительное число редких вариантов. Все варианты PI функционально различны: уровень белка у гомозигот убывает в ряду М1>М2>МЗ, а редкие аллели продуцируют ещё меньшее количество белка [Генофонд и геногеография…, 2000]. Относится к группе генетико-биохимических маркёров (ферменты сыворотки крови). ЛАНДШАФТ ЕВРАЗИИ В населении Северной Евразии частота аллеля в целом убывает в направлении с запада на восток. Средняя частота Р1*М2 составила для коренных народов Кавказа q=0.16, Урала — q=0.14, Сибири q=0.08. В народонаселении Европы частота аллеля Р1*М2 убывает в ином направлении — с юга (q=0.18) на север (q=0.09). Среднерусская частота аллеля Р1*М2 (q=0.15) находится в этом интервале. Среди 19 изученных русских популяций частота Р1*М2 варьирует от 0.04 до 0.23. Однако межпопуляционное разнообразие P1*M2 (GST=0.52) оказалось намного ниже среднего для русского генофонда уровня дифференциации (GST=1.36), что позволяет предполагать давление стабилизирующего отбора. АРЕАЛ РУССКОГО ГЕНОФОНДА Четкий градиент «запад<=>восток» (рис. 5.2.4.), наблюдаемый в Северной Евразии в целом, характерен и для русского генофонда (корреляция частоты Р1*М2 с долготой достигает в отдельных районах значений r=0.9). Однако среднее значение коэффициента корреляции с долготой невысоко (r=0.30), поскольку на самом востоке карты, у русских популяций Урала, вновь наблюдается резкое повышение частоты аллеля. Карты всех трёх аллелей обнаруживают очень высокую корреляцию со вторым сценарием изменчивости русского генофонда по классическим маркёрам: для Р1*М1 коэффициент связи достигает чрезвычайно высокого значения r=0.87; для Р1*М2 r=0.68; для Р1*МЗ r=0.64. ПОПУЛЯЦИОННЫЙ ЭКСПЕРИМЕНТ: ВКЛЮЧАЕМ ГОРОДСКОЕ НАСЕЛЕНИЕ Не только на рассмотренных, но и на многих других картах (P1*S, GC*1S, PGM1*1-, PGM1*2-, TF*C2, TF*DCHI, ACP*A) в русских популяциях Урала также ярко видны резкие нарушения тех трендов, которые характерны для «исконного» русского ареала. Напомним, что в порядке эксперимента в анализ были включены городские популяции» лежащие за пределами «исконного» русского ареала. Например, для локуса PI это русское население республики Удмуртия, изученное в г. Воткинске (где частота Р1*М2 q=0.16, в то время как для самих удмуртов характерна средняя частота q=0.10), Екатеринбурга (с частотой P1*M2 q=0.15) и Асбеста (с частотой P1*M2 q=0.14). Эти значения лишь воспроизводят (с незначительной вариацией) среднерусскую частоту (q=0.15) и не несут никакой дополнительной информации ни о географии, ни об истории русского генофонда. Городское русское население Урала сформировано, главным образом, в результате исторически недавних миграций. И потому эти значения можно не изучать: их можно просто прогнозировать, исходя из демографических данных о миграционных потоках из «исконного» русского ареала. Таким образом, проведённый эксперимент подтверждает правильность нашей исходной позиции: население, находящееся за пределами «исконного» ареала народа (и тем более городское!), не информативно для изучения пространственной структуры генофонда. Все усилия целесообразно направить на выявление генетической изменчивости сельских популяций в пределах «исконного» ареала. Зная генофонд «исконного» ареала, зная источники, направление и интенсивность миграционных потоков (откуда и сколько мигрантов прибыло в данную популяцию за пределами «исконного» ареала), мы можем с большой степенью вероятности прогнозировать генетический состав исторически «молодых» популяций. Трансферрин образует соединение с железом, нейтрализуя токсичные ионы, и транспортирует его в костный мозг. Множество вариантов трансферрина контролируется тремя сериями аллелей — TF*B, TF*C, TF*d, каждая из которых включает несколько аллелей. Относится к группе генетико-биохимических маркёров (ферменты сыворотки крови). Рис. 5.2.5. Карта распределения в русских популяциях аллеля TF*C2 РУССКИЕ ПОПУЛЯЦИИ Из редких вариантов всегда рассматривается аллель TF*DCHI, поскольку увеличение его частоты традиционно интерпретируется как признак монголоидной примеси [Спицын, 1985; Шнейдер, 1999]. Однако средняя частота TF*DCHI (табл. 5.2.1.) в русском населении находится ниже даже 1 % критерия полиморфизма (q=0.009). Максимальные значения в основном ареале обнаружены в популяциях Рязанской, Костромской и Вологодской областей (q=0.016) при среднем размере выборки менее 100 человек, которая слишком мала для надёжного тестирования столь редкого аллеля. Поэтому, не приводя карту TF*DCHI, лишь укажем, что она намечает слабую тенденцию увеличения частоты TF*DCHI с запада на восток, однако достоверность такого тренда невелика. Из пяти карт TF, построенных для русского генофонда (их характеристики даны в табл. 5.2.1.), приведем карту аллеля TF*C2 (рис. 5.2.5.), созданную по данным о 20 русских популяциях. Частота TF*C2 варьирует от 0.06 до 0.21 со среднерусским значением q=0.15. Гетерозиготность локуса (по совокупности всех аллелей) HS=0.365. Важно отметить, что межпопуляционное разнообразие других аллелей локуса значительно превышает среднерусский уровень изменчивости (GST=1.36): для TF*B01 GST=2.33, для TF*C3 GST=2.05. Это позволяет выдвигать гипотезу подверженности аллелей TF*B01 и TF*C3 дифференцирующему отбору. Однако для аллеля TF*C2 характерно резко сниженное межпопуляционное разнообразие: GST=0.47. Достоверно сниженный размах изменчивости TF*C2 может указывать на давление стабилизирующего отбора на этот вариант трансферрина. ЛАНДШАФТ ЕВРАЗИИ Хотя частота TF*C2 возрастает до 0.40 в некоторых популяциях Южной Азии, но и для популяций Европы, и для коренных народов Приуралья она лежит примерно в одном диапазоне частот (от 0.07 до 0.27), причём среднеэтнические частоты одинаковы у самых разных народов: 0.10 — и у чувашей, и у финнов; 0.14 — и у мордвы, и у немцев; 0.15 — и у русских, и у испанцев; 0.16-0.18 — у мари, итальянцев, шведов и греков. АРЕАЛ РУССКОГО ГЕНОФОНДА Но, несмотря на такое мозаичное распределение на европейском пространстве, в русском ареале карта являет вполне выраженную закономерность: увеличение частоты TF*C2 на севере (0.16 ИТОГ Таким образом, на карте распространения аллеля TF*C2 в русском ареале можно выделить три широтных зоны: северная — с высокими частотами TF*C2, центральная — с пониженными частотами TF*C2, южная — со среднерусскими частотами. Карты всех трёх вариантов аллеля TF*C обнаруживают высокую корреляцию с первым j сценарием изменчивости классических маркёров: для TF*C1 коэффициент связи достигает чрезвычайно высокого значения r=0.80; для TF*C2 r=0.58; для TF*C3 r=0.57. Карта аллеля TF*DCHI, в свою очередь, высоко коррелирует с третьей главной компонентой русского генофонда: r=0.79. А аллель TF*B вносит определённый вклад (r≈0.4) и в первый, и во второй главные сценарии русского генофонда. Рис. 5.2.6. Карта распределения в русских популяциях аллеля АСР1*А Предполагается, что основная функция ACP1 состоит в регуляции внутриклеточной концентрации флавиновых ферментов и коферментов. Кроме трёх основных аллелей АСР1*А, АСР1*В, АСР1*С, существует ряд редких вариантов ACP1. Все фенотипы различаются по средней активности фермента, причём количественные эффекты всех аллелей образуют ряд: А<В<С. Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови). В МАСШТАБЕ ОЙКУМЕНЫ (АСР1*А) Для аллеля АСР1*А в генофонде ойкумены отмечается положительная связь частоты с географической широтой [Спицын, 1985; Spitsyn et I al., 1998]. Однако для коренного населения Северной Евразии характерна совершенно иная и своеобразная долготная изменчивость этого аллеля. Гряда относительно высоких значений АСР1*А (q>0.40), протянувшаяся от Алтая на север, отделяет западное «плато» средних значений АСР1*А от «низин» Средней Сибири и Саян (области низких частот АСР1*А в интервале 0.17 АРЕАЛ РУССКОГО ГЕНОФОНДА (АСР1*А) Карта изменчивости частоты этого аллеля (АСР1*А) в русском населении, построенная по информации о 24 русских популяциях (К=24), приведена на рис. 5.2.6. Она показывает, что для русского населения (так же, как и для населения Северной Евразии в целом) не характерно возрастание частоты аллеля в северных широтах, связываемое с широтной климатической зональностью, с возможным действием отбора. К тому же и уровень межпопуляционной изменчивости (GST=1.28) соответствует селективно-нейтральному (GST=1.36), и тем самым противоречит гипотезе отбора по этому аллелю. Не сказывается и влияние азиатских степей. Поскольку среднеазиатские популяции характеризуются снижением частоты аллеля, то их влияние должно было бы сказаться в убывании частоты АСР1*А в юго-восточном направлении. Например, ближайшие тюркоязычные популяции характеризуются следующими частотами АСР1*А: у казахов q=0.26, у башкир q=0.31, у татар q=0.33, у чувашей q=0.25 [Генофонд и геногеография…, 2000]. Однако карта демонстрирует обратный тренд — не убывание, а возрастание в русском ареале частоты аллеля с северо-запада на юг и юго-восток. При этом вариации частот АСР1*А достаточно велики — от 0.18 до 0.41 (табл. 5.2.1). Северо-западные русские популяции характеризуются сниженными частотами с минимумами в землях новгородских (q=0.25), псковских, тверских, затем в Поонежье и далее к Архангельску. Высокие частоты характерны для востока и юго-востока с максимумами в землях костромских и рязанских (q > 0.40). Популяции, выходящие за пределы основного ареала (Украина, Урал), демонстрируют частоты аллеля, характеризующие не столько структуру генофонда, сколько структуру поздних переселений (этот вопрос обсуждался в подразделе § 1.3). Эти «внешние» (по отношению к «исконному» русскому ареалу) популяции меняют тренд на противоположный и приводят к резкому снижению средних коэффициентов корреляции как с широтой, так и с долготой местности (табл. 5.2.1). Рис. 5.2.7. Карта распределения аллеля АСР1*С в русских популяциях. Ясно видимый на карте тренд увеличения частоты аллеля АСР1*А в направлении «северо-запад<=>юго-восток» в русском населении нельзя объяснить, исходя из данных о его соседях. Например, у литовцев средняя частота АСР1*А составила q=0.34, а у молдаван q=0.25 [Генофонд и геногеография…, 2000], то есть у западных соседей наблюдается падение частоты аллеля с севера на юг — в противоположность тренду, наблюдаемому в русских популяциях — увеличения частоты аллеля с севера на юг. Поскольку данные по украинцам и белорусам отсутствуют, приведем средние частоты АСР1*А среди других славянских народов: у поляков q=0.35, у чехов q=0.32, у хорватов q=0.28, у болгар q=0.16. Мы вновь видим общеевропейский градиент падения частоты аллеля с севера на юг, противоположный наблюдаемому тренду в русском генофонде. В любом случае, данные о славянских народах не дают удовлетворительного объяснения тренду, выявляемому картой (рис. 5.2.6). ГИПОТЕЗЫ (АСР1*А) Можно, однако, выдвинуть гипотезу о том, что в выявленном «русском» тренде АСР1*А нашли отражение генетические характеристики финно-угорского субстрата — тех древних насельников Русской равнины, которые освоили её задолго до того, как она стала Русской: до прихода славянских племён. На возможность такой гипотезы указывает тенденция некоторого увеличения частоты аллеля с севера и запада к югу в современных финно-язычных популяциях: у карел q=0.24, коми-зырян q=0.30, у коми-пермяков q=0.30, у удмуртов q=0.30, у мари q=0.36, у мордвы q=0.39. На севере, в самодийских популяциях, частота аллеля в среднем также невелика: у тундровых ненцев q=0.31, у лесных q=0.16, у нганасан q=0.29. ИТОГ (АСР1*А) Можно резюмировать, что наблюдаемый в русском генофонде тренд роста частоты аллеля АСР1*А в направлении «северо-запад<=>юго-восток» не поддаётся объяснению в плане «глобальных» взаимодействий, будь то панойкуменный тренд, славянская экспансия или влияние евразийских степей. Вместе с тем, для ближайших финно-угорских народов также наблюдается нарастание частоты аллеля приблизительно в том же направлении: с севера (и с запада) на юг. Это позволяет предположить, что формирование данного тренда относится ко времени, предшествовавшему славянской экспансии на Восточно-Европейскую равнину, уже населенную финно-угорскими племенами (корела, весь, меря, мурома, чудь Заволочская, пермь, печера, югра и многими другими, имена которых не дошли до нас). Выявленный тренд, возможно, отражает в современном русском населении древний финно-угорский субстрат. ЛАНДШАФТ ЕВРАЗИИ (АСР1*C) Другой аллель — АСР1*С — принято называть «европейским». Для населения Европы характерны наибольшие частоты АСР1*С: средняя частота в Европе q=0.05, в то время как в коренном населении всех остальных частей света — меньше 1 %. Средняя частота АСР1*С составила q=0.005 для коренного населения как Сибири, так и Средней Азии и Казахстана. Частота АСР1*С несколько выше в населении Кавказа (q=0.016) и ещё выше у коренных народов Урала (q=0.028), составляя у мордвы, мари, коми-пермяков и коми-зырян 4–5%. АРЕАЛ РУССКОГО ГЕНОФОНДА (АСР1*Р Карта аллеля АСР1*С (рис. 5.2.7.) демонстрирует в русском населении несколько иной характер изменчивости, чем предыдущая карта АСР1*А. Можно видеть общее снижение частоты аллеля к северу от волгоокского междуречья (до 1–2%) и повышение частоты АСР1*С в центральных, восточных и южных областях (до 7 %). Однако, хотя корреляция с широтой и составила в среднем r=0.34, для достоверной оценки различий при низких частотах (со средней q=0.03) требуются большие выборки. Карты всех трёх аллелей локуса ACP1 обнаруживают высокую корреляцию (0.6 Фермент фосфоглюкомутаза играет важную роль в метаболизме углеводов. Из серии аллелей локуса pqMi наиболее полно изучено распространение частых аллелей PGM1*1+, PGM1*1-, PGM 1*2+, PGM1*2-. Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови). Рис. 5.2.8. Карта распределения аллеля PGM1*2+ в русских популяциях. Рис. 5.2.9. Карта распределения аллеля PGM1*2-в русских популяциях. ЛАНДШАФТ ЕВРАЗИИ ГРСМ1*1+. РСМ1*2+1 Концентрация наиболее частого аллеля PGM1*1+ (его средняя частота в русских популяциях q=0.59) растёт в Северной Евразии в направлении с запада на восток. Однако для русского населения этот градиент не прослеживается. Впрочем, то же можно сказать и об остальных аллелях локуса (рис. 5.2.8–5.2.10.). Например, для аллеля PGM1*2+ в населении Евразии отмечается выраженный долготный градиент увеличения частоты в западном направлении: средняя частота q=0.18 характерна и для коренного населения Сибири, и для Средней Азии; выше средняя частота в населении Урала (q=0.23), и ещё выше у коренных народов Кавказа (q=0.27). Однако в изменчивости русского народа этот долготный градиент PGM 1*2+ проявляется нечетко. АРЕАЛ РУССКОГО ГЕНОФОНДА Этот, второй по частоте аллель PGM1*2+ варьирует в русских популяциях от 0.14 до 0.38 со средним значением q=0.24 (табл. 5.2.1). Но максимум частоты приходится на одну из шести изученных популяций Вологодской области. Такой скачок частоты вероятнее всего связан с особенностями выборки. Ведь в среднем по шести вологодским популяциям частота PGM1*2+ (q=0.23) неотличима от среднерусской (q=0.24). К тому же и объем выборки, давшей максимальную частоту, невелик: n=61 человек. Так что единственным важным структурообразующим элементом генетического рельефа карты PGM1*2+ (рис. 5.2.8.) можно считать снижение частоты аллеля на северо-западе, в землях новгородских и тверских. Частоты третьего аллеля PGM1*2- варьируют в пределах 0 Частоты четвёртого аллеля PGM1*1- (рис. 5.2.10) варьируют в тех же пределах: от 0 до 0.18 со средним значением q=0.10 (табл. 5.2.1). Однако некоторую закономерность в генетическом рельефе аллеля PGM1*1- всё же можно предположить. В целом средние и низкие частоты характерны для западных (новгородско-псковских) и волго-окских популяций. Высокие частоты наблюдаются к северу и востоку — в вологодских и костромской популяциях. Нарушают такую широтную изменчивость увеличения частоты аллеля с юга на север лишь две географически крайних популяции — Курская (q=0.14: n=200 чел.) и Архангельская (q=0.05: n=96 чел.). Средние частоты соседних финноязычных народов Приуралья (мордвы, мари, удмуртов) лежат в интервале 0.12 Рис. 5.2.10. Карта распределения аллеля PGM1*1-в русских популяциях. ИТОГ Средний по всем аллелям локуса уровень меж-популяционной изменчивости (GST=0.75) почти в два раза меньше селективно-нейтральной дифференциации (GST=1.36), что может указывать на действие стабилизирующего отбора. Однако картина изменчивости аллелей столь мозаична, что её сложно интерпретировать как в терминах истории, так и в терминах отбора. Лишь дальнейшее изучение может выявить реально существующую генетическую изменчивость русского генофонда — 23 популяции, изученные по локусу PGM1, не позволяют выдвинуть сколько-нибудь информативную гипотезу о факторах, сформировавших генетический рельеф его аллелей. В целом можно предполагать, что информативность локуса PGM1 для изучения структуры русского генофонда невелика. Тем не менее, даже в изменчивости локуса PGM1 проглядывают общие закономерности архитектоники русского генофонда. Эти черты мы обнаруживаем, анализируя корреляции между картами аллелей локуса PGM1 и картами главных компонент русского генофонда (табл. 5.3.3.). Карта аллеля PGM 1*2- обнаруживает высокую корреляцию (r=0.76) с первым сценарием изменчивости классических маркёров. Два других аллеля вносят весомый вклад в изменчивость третьей главной компоненты русского генофонда: для аллеля PGM1*1+ корреляция r=0.75, для аллеля PGM1*2+ корреляция r=0.66. Из всех эстераз наиболее подробно описан полиморфизм локуса ESD, причём фермент эстераза D, гидролизующий эфиры уксусной кислоты, встречается в большинстве тканей организма. Точная метаболическая функция эстеразы D неизвестна [Генофонд и геногеография…, 2000]. Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови). ЛАНДШАФТ ЕВРАЗИИ Считается, что градиент частот аллеля ESD*2 фиксирует монголоидный генный поток в популяциях Евразии [Спицын, 1985]: частота «азиатского» аллеля ESD*2 достигает максимума (q>0.40) в Южной Азии и в отдельных районах Центральной Азии, а в Европе падает до 0.12. Однако в Северной Евразии градиент частот ESD практически отсутствует. В Европе средняя частота альтернативного аллеля ESD*1 q=0.88, среди коренных народов Кавказа q=0.89, Урала q=0.85, Сибири q=0.83, Средней Азии и Казахстана q=0.81. Эти значения показывают, сколь мала региональная изменчивость ESD*1 в Северной Евразии (от 0.81 до 0.89) и как неприметен градиент падения частоты аллеля с запада на восток. Более того, на северо-востоке Евразии частота аллеля ESD*1 вновь возрастает до «европейских» частот: у восточных эвенков q=0.90, у коряков q=0.89. В целом, диапазон значений во всех изученных локальных популяциях Северной Евразии невелик: в 141 популяции 41 народа частота колеблется в пределах 0.71 АРЕАЛ РУССКОГО ГЕНОФОНДА Столь слабо выраженные межрегиональные различия не позволяют уверенно интерпретировать генетический рельеф ESD*1 (рис. 5.2.11.) в русском ареале как следы тех или иных миграций. А такое предположение возникает при первом же взгляде на карту — её рельеф как бы задаётся резко выраженной впадиной низких значений на юго-востоке, ограниченной с севера и юга грядами наиболее высоких частот ESD*1. Естественно предположить, что уменьшение частоты в юго-восточной части русского ареала связано с влиянием степных номадов. Однако это предположение маловероятно, поскольку у ближайших тюркоязычных народов, изученных по этому гену, наблюдаются довольно высокие средние частоты ESD*1: у башкир (q=0.88) и татар (q=0.88). У других восточных соседей средние частоты аллеля варьируют следующим образом (двигаясь с юга на север): у мордвы q=0.89, у чувашей q=0.81, у удмуртов q=0.88, у коми-пермяков q=0.83, у коми-зырян q=0.88. На западе у карел частота ESD*1 достигает q=0.91. На карте ядро относительно низких частот образовано только двумя русскими популяциями — Костромы (q=0.79, n=76 чел.) и Рязани (q=0.81, n=76 чел.). При этом в Курской области и Волго-Окском междуречье частота ESD*1 возрастает до 0.90, а в новгородских и архангельских землях снижается до 0.86. Рис. 5.2.11. Карта распределения аллеля ESD*1 в русских популяциях. ИТОГ Вновь карта генетического рельефа русского народа отражает не «европеоидно-монголоидные» взаимодействия, в терминах которых привычно осмысливать генетическую изменчивость русских популяций, а сложные пути формирования русского генофонда. Объективно мы видим на карте чередование зон — широтных «волн», незначительно отличающихся то повышением, то понижением частоты аллеля. При этом средняя частота аллеля ESD*1 (q=0.89, число популяций К=18) полностью соответствует европейским стандартам, а межпопуляционная изменчивость (GST=0.95) несколько ниже селективно-нейтрального уровня (GST=1.36). Корреляции карт локуса ESD с картами главных компонент русского генофонда (табл. 5.3.3.) обнаруживают высокую корреляцию с первым (r=0.58) и с третьим (r=0.51) сценариями изменчивости классических маркёров. Локус контролирует одну из форм глиоксалазы, отвечающей за превращения метилглиоксаля в лактат. Известны три варианта GLO1 с активностью фермента, убывающей в ряду: GLO1*2>GLO1*1>GLO1*0 («молчащий» аллель). Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови). Рис. 5.2.12. Карта распределения аллеля GLO1*1 в русских популяциях. В МАСШТАБЕ ОЙКУМЕНЫ Наибольшие частоты GLO1*1 характерны для народов Европы (q=0.41), в остальных частях света среднерегиональные значения q ниже 0.30. Считается, что для Северной Евразии характерен общий тренд увеличения частоты GLO1*1 с северо-востока на запад: диапазон изменчивости GLO1*1 в 147 популяциях 44 этносов Северной Евразии составил 0.08 АРЕАЛ РУССКОГО ГЕНОФОНДА В русских популяциях (К=18) частота аллеля GLO1*1 (рис. 5.2.12.) варьирует в довольно широких пределах 0.27 ИТОГ Однако, исходя из данных о распределении аллеля GLO1*1 в коренном населении Европы, можно было прогнозировать совершенно иную картину для русского генофонда: увеличения частоты аллеля на юге (влияние южных европеоидов) и на севере, поскольку в циркумполярных финно- и самодийскоязычных популяциях частота GLO1*1 достигает значительных величин (например, у карел q=0.44, у тундровых ненцев q=0.51). Наблюдаемый генетический рельеф прямо противоположен ожидаемому, выведенному из основных геногеографических закономерностей у окружающих народов. Остается вновь предположить, что структура генофонда русского народа определяется не столько волнами иноземных миграций, сколько основными течениями собственной истории. Корреляции карт локуса GLO1 с картами всех трёх главных компонент русского генофонда невелики и колеблются в пределах 0.3 Рис. 5.2.13. Карта распределения аллеля PGD*C в русских популяциях. Фермент необходим для синтеза нуклеиновых кислот (участвует в превращении гексоз) и присутствует во многих тканях организма. Кроме основных аллелей (PGD*A и PGD*C) описан ряд редких аллелей, причём некоторые приводят к сниженной активности фермента. Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови). В МАСШТАБЕ ОЙКУМЕНЫ Во всем мире гетерозиготность локуса мала за счёт резкого преобладания аллеля PGD*A. Самые низкие частоты PGD*C характерны для коренного населения Америки и Европы (q<0.03), в остальных частях света q>0.05 с максимумами в Африке (q=0.09), Меланезии и Индостане (q=0.07). Между регионами Северной Евразии различия недостоверны: в Сибири q=0.06, на Кавказе q=0.05, в Средней Азии q=0.05, на Урале q=0.04, в регионе Восточной Европы (без Приуралья и Северного Кавказа) q=0.04. Предполагается, что несколько большая частота аллеля обычно наблюдается для более южных популяций. АРЕАЛ РУССКОГО ГЕНОФОНДА В 12 изученных русских популяциях частота PGD*C слабо варьирует от 0.02 до 0.06 со средней q=0.04 и гетерозиготностью HS=0.035 (табл. 5.2.1). Уровень межпопуляционной изменчивости (GST=0.35) значительно ниже селективнонейтрального уровня (GST=1.36), что может указывать на мощное действие стабилизирующего отбора. На карте (рис. 5.2.13) обращает на себя внимание ядро повышенных частот PGD*C в центральной и юго-восточной частях ареала. Однако оно в основном связано с интерполяцией на юго-восточные районы и базируется на данных о двух отнюдь не южных популяциях — Вологодской (q=0.06, n=50 чел.) и Московской (q=0.06, n=99 чел.) областей. Лишь дальнейшее изучение русского генофонда может проверить правильность представленного на карте генетического рельефа — слишком мало изученных популяций и слишком малы выборки для сравнительного изучения низко полиморфного гена. Поэтому эту карту можно оценивать лишь как один из вариантов картографического прогноза, который пока не может служить предметом детального обсуждения. Тем не менее, карта распространения PGD*C содержит важные структурообразующие элементы русского генофонда: корреляция карты PGD*C с картой первой главной компоненты изменчивости классических маркёров велика: r=0.67.
Однако этот вектор не является общеевразийским. У манси (q=0.40) и лесных ненцев (q=0.41) Западной Сибири частота НР*1 вновь превышает отметку 0.4, а затем, после некоторого падения, вновь достигает в коренном населении Якутии «европейских» значений: в ряде популяций q>0.40 при средней q=0.37. Карта распространения НР*1 в коренном населении Северной Евразии подробно проанализирована нами в работе [Балановская, Нурбаев, 1995]. В целом «хребет» высоких значений тянется от Украины до Якутии с пологим уменьшением частоты аллеля как в северном, так и в южном направлениях. Такой характер изменчивости нельзя свести ни к «европеоидно-монголоидным» взаимодействиям, ни к влиянию широтной изменчивости среды.
АСР1*А составила q=0.32 (в населении Западной Европы). Эта величина совпадает и со среднерусской частотой q=0.32, и со средней частотой аллеля у коренных народов Урала (q=0.32) и Кавказа (q=0.31). Лишь для народов Средней Азии наблюдается понижение средней частоты АСР1*А (q=0.28) [Балановская, 1998].
PGM1*2- (рис. 5.2.9.) выявляет независимое повышение его частоты в трёх удалённых друг от друга популяциях — новгородской, архангельской и рязанской. Эти ядра высоких значений хорошо видны на фоне широкой области низких частот в северной половине русского ареала, вновь демонстрируя мозаичность генетического рельефа. Карта этого аллеля (PGM1*2-, (рис. 5.2.9.) во многих деталях является зеркальным отражением изменчивости карты аллеля PGM1*1-(рис. 5.2.10). Коэффициент ранговой корреляции между этими двумя картами составил r=- 0.62.
PGM 1*1- в восточном направлении.
=0.41) и Восточной Европы (q=0.42) [Балановская, 1998].
(GST=1.04) по сравнению с селективно-нейтральным уровнем русского генофонда (GST=1.36). Генетический рельеф GLO1*1 в русском ареале крайне любопытен: максимальные значения частоты GLO1*1 наблюдаются в центре ареала, а на периферии ареала они снижаются. Причём минимумы (0.27-0.30) обнаруживаются как в южной части ареала (включая часть волго-окского междуречья), так и в самой северной части (Архангельская область).
Системы групп крови относятся к иммунологическим маркёрам — такова техника выявления этих маркёров. В самом простом случае это выглядит так. Если к эритроцитам, которые обладают так называемым «антигеном», мы добавим сыворотку крови другого человека, в которой есть соответствующие именно этому антигену антитела, то произойдет «слипание» эритроцитов. Мы увидим его невооруженным глазом: вместо обычной капли крови мы увидим сгустки и сыворотку (примерно так, как если в кислое молоко добавить кипяток). Обычно так и открывали многие иммунологические маркёры — если вдруг при переливании крови одного человека другому происходила агглютинация (слипание) эритроцитов, что могло приводить к осложнениям и даже гибели человека. Предназначение иммунологических маркёров — защищать организм от проникновения «чужеродцев», распознавать их и обезоруживать. Поэтому антитела могут вырабатываться организмом только к «чужим» антигенам — тем, которых у самого человека нет.
Система MN относится к кодоминантным локусам: все три генотипа ММ, MN, NN проявляются фенотипически различно, что для иммунологических маркёров — редкость. Локус MN находится на 4 хромосоме. Тесно сцеплен с локусом Ss, образуя единую систему MNSs. Поэтому при совместном анализе обоих диаллель-ных маркёров выявляются четыре различных гаплотипа (MS, Ms, NS, Ns). Но поскольку по системе Ss и гаплотипам MNSs изучено меньшее число популяций, мы рассмотрим геногеографию лишь локуса MN.
Между аллелями М и N нет доминирования одного над другим, поэтому гетерозиготу легко MN различить — она будет реагировать с обоими антителами — анти-М и анти-N. Различия между аллелями М и N связаны с аминокислотными заменами полипеп-тидных цепей антигенной молекулы в позициях от 1 до 5. Антигены М и N обнаружены не только у человека, но и некоторых беспозвоночных. Выявлено присутствие антигенов М и N не только в крови, но и других тканях человека. Известны случаи осложнений после переливания крови, вызванных антителами анти-М. Выявлены некоторые ассоциации групп крови MN с сахарным диабетом, пневмонией, атеросклерозом, остеохондрозом. Однако физиологическая роль антигенов MN неизвестна.
Относится к группе иммунологических генных маркёров.
В МАСШТАБЕ ОЙКУМЕНЫ
Гетерозиготность локуса MN достигает максимальной планки, возможной для двуаллельных локусов, поскольку в среднем для ойкумены частоты обоих аллелей близки к 0.5: среднемировая частота аллеля MN*M составляет q=0.54. Причём равновесие между обоими аллелями поддерживается во всех регионах Старого Света: в Европе средняя частота аллеля MN*M q=0.59, в Северной Евразии q=0.57, в Индостане q=0.66, в Восточной Азии q=0.66, в Африке (южнее Сахары) q=0.55, в Океании q=0.45. Но, тем не менее, мировой размах частот максимально велик (от 0 до 1) за счёт своеобразия остальных континентов. Аллель MN*M редок в Новой Гвинее и Австралии, где его средняя частота равна q=0.30, а в Меланезии — лишь q=0.15. В коренном населении Америки, напротив, аллель MN*M преобладает, достигая средней величины q=0.72.
ЛАНДШАФТ ЕВРАЗИИ
В пределах региона Северной Евразии, среди её локальных популяций, размах изменчивости аллеля MN*M также велик — от 0.17 до 0.90! Весь диапазон изменчивости приходится на популяции Сибирского региона, где величина межпопуляционных различий достигает чрезвычайно высокого уровня GST=8.30.
Причём в Сибири велики не столько различия между локальными популяциями в пределах этноса (то есть гетерогенность внутри этноса): по локусу MN они (GST=2.09) даже меньше, чем в среднем для сибирских этносов (GST=3.85, см. раздел 5.3.). Основная часть межпопуляционной изменчивости локуса MN (%) приходится на различия между этносами Сибири (GST=6.21). Средние этнические частоты варьируют в необычайно широких пределах от q=0.28 до q=0.76 (размах межэтнической изменчивости Δ=0.48). То есть этнические частоты у народов Сибири варьируют почти в тех же пределах, что и различия между локальными популяциями всей Северной Евразии (как говорилось, от 0.17 до 0.90).
Причём не один, а целый ряд этносов (алеуты, долганы, негидальцы, ульчи, шорцы, якуты) характеризуется очень высокой средней частотой около q=0.70. В то же время у другого ряда сибирских народов средние частоты едва достигают отметки q=0.40 (нганасаны, ненцы, чукчи, чулымцы, энцы). При этом средняя частота для сибирского региона находится всё на том же уровне мировых стандартов: q=0.56. На примере Сибири мы видим, что хотя среднерегиональные частоты достаточно постоянны в Старом Свете, внутри региона может наблюдаться значительный разброс частоты у разных народов, живущих в этом регионе.
Среднерегиональная частота MN*M практически та же и в Уральском регионе: q=0.52. И размах межпопуляционных различий MN также велик для населения Урала: GST=4.2. Причём вновь, как и в Сибири, гетерогенность самих народов не велика: на Урале (GST=1.04) она по локусу MN меньше, чем в среднем для региона (GST=1.42). Как и в Сибири, основная часть (вновь %) изменчивости приходится на различия между коренными народами Урала GST=3.20. Этнические частоты на Урале варьируют почти в столь же большом диапазоне, как и в Сибири — от q=0.33 у ненцев до q=0.68 у башкир (размах межэтнической изменчивости Д=0.35).
В Средней Азии диапазон изменчивости этнических частот, напротив, чрезвычайно узок (от q=0.56 до q=0.62, то есть Д=0.06), а средняя региональная частота (q=0.59) опять близка к «стандарту» Старого Света.
Из всех регионов Северной Евразии только на Кавказе наблюдается некоторое повышение средней частоты (q=0.68), а этнические частоты слабо варьируют от q=0.59 у азербайджанцев до q=0.76 у абазин (то есть размах межэтнической изменчивости Д=0.16).
ГЕНОФОНД ВОСТОЧНОЙ ЕВРОПЫ
Размах изменчивости частот MN*M среди народов Восточной Европы столь же невелик, как и на Кавказе: от q=0.54 у литовцев до q=0.70 у саамов (Д=0.16), причём практически у всех остальных народов Восточной Европы частоты колеблются около q=0.60. Соответственно, средняя частота MN*M в Восточной Европе равна q=0.62.
Межпопуляционные различия по локусу MN (табл. 5.2.2.) очень малы (GST=0.99) по восточноевропейским стандартам, где средний уровень различий между всеми популяциями Восточной Европы GST=2.25 (см. подробно главу 8). Эта величина включает в себя как различия между популяциями в пределах народа (гетерогенность этноса), так и межэтническую изменчивость (различия между этносами), которая по локусу MN вообще неощутима: GST=0.11 при средней по Восточной Европе GST=0.82. Но и рассматривая только внутриэтнический уровень, мы видим сниженную изменчивость локуса MN: гетерогенность этноса по локусу MN (GST=0.87) значительно меньше, чем селективно-нейтральная оценка гетерогенности «среднего» этноса восточноевропейского региона (различия между популяциями GST=1.44). Эти сравнения, показывающие сниженную изменчивость локуса MN в Восточной Европе, суммированы в таблице 5.2.2.
Таблица 5.2.2.
Дифференциация (G-.) локуса MN в Восточной Европе
Изумляет и близость этнических частот восточных славян (причём оценки надёжны — каждый народ изучен по большому числу популяций): у русских q=0.59, у белорусов q=0.59, у украинцев q=0.61. То есть при рассмотрении в целом восточноевропейской изменчивости MN бросается в глаза столь безликая межпопуляционная изменчивость, которая предполагает, что локус будет мало информативен для анализа генофонда.
АРЕАЛ РУССКОГО ГЕНОФОНДА
Напомним, что картографируемая территория включает русские популяции, расположенные от 43° до 70° с.ш. и от 24° до 60° в.д. (см. раздел 5.1). Поэтому в анализ попадает и часть территорий. Прибалтики, Белоруссии, Украины. Однако лишь русское население этих территорий включено в анализ русского генофонда! В 32 изученных русских популяциях частота MN*M варьирует от 0.37 до 0.72 (табл. 5.2.1). Различия между русскими популяциями (GST=1.19) чуть ниже селективнонейтрального уровня (GST=1.36). При этом гетерогенность русского народа равна общей изменчивости всех популяций Восточной Европы по этому локусу (как мы сказали, для Восточной Европы по локусу MN GST=1.20). То есть в восточноевропейском масштабе изменчивость русских популяций по этому гену велика и достигает размаха изменчивости всех популяций региона.
Рис. 5.2.14. Карта распределения аллеля MN*M в русских популяциях.
Генетический рельеф аллеля MN*M в русских популяциях приведён на рис. 5.2.14. Рельеф карты задаётся как ядрами с высокой частотой гена, разместившимися и на самом юго-востоке, и на северо-западе ареала, так и областью низких значений на Русском Севере. Эти географически полярно расположенные элементы при почти полной аморфности остальных территорий и создают корреляцию признака с широтой r=0.44 (табл. 5.2.1). Таким образом, мы оказываемся перед фактом, что при полной «безликости» и неинформативности средних частот MN*M, карта выявляет четкий тренд изменчивости в локальных русских популяциях. Присмотримся к нему.
Ядра с высокими частотами MN*M на юго-востоке и северо-западе соединены «нагорьем» повышенных значений частоты. На Верхней Волге (Тверские популяции) это нагорье вырастает почти до уровня северо-западного ядра, формируя третье ядро повышенных значений. Отметим, что пики самых высоких частот аллеля М находятся за пределами «исконного» русского ареала (русские восточной Эстонии и восточной Украины). А русские популяции в «исконном» ареале удивительно похожи друг на друга и лежат в пределах двух средних интервалов (от 0.58 до 0.61 и от 0.61 до 0.64). Эти два интервала занимают две трети (65 %) всей территории, образуя выраженное одновершинное распределение (рис. 5.2.14). Сразу подчеркнём, что «ядра» высоких значений нельзя однозначно вывести из частот у окружающих народов. Частоты русских популяций северо-западного ядра выше, чем в окружающих популяциях эстонцев (q=62, оценка получена по большому числу — 15 популяций эстонцев). Частоты в юго-восточном ядре также выше, чем у восточных соседей русского народа — в популяциях калмыков (q=0.64), татар (q=0.54), мордвы (5=0.57), удмуртов (q=0.59), марийцев (q=0.56). Оказывается, что частоты MN*M в окружающих этносах находятся в пределах всё тех же двух средних интервалов (от 0.58 до 0.64) или даже ниже их, в то время как в окраинных «ядрах» русских популяций значения (q=0.72) заметно превосходят значения средних интервалов (от 0.58 до 0.64).
Вторым структурообразующим элементом является область низких частот на севере[34]. Она задаётся шестью популяциями Архангельской области в бассейне Мезени, изученными А. А. Ревазовым и его сотрудниками. Все шесть популяций попадают в интервал значений q<0.55. В одной из популяций частота опускается до q=0.37, а в остальных колеблется около 0.5. Выборки велики — в среднем по 140 человек из популяции. Поэтому снижение частоты MN*M на севере Архангельской области можно считать твёрдо установленным фактом.
ГИПОТЕЗЫ
Достойное объяснение станет возможным тогда, когда и иные популяции Русского Севера будут детально изучены по MN. Однако и теперь можно высказать предположение, что такое снижение частоты на севере русского ареала связано с влиянием дославянского населения, включенного в русский генофонд в процессе колонизации северных территорий. Эта гипотеза имеет основания в низкой частоте у северо-восточных уралоязычных групп. Градиент частоты у них аналогичен русским популяциям — частота падает к северу (у коми-пермяков q=0.54, у коми-зырян q=0.50, у ненцев q=0.33). Но речь может идти о влиянии именно восточных групп финно-угров, поскольку у западных финноязычных групп частоты MN*M выше, чем у северных русских: у карел q=0.62, у вепсов q=0.64, у эстонцев q=0.62, у саамов q=0.70.
В порядке планирования будущих работ можно высказать ещё одну, ничем не обоснованную, но заманчивую гипотезу. Она касается того «коридора» сниженных частот MN*M, который тянется через весь русский ареал с севера на юг примерно вдоль 32 меридиана. Велик соблазн, объяснить его едва сохранившимся следом пути из «варяг в греки», протянувшимся через озера, реки и волоки от Ладоги до Черного моря. Проверить эту гипотезу просто — надо лишь пройти с экспедиционным обследованием этим же путем, что ходили наши предки.
Корреляция карт аллелей локуса MN выявлена лишь с картами третьей главной компоненты русского генофонда: r=0.5.
Система групп крови Резус всем известна по личному знакомству — её определяют, когда возникает риск иммунологического конфликта: матери и плода, или же при переливании крови. Три тесно сцепленных локуса расположены на 1 хромосоме в порядке D-C-E, образуя единую систему Rhesus (RH), и при анализе всех трёх локусов можно выявить 18 фенотипов, за которыми скрываются 8 гаплотипов. Но поскольку по гаплотипам D-C-E изучено меньшее число популяций, чем только по локусу D, то мы и рассмотрим геногеографию лишь этого локуса. В популяционно-генетических исследованиях он представлен как двуаллельная система (RH*D и RH*d). И именно с локусом RH-D связана основная угроза возникновения гемолитической болезни новорожденных, хотя другие два локуса RH-С и RH-Е также могут быть причиной иммунологического конфликта между плодом и матерью. Антигены образуются у плода очень рано — уже в возрасте 8 недель. Небольшой размер иммуноглобулинов, несущих антитела анти RH, позволяет проникать им через плацентарный барьер, и иммунизация материнского организма приводит к гемолитической болезни новорожденного.
Гомозиготы dd по рецессивному аллелю RH*d (то есть обладатели двух рецессивных аллелей RH*d) всем известны как «резус-отрицательные»; а гомозиготы DD и гетерозиготы Dd (то есть носители хотя бы одного доминантного аллеля) фенотипически неразличимы и известны нам как «резус-положительные». Поясним, что именно из-за доминирования RH*D над RH*d (d внешне никак не проявляется в присутствии D, т. е. в гетерозиготе Dd) и возникают недоумения: почему у «резус-положительных» супругов рождаются «резус-отрицательные» дети? Это происходит, когда оба супруга гетерозиготны (Dd): ведь каждый из них является носителем рецессивного аллеля d, не проявляющегося «внешне», фенотипически. Из-за доминирования D над d оказываются возможны и разные исходы в браках «резус-положительных» и «резус-отрицательных» супругов. В этом случае все зависит от генотипа резус-положительного супруга. Все дети будут «резус-положительными», если его генотип окажется гомозиготой DD. Но если он гетерозиготен (Dd), дети будут «резус-отрицательные» с вероятностью 0.5.
Показана связь системы RH со многими заболеваниями — язвой желудка, остеоартрозом, остеохондрозом, пневмонией, корью, краснухой, а также связь с гормональным статусом.
Относится к группе иммунологических генных маркёров.
В МАСШТАБЕ ОЙКУМЕНЫ
Географическая изменчивость аллеля RH*d, ответственного за «резус-отрицательность», общеизвестна: максимум на западе Евразийского континента у басков Испании и Франции (q=0.74) и постепенное снижение частоты во всех остальных направлениях. Частоты аллеля RH*d в регионах мира приведены в таблице 5.2.3. Даже из таблицы видно, что мир как бы распадается по RH*d на две неравные части. С одной стороны запад Евразии с присоединившимися к нему Африкой, Уралом и Средней Азией. В этих регионах частоты RH*d заметны. С другой стороны — мир без RH*d (частоты RH*d близки к нулю). Это восток Евразии с обеими Америками, Австралией, Меланезией, Океанией. Северная Евразия занимает особое положение, охватывая оба мира — с RH*d и без него. Поэтому в таблице приведены частоты в регионах мира, а для Северной Евразии — ещё и для отдельных субрегионов.
Таблица 5.2.3.
Средние частоты аллелей локусов RH и АВ0 в коренном населении основных регионов мира
ЛАНДШАФТ ЕВРАЗИИ (рис. 5.2.15.)
Прежде всего, поясним, что создание карт евразийских трендов RH*d и АВ0 не было самоцелью. При формировании Банка данных «GENEPOOL» нас интересовал генофонд Северной Евразии на фоне его соседей. Поэтому информация для народов бывшего СССР собиралась максимально тщательно, а прочие регионы характеризовались, конечно, не столь полно. Хотя Европа и покрыта густой сетью изученных популяций, но часть Центральной, Южной и Передней Азии (и тем более Африки) представлены в Банке данных, по нашей лености, лишь отдельными народами. Это не мешает прослеживанию основных трансевразийских трендов. Но хотелось предостеречь читателя от чрезмерного доверия к локальным закономерностям карт RH*d и АВ0 Евразии. Впрочем, это относится к любым картам и таблицам — несовершенство наших знаний всеобъемлюще. Поэтому мы всегда привлекаем внимание читателя к наиболее устойчивым «каркасам» генофонда, его основным закономерностям, а мимолётное и эфемерное стараемся оставить за рамками портрета. Для решения этой же задачи мы приводим карты Евразии слегка «сглаженные» (фоновые, трендовые — см. специально посвящённую этим технологиям статью [Балановская, Нурбаев, 1995] и Приложение). Это позволяет избавиться от случайных флуктуаций в частоте аллелей и привести на «сглаженной» карте наиболее устойчивые значения, достойные внимания и доверия читателя.
Рис. 5.2.15. Карта аллеля RH*d в коренном населении Старого Света.
Генетический ландшафт RH*d в Евразии не требует специальных пояснений — настолько он изысканно прост (рис. 5.2.15.). Максимумы частот RH*d сосредоточены только в Западной Европе. При движении в остальных направлениях частота RH*d плавно снижается. Несомненен основной тренд: неуклонное падение частоты RH*d с запада на восток Евразии. Причём изолинии, делящие диапазон изменчивости на равные интервалы, почти вторят направлению меридианов (рис. 5.2.15.) Границей служит 90й меридиан — коренное население к востоку от него всё «резус-положительно». Восточная Европа — предмет нашего главного интереса — являет собой переходную зону, хотя в целом принадлежит к «европейскому» резус-отрицательному миру.
СЕВЕРНАЯ ЕВРАЗИЯ (бывший СССР)
Среди локальных популяций Северной Евразии размах изменчивости аллеля RH*d хотя и уступает мировому, но очень велик — от 0.00 до 0.54! Причём столь широкий диапазон изменчивости (от 0 до 0.5) среди локальных популяций характерен и для субрегионов Северной Евразии: и Восточной Европы, и Урала, и Средней Азии. Лишь на Кавказе минимальная частота опускается не до 0, а до q=0.16. Зато в коренном населении Сибири и размах изменчивости мал, и сам аллель RH*d встречается очень редко — в среднем q=0.04. Среди сибирских народов RH*d достигает заметных значений лишь у народов Алтае-Саянского нагорья (у шорцев q=0.17, у тофаларов q=0.14, у хакасов q=0.11).
На Урале сниженная средняя частота гена RH*d (q=0.23) связана с популяциями Зауралья и самого севера Урала (у манси q=0.16, у хантов q=0.00, у тундровых ненцев q=0.10). Наиболее близкие восточные соседи русского народа — популяции Приуралья и Южного Урала — по частотам RH*d приближаются к народам восточно-европейского региона: у коми-зырян q=0.30, коми-пермяков q=0.26, мари q=0.37, мордвы q=0.36, чувашей q=0.29, татар q=0.30, башкир q=0.27, и только у удмуртов q=0.17 (оценка получена по 13 популяциям). Межпопуляционная изменчивость RH*d на Урале необычайно велика: GST=7.9.
ВОСТОЧНАЯ ЕВРОПА
В Восточной Европе средние различия по RH*d между всеми её локальными популяциями в два раза меньше, чем на Урале, и равны GST=3.6. Первая составляющая этой величины — гетерогенность «среднего» восточно-европейского народа — по RH*d оценивается как GST=0.87, что несколько ниже селективно-нейтральной оценки GST=1.44 (табл. 5.2.4.). Однако вторая составляющая — различия между народами — по локусу RH*d достигает очень большого размаха (GST=2.75), которыйв три раза больше восточноевропейского стандарта (GST=0.82). Эти сравнения суммированы в таблице 5.2.4.
Таблица 5.2.4.
Дифференциация (GST) локуса RH-D в Восточной Европе
В диапазон этнических частот от q=0.33 у эстонцев и вепсов до q=0.44 у соседних карел «уложились» все народы Восточной Европы. Лишь у саамов (лопарей), своеобразие которых проявляется практически по любым маркёрам, средняя частота RH*d очень низка: q=0.14. Без учета саамов, средняя частота RH*d в Восточной Европе составляет q=0.38. Такая же средняя частота свойственна и русскому этносу: q=0.38 (оценка получена только по тем 96 русским поцуляциям, которые участвовали в построении карты на рис. 5.2.16.). Между восточными славянами, где каждый народ изучен по RH*d очень подробно (по 70-100 популяциям), различия средних частот невелики и варьируют около «русских» частот: у белорусов q=0.41, у украинцев q=0.34.
Характер изменчивости RH*d в Восточной Европе лучше описать с помощью корреляционных карт, показывающих связь частоты гена с широтой и долготой в каждой точке карты (см. карты [Балановская, Нурбаев, 1994а, б; 1995]).
Для основной части Восточной Европы[35] характерна чрезвычайно высокая корреляция с долготой, демонстрирующая падение частоты гена RH*d в направлении «запад-восток» (rMIN=-0.80). Именно такой тренд и ожидается, исходя из простой изменчивости аллеля в Евразии в целом (рис. 5.2.15.). Действительно, высокая отрицательная корреляция с долготой означает, что большему значению географической долготы соответствует меньшая частота аллеля. Поскольку для Восточной Европы значения долготы растут с запада на восток (отсчитываясь, как известно, от Гринвичского нулевого меридиана), мы получаем снижение частоты аллеля RH*d к востоку. Этот пример показывает, как, пользуясь одними лишь корреляционными картами, можно извлекать подробную информацию о географии аллеля — в данном случае мировой тренд падения частоты аллеля к востоку. Однако при переходе от мира на уровень региона, регион обнаруживает и свои собственные закономерности, нарушающие стройный ход мировых закономерностей. Так, северо-западная зона Восточной Европы обнаруживает «обратное» направление связи с долготой (rМАХ=+0.60).
Что же касается корреляции с широтой, то средний коэффициент корреляции приближается к нулю (r=0.01). Однако нулевые корреляции с широтой (-0.10
Корреляционные карты говорят о двух важных явлениях. Во-первых, что средний коэффициент корреляции (то есть обычный, который мы рассчитываем без карт) может ввести в заблуждение.
Если связь между признаками мощная, но существуют две равных по площади области с противоположной по знаку (до r=+1 и r=-1) связью, то средний коэффициент становится равным нулю, и мы можем решить, что связи просто нет! Во-вторых, переходя от глобального рассмотрения к составляющим регионам (все более маленьким «матрёшкам») мы можем обнаруживать исчезновение «глобальных» закономерностей и появление своих собственных, региональных.
Рис. 5.2.16. Карта распределения аллеля RH*d в русских популяциях.
АРЕАЛ РУССКОГО ГЕНОФОНДА
Именно это мы и обнаруживаем для русского генофонда. На карте русского народа (рис. 5.2.16.) мы не видим даже намёка на общий трансевразийский тренд «запад-восток» (рис. 5.2.15). Более того, мы не видим вообще никаких четких закономерностей в ареале русского генофонда! «Русская» карта RH*d подобна «лоскутному одеялу»: на ней области высоких значений мирно соседствуют с областями низких значений RH*d. Если же выделить из всей картографируемой территории[36] тот основной «исконный» ареал, в котором складывался физический облик русского народа[37], то в нём можно разглядеть не очень четкий, но своеобразный рельеф. В центре ареала находятся два пика
(р>0.42) и «нагорья» высоких значений, от которых во всех направлениях частота гена RH*d снижается. На периферии ареала мы видим либо новые повышения частоты (на юге и востоке), либо снижения (на севере, западе и юго-востоке).
Напомним, мы ожидали для локуса MN, что (из-за его безликой изменчивости в Восточной Европе) он будет мало информативен для анализа русского генофонда (подраздел § 2.1.) но обнаружили в русском ареале географический тренд с широтной изменчивостью! Для RH*d картина обратная — ожидая, исходя из глобального тренда, простую закономерноность «запад-восток», мы сталкиваемся со столь причудливым генетическим рельефом, который даже трудно интерпретировать!
Карты показывают, что географическое распространение гена не укладывается в простую схему, предполагающую, что континентальный тренд выложен, как из «кирпичиков», из внутрирегиональных и внутриэтнических трендов, и каждый из этносов отражает ту часть всеобщего тренда, которая приходится на его территорию. Обычно все оказывается сложнее и любопытнее. Например, ожидаемый для RH*d тренд (убывание частоты гена в направлении «запад-восток») ярко проявляется лишь при рассмотрении евразийского континента в целом (рис. 5.2.15). Но с изменением масштаба исследования, при последовательном переходе к более частным субрегионам и далее к этносам (см. карты [Балановская, Нурбаев, 1994а, б; 1995]), за деревьями исчезает лес — континентальный тренд многократно перекрыт более частными событиями истории этих генофондов.
Возвращаясь к русскому генофонду, отметим, что в 96 изученных русских популяциях частота RH*d варьирует от 0.26 до 0.52 (табл. 5.2.1). Но при этом гетерогенность RH*d (GST=0.45) намного ниже селективно-нейтрального уровня (GST=1.36) гетерогенности русских популяций. Столь резкое снижение изменчивости может указывать на действие стабилизирующего отбора на локус RH-D в русских популяциях. При этом изменчивость русского народа по RH*d (GST=0.45) меньше, чем многих других восточно-европейских народов: она в два раза слабее усредненной гетерогенности народов Восточной Европы по этому локусу (GST=0.90, табл. 5.2.4). Напомним, что на межэтническом уровне различия между народами Восточной Европы по RH*d ещё значительней: GST=2.7. В целом, это означает, что трансевразийский тренд RH*d «запад-восток» проявляется в Восточной Европе лишь за счёт иных народов и, скорее всего, на уровне межэтнических различий, но не имеет отношения к русскому народу и не проявляется в гетерогенности русских популяций.
Локус RH*d вносит весомый вклад во второй главный сценарий архитектоники русского генофонда: r=0.73.
Рис. 5.2.17. Карта аллеля АВ0*А в коренном населении Старого Света.
Локус АВ0 является самым известным из всех генов человека — все знают его как просто «группы крови» — 1(0), Н(А), Ш(В), IV(AB). Группы крови АВ0, как и Резус, определяют возникновение риска иммунологического конфликта при переливании крови. Благодаря их широкому применению в медицинской практике и, следовательно, обилию данных по разным популяциям, в течение долгого времени эти маркёры являлись излюбленными, а то и просто единственными, маркёрами в арсенале популяционных генетиков. И сейчас группы крови АВ0 и Резус являются абсолютными лидерами по обилию популяционных данных. Пока можно лишь мечтать, что в будущем какой-либо маркёр будет, так же как АВ0, изучен в 182 русских популяциях и в 1230 популяциях Северной Евразии!
Число аллелей в локусе АВ0 велико (особенно выявляемых методами молекулярной генетики), но общеизвестные «группы крови» определяются только тремя аллелями — А, В и 0. Аллели А и В кодоминантны («равноправны») и поэтому гетерозигота АВ проявляется фенотипически — как «четвертая» группа крови IV(AB). Аллель 0 рецессивен («подчинён») по отношению и к А, и к В, поэтому фенотипически мы обнаруживаем лишь его гомозиготу, обозначая её как «первую» группу крови 1(0). Из-за такого «подчинения» гетерозигота АО фенотипически неотличима от гомозиготы АА, и потому вместе они образуют «вторую» группу крови И(А). Точно также оба генотипа ВО и ВВ внешне проявляются как «третья» группа крови III(В). Знание такого «соподчинения» аллелей позволяет ожидать, что в браке супругов с I группой крови все дети будут им подобны. В браке супругов с IV группой крови — дети могут быть любой группы крови, кроме I. А в браке супругов с II и III группами возможны все варианты — от I до IV групп крови (если оба супруга гетерозиготны, т. е. АО и ВО).
Антигены образуются у плода очень рано — уже в возрасте 5 недель. Поэтому при несовместимости матери и плода по АВ0, может возникнуть иммунологический конфликт, который приводит не столько к гемолитической болезни новорожденного, сколько к спонтанным абортам. Но они обычно происходят столь рано, что о них и не подозревают. Если антитела из сыворотки крови матери проникают через плацентарный барьер в кровь ребенка, то они могут вызвать агглютинацию (слипание) его эритроцитов, что приводит к гибели плода на ранних стадиях эмбриогенеза. Такой отбор на ранних стадиях развития плода можно обнаружить лишь статистически — в нехватке детей с определёнными фенотипами среди потомства в несовместимых по АВ0 семьях. В более поздние сроки беременности внутриутробная гибель плода приводит к спонтанным выкидышам.
Показана связь групп крови АВ0 со многими заболеваниями. Вирусный гепатит, грипп, краснуха, скарлатина, язва желудка, язва кишечника, многие виды рака, болезни опорно-двигательного аппарата, заболеваний дыхательных путей и сердечно-сосудистой системы — вот далеко не полный перечень болезней, устойчивость или же подверженность к которым коррелирует с группами крови АВ0. Географическую неравномерность в мировом распределении групп крови АВ0 часто связывают с результатами эпидемий чумы, оспы и холеры: обладатели группы крови 1(0) более восприимчивы к холере и чуме, чем обладатели группы крови 11(A). Причину этого видят в том, что палочка чумы содержит антиген, подобный антигену 0, а вирус оспы — подобный антигену А. Поэтому, например, индивиды с группой крови 1(0), имеющие антиген 0, могут оказаться менее устойчивыми к чуме, потому что им сложнее «опознать» антиген возбудителя болезни как чужеродный и они могут реагировать на него слабее и несвоевременно. Именно с этим феноменом принято связывать низкие частоты группы крови 1(0) в регионах, где свирепствовали эпидемии чумы: Северная Африка, Индия, Монголия.
Относится к группе иммунологических генных маркёров.
В МАСШТАБЕ ОЙКУМЕНЫ
Описание изменчивости аллелей АВ0*А, АВ0*В, АВ0*0 в масштабе ойкумены кочует из учебника в учебник. Поэтому мы ограничимся приведенной выше таблицей с рассчитанными нами средними частотами для всех регионов мира (табл. 5.2.3.) и картами распространения аллелей АВ0 для населения Евразии (рис. 5.2.17.-5.2.19).
За пределами Старого Света (табл. 5.2.3) больше всего поражает резкий сдвиг частот АВ0 в коренном населении Америки — повсеместно распространен аллель AB0*0 (q=0.95), а частоты А и В равно близки к нулю. В коренном населении Австралии также очень высока частота AB0*0 (q=0.78), но при этом аллель АВ0*А (q=0.20) заметно преобладает над AB0*B (q=0.02). В населении Евразии частоты AB0*0 (q=0.61) ниже, но при этом ни в одном из евразийских регионов они не опускаются за отметку q=0.5 (табл. 5.2.3). Аллели А и В в разных регионах Евразии уступают друг другу второе место. В среднем для Евразии частота АВ0*А (q=0.21) несколько выше, чем частота AB0*B (q=0.18). В регионах Евразии оба аллеля достигают высоких частот в Индостане, где наиболее снижена частота мажорного нулевого аллеля.
Рис. 5.2.18. Карта аллеля АВ0*В в коренном населении Старого Света.
Описание евразийского распределения групп крови АВ0 несколько выходит за рамки русского генофонда. Поэтому будем предельно кратки — карты говорят сами за себя. Приводя эти карты, мы вновь делаем исключение, как и для групп крови Резус. И причина этому все та же — карты групп крови АВ0 вызывают всеобщее любопытство. Однако такое исключение помогает решить и непосредственную задачу книги — позволяет на примере наиболее изученных и надежных маркёров рассмотреть, как русский генофонд выглядит «из космоса» и как он вписывается в евразийские ландшафты.
ЕВРАЗИЙСКИЙ ЛАНДШАФТ АВ0*А (рис. 5.2.17.)
Он не столь элегантен, как ландшафт RH*d (рис. 5.2.15), но все же позволяет, генерализуя картину, выделить такой же общий тренд: снижение частоты АВ0*А с запада на восток Евразии. На западе Евразии преобладают нагорья высоких значений АВ0*А, достигая максимальных значений и на самом севере Европы (Фенноскандия), и на самом её юге (Иберийский полуостров). Возвышенность генетического рельефа в Восточной Европе простирается на Украину и юго-запад России. Однако основной ареал Восточной Европы, включая Прибалтику, центр Русской равнины и особенно Русский Север отличаются от Западной Европы более низкими частотами АВ0*А. За пределами Европы значения выше средних частот проходят поясом через Переднюю и Среднюю Азию и далее на восток, вновь возрастая в Японии. К северу и к югу от этого пояса мы видим низкие значения АВ0*А. Впрочем, эта закономерность не всеобщая: например, в Сибири диапазон изменчивости АВ0*А достигает евразийского размаха.
ЕВРАЗИЙСКИЙ ЛАНДШАФТ АВ0*В (рис. 5.2.18.)
Этот ландшафт более выразителен. В Европе сосредоточены минимумы частоты АВ0*В, плавно возрастающей при движении на восток. Второй «полюс» — высоких частот АВ0*В — охватывает огромные пространства Южной и Центральной Азии. Итак, основной тренд: повышение частоты АВ0*В с запада на юго-восток Евразии. В отличие от предыдущей карты, генетический ландшафт Восточной Европы по АВ0*В не отличается своеобразием и исполняет роль переходной зоны: на западе она выглядит вполне европейски, а на востоке встраивается в долготный пояс высоких частот. Этот пояс пересекает Евразию с юга на север и тянется от Индийского океана (с мировым максимумом в Индостане) к Северному Ледовитому океану (к тундровым ненцам). В Сибири диапазон изменчивости частот АВ0*В опять-таки достигает евразийского размаха. Но к югу от Сибири мы видим устойчивое повышение частоты АВ0*В, характерное почти для всей южной части Азии.
Рис. 5.2.19. Карта аллеля АВ0*0 в коренном населении Старого Света.
ЕВРАЗИЙСКИЙ ЛАНДШАФТ АВ0*0 (рис. 5.2.19)
Ландшафт этого аллеля особенно хорош с методической точки зрения. Он показывает, что ареалы с одинаковыми значениями признака вовсе не говорят о родстве населения, там обитающего. Все зависит от географии, от взаимоположения этих ареалов, от их разде-лённости пространством и историко-географическими барьерами. «Положение объекта в пространстве географы считают таким же существенным признаком, как физические свойства и функции» [Родоман, 1990, с.37]. Первой огромной зоной высоких частот АВ0*0 является Сибирь с прилегающими к ней районами. Несмотря на значительные колебания частот, связанные с дрейфом генов в сибирских изолятах, Северная Азия представляет собой обширное нагорье высоких частот АВ0*0. Вторая зона максимумов расположена на западе Западной Европы. Эти два максимума разделяет обширнейшая низменность со значениями АВ0*0 ниже евразийской средней. Эта область простирается от Центральной и Северной Европы до Японии, захватывая Восточную Европу, Урал, юг Западной Сибири, Центральную Азию и почти всю Южную Азию. Поэтому, при обнаружении такого ландшафта — с максимумами, разделёнными пространством, историей формирования населения и областями иных значений — нам не приходит мысль о близком родстве населения Сибири и Западной Европы.
Объяснение такого ландшафта обычно ищут в терминах естественного отбора. Для групп крови АВ0 отбор, как считается, связан с распространением инфекций (оспы, чумы) и других заболеваний, опосредованных демографией (плотностью населения) и внешней средой — в самом широком смысле этого понятия. Однако и эта гипотеза оставляет много недоумений.
Возвращаясь к Восточной Европе, — она наиболее важна для понимания русского генофонда — отметим своеобразие её северных областей. В них расположен локальный максимум частоты АВ0*0, заметный даже в евразийском масштабе. Причём на исходной карте (напомним, что мы приводим слегка «сглаженные» карты, чтобы выявить устойчивые тренды) этот локальный максимум отделен от соседей как на западе, так и на востоке.
СЕВЕРНАЯ ЕВРАЗИЯ
На примере двух столь подробно изученных локусов — групп крови АВ0 и RH — можно убедиться, насколько различна бывает дифференциация одних и тех же регионов по разным маркёрам. Например, на Урале дифференциация популяций по RH*d (GST=7.9) в пять раз выше, чем по АВ0 (GST=1.5). В Восточной Европе — по RH*d (GST=3.6) в два раза выше, чем по АВ0 (GST=1.6). А на Кавказе показатели идентичны — GST=2.4 и по RH*d, и по АВ0. Этот уровень межпопуляционных различий по АВ0 одинаково невелик на Урале (GST=1.5) и в Восточной Европе (GST=1.6), хотя в других регионах Северной Евразии он выше: на Кавказе GST=2.4, в Средней Азии GST=2.5, в Сибири GST=5.5.
Рассмотрим для краткости изменчивость лишь «ведущего» аллеля — АВ0*0, а особенности двух других аллелей читатель сможет сам проследить по картам и таблицам. В генофондах Северной Евразии наибольшая частота АВ0*0 обнаруживается на Кавказе (q=0.63), причём такая же частота характерна и для Западной Европы (q=0.65). У народов Восточной Европы и Урала частота АВ0*0 несколько ниже (q=0.58). В обоих регионах частота АВ0*0 колеблется в широких пределах. В уральском регионе от q=0.49 у тундровых ненцев до q=0.64 у манси Зауралья. При этом тюркоязычные народы (башкиры q=0.56, татары q=0.57, чуваши q=0.56) неотличимы от финно-угров (мари q=0.56, мордва q=0.57, удмурты q=0.58, коми-пермяки q=0.59, коми-зыряне q=0.60) У народов Восточной Европы размах изменчивости вторит уральскому: от q=0.47 у крымских татар до q=0.63-0.64 у карел, вепсов и литовцев.
ВОСТОЧНАЯ ЕВРОПА
На межэтническом уровне, различия между восточнославянскими народами — русскими, украинцами, белорусами — невелики: 0.25АВ0*А; 0.14
АВ0*В; 0.59
АВ0*0. Частота АВ0*0 в русских популяциях (q=0.59) совпадает со средней для всей Восточной Европы (q=0.59). Совпадают среднерусские и восточноевропейские частоты и двух других аллелей: для АВ0*А=0.25, для AB0*B q=0.16 (оценки получены только по тем 182 русским популяциям, которые участвовали в построении карты на рис. 5.2.20).
Рис. 5.2.20. Карта распределения аллеля АВ0*А в русских популяциях.
На внутриэтническом уровне, гетерогенность русского народа по группам крови АВ0 намного ниже селективно-нейтрального (GST=1.36) уровня: для AB0*A G=0.88, для AB0*B GST=0.61, для АВ0*0 GST=0.76 (таол. 5.2.1). Это может указывать на действие стабилизирующего отбора на локус АВ0. Гетерогенность не только русского, но и «среднего», «типичного» этноса восточноевропейского региона по АВ0 (GST=0.48) значительно — в три раза! — ниже селективно-нейтральной оценки (GST=1.44, табл. 5.2.5.). Однако отсюда следует, что гетерогенность русского народа по АВ0 (GST=0.8) больше, чем гетерогенность «типичного» этноса Восточной Европы по этому локусу (GST=0.5).
«РУССКИЙ» ЛАНДШАФТ АВ0*А
В отличие от «русской» карты по RH*d, обнаруживается не «лоскутное одеяло», а четкий тренд. Ясно прослеживается-падение частоты аллеля по направлению к северо-востоку: если в западных и южных русских областях частота достигает q=0.30, то на северо-востоке практически нигде не превышает q=0.22. Основная часть популяций лежит в пределах 0.15рис. 5.2.20). Несмотря на относительно небольшой размах изменчивости, всё множество популяций соответствует картине снижения частоты к востоку и северу. Удивительно, что лишь одна южная популяция (на нижней Волге) и одна северная (на Кольском полуострове) выбиваются из общего строя, а остальные 180 популяций следуют ему. Такое снижение частоты к востоку в русском ареале является частью общего тренда изменения частоты АВ0*А в Евразии в целом (рис. 5.2.17.) — падения частоты при движении от Западной Европы к Восточной и далее за Урал в Центральную Азию [Cavalli-Sforza et al., 1994].
Таблица 5.2.5.
Дифференциация (GST) локуса АВ0 в Восточной Европе
- | По локусу АВ0 | В СРЕДНЕМ по ряду классических маркёров
ГЕТЕРОГЕННОСТЬ ЭТНОСА: средние различия между популяциями одного народа | 0.48 | 1.44
МЕЖЭТНИЧЕСКИЕ РАЗЛИЧИЯ: средние различия между народами | 1.18 | 0.82
ДИФФЕРЕНЦИАЦИЯ РЕГИОНА: средние различия между всеми популяциями (всех народов) | 1.66 | 2.25
Примечание: расчёт проведён по данным только о тех народах, для которых изучено не менее двух популяций (т. о. по локусу АВ0 анализировалась 361 популяция Восточной Европы)
«РУССКИЙ» ЛАНДШАФТ АВ0*0 (рис. 5.2.21.)
Он является почти зеркальным отражением предыдущей карты — падение частоты с северо-востока (р>0.7) на юг и юго-запад (q<0.5). Если на Русском Севере частота достигает 0.7, то в западных и южных русских областях снижается до 0.5.
Рис. 5.2.21. Карта распределения аллеля АВ0*0 в русских популяциях.
Основная часть популяций лежит в пределах 0.5 Основное отличие карт этих двух аллелей (АВ0*А и АВ0*0) связано с северо-западной частью ареала. По АВ0*А в ней наблюдается максимум высоких значений частоты — пик, сформированный Псковскими популяциями и завершающий гряду западных и юго-западных высоких значений. По аллелю АВ0*0 северо-запад тяготеет не 'к южным, а к северным зонам, являясь их закономерным продолжением. Повышение частоты АВ0*0 на юго-востоке лежит в области интерполяции и сопровождается сниженной (хотя и достоверной) надёжностью такого прогноза. Это сомнительное ядро (находящееся далеко за пределами «исконного» русского ареала) опирается лишь на три популяции со значениями частоты выше 0.6, в то время как для всего множества остальных русских популяций Поволжья характерны частоты в интервале 0.58 РУССКИЙ СЕВЕР (АВ0*0) Что же касается повышения частоты АВ0*0 на Русском Севере, то его нельзя объяснить влиянием народов Приуралья. Хотя у них мы обнаруживаем некоторое повышение частоты АВ0*0 к северу, но в северных русских популяциях частота гена АВ0*0 ещё выше и варьирует около 0.7. Коренные народы с высокими значениями АВ0*0 мы находим на северо-западе: и у карел, и у вепсов q=0.64. В целом, опираясь на эти данные и историю колонизации Русского Севера, можно предположить, что повышение частоты АВ0*0 в северных русских популяциях связано с финно-угорским субстратом — теми племенами и народами, которые освоили эти территории задолго до славян. Причём можно предположить, что они были больше похожи на современных западных, чем на восточных финно-угров. Напомним, что по аллелю MN*M мы также обнаружили снижение частоты на Русском Севере, которое также объясняли влиянием финно-угорского субстрата (подраздел § 2.1). Но по локусу MN вырисовывалась картина влияния не западных, а напротив, восточных групп финно-угров. Это показывает, сколь шатки любые выводы о генофонде, основанные на изменчивости лишь одного гена. Впрочем, нельзя исключить, что в генофонде Русского Севера присутствуют как западный, так и восточный финно-угорский субстрат. И разные гены зафиксировали в своем генетическом ландшафте только один из этих генных потоков. Поэтому описание устойчивой структуры русского генофонда мы даем в разделе 5.3, основываясь на обобщённом анализе всех классических маркёров. А предположениям, формулируемым при описании отдельных генов, отводим ранг лишь предварительных (и, как видим, порой противоречащих друг другу) гипотез. Однако рискнем высказать ещё одну гипотезу (см. также разделы 2.3. и 4.4). В генетическом ландшафте АВ0*0 на Русском Севере проявляется не только дославянский субстрат, но и потоки славянской колонизации. Исходя из общего генетического ландшафта, можно предположить, что для Новгородской Руси и её северных колоний были характерны более высокие значения АВ0*0. А «низовская» колонизация Ростово-Суздальской, а затем Московской Руси несла на север более низкие частоты АВ0*0, характерные для большинства летописных славян. Тогда тот «прорыв» низких частот на север, который разделяет на две части Русский Север, может являться следом низовской колонизации — в ходе борьбы Новгорода и низовских земель за северные территории. Напомним, что такой след М. В. Битов прослеживал по данным антропологии (см. раздел 4.4). Однако, хотя по группам крови АВ0 изучено то же число популяций (К=182), что и по данным антропологии (К=180), но генетические данные все равно остаются менее информативными из-за их неравномерного распределения по ареалу — «то пусто, то густо». Достаточно сравнить карту АВ0*0 (рис. 5.2.19.) с любой антропологической картой (например, рис. 4.2.1), чтобы убедиться, насколько антропологами лучше спланировано изучение того же числа русских популяций: они равномерно — в соответствии с историей расселения и плотностью населения — покрывают ареал, в то время как по данным генетики многие важные части ареала не обеспечены информацией. Из этого можно сделать два вывода. Во-первых, нельзя по имеющимся сейчас для русских популяций данным генетики определить точный маршрут генов — его можно набросать лишь очень приблизительно. А во-вторых, для изучения истории русского генофонда необходимо продолжать накопление данных даже по столь изученным классическим маркёрам, как группы крови АВ0! «РУССКИЙ» ЛАНДШАФТ АВ0*В (рис. 5.2.2) Карта распространенности аллеля АВ0*В дополняет две предыдущие карты (частоты аллелей, показанные на всех трёх картах, в любой конкретной точке в сумме составляют единицу). Однако четкие тренды в генетическом ландшафте АВ0*В отсутствуют — они как бы исчерпаны предыдущими картами. Основная территория занята средними значениями, а на периферии разбросаны ядра высоких значений (до q=0.43). Низкие значения видны в Псковских землях и на северо-востоке Архангельской области (где аллель АВ0*В практически отсутствует, опускаясь до q=0.01). Однако эти два провала частот АВ0*В разделены северным хребтом высоких значений. Рис. 5.2.22. Карта распределения аллеля АВ0*В в русских популяциях. Иными словами, мы вновь, как и для RH*d (рис. 5.2.16.), видим ландшафт «лоскутного одеяла». Напомним, что на евразийских картах именно этот аллель показал четкий тренд изменения частоты с запада на восток. Похожий тренд выявлен и по аллелю RH*d. Генофонд Восточной Европы по обоим маркёрам (рис. 5.2.15. и 5.2.18.) играл роль переходной зоны и обнаруживал четкий тренд «запад-восток». Однако, перейдя с регионального уровня популяционной иерархии (Восточная Европа) на этнический уровень («русские» карты), мы не обнаруживаем в русском генофонде ни такого тренда, ни соответствующей ему связи с долготой. И по RH*d (r=0.05), и по АВ0*В (r=0.08) корреляция с долготой близка к нулевой отметке. А сами карты набросаны вольными мазками разных «красок» значений признака. ИТОГ Обе карты — и RH*d, и АВ0*В — обеспечены обширной исходной информацией, и потому позволяют сделать некоторое обобщение: четкая закономерность на региональном уровне не «обязывает» этносы к её «исполнению». В ладу с собственной историей этнический генофонд может её «отменять» или преобразовывать в свою собственную версию генетического ландшафта. Все три аллеля локуса АВ0 вносят свой вклад в главный сценарий архитектоники русского генофонда. Эти черты мы обнаруживаем, анализируя корреляции карт аллелей локуса АВ0 с картами главных компонент русского генофонда (табл. 5.3.3). Карта аллеля АВ0*А обнаруживают высокую корреляцию (r=0.64) с первым сценарием изменчивости классических маркёров. Вклад двух других аллелей меньше: для аллеля АВ0*0 корреляция r=0.42, для аллеля АВ0*В корреляция r=0.31.
АВ0*0 для коренных народов Уральского региона — все они похожи друг на друга и лежат в узких пределах 0.56
АВ0*0 также невысока: q=0.57. У казахов q=0.58 (это самая высокая частота из всех народов Средней Азии и Казахстана). Поэтому повышение частоты в трёх русских популяциях Поволжья, скорее всего, случайно: оно не соответствует частотам ни в соседних русских, ни в соседних иноэтничных популяциях.
Рис. 5.2.23. Карта распределения генетического риска резус-конфликта матери и плода при учете их совместимости одновременно по группам крови AB0 и RH (число случаев на 100 000 населения).
Раз уж мы позволили себе столь подробно остановиться на изменчивости двух самых популярных классических маркёров — групп крови AB0 и Резус, то нельзя не затронуть и их взаимодействие.
Мы рассмотрим то взаимодействие, которое обычно остается за рамками самых важных «практических» применений групп крови. Мы рассмотрим генетический риск возникновения гемолитической болезни новорожденных при учете совместимости матери и ребенка не только «по резус-фактору», а одновременно по обеим системам групп крови (AB0 и RH). При совместном рассмотрении обнаруживаются неожиданные и важные явления.
Патология беременности, возникающая при несовместимости матери и плода по группам крови резус, общеизвестна.
Проявления её могут быть очень тяжелы, и выражаться не только в анемии новорожденного, но и во множественных очагах кровоизлияний, водянке полостей тела, поражениях дыхательных путей, желудочно-кишечного тракта, печени и селезёнки [Прокоп, Гелер, 1991].
Менее известна патология при несовместимости матери и плода по группам крови AB0. Проявления её различны на разных стадиях развития плода. В первом триместре беременности она влечет за собой увеличение частоты внутриутробной гибели эмбриона или плода. Потери из-за элиминации АВ0-несовместимого с матерью потомства весьма ощутимы: они составляют по разным оценкам от 3–5 % до 15–21 % [Туманов, Томи-лин, 1969; Головачев, 1983].
В конце последнего триместра беременности, перед родами, происходит переход антител и других факторов гуморального иммунитета через плаценту. Такая пассивная иммунизация имеет важнейшее значение для новорожденного, поскольку компенсирует незрелость иммунных систем ребенка [Головачев, 1983]. Побочными эффектами такой иммунизации может быть гемолитическая болезнь и ухудшение функционального состояния новорожденного, связанные с иммунной несовместимостью [Туманов, Томилин, 1969; Головачев, 1983]. Последствия несовместимости по системе АВ0 наблюдаются в 2–3 раза чаще, чем по другим иммунным системам [Доссе, 1959]. Но они, в отличие от резус-несовместимости, проявляют себя раньше — до появления ребенка на свет. Для плода они могут иметь печальные последствия. А для новорожденного серьезной угрозы они обычно не представляют, следовательно, не представляют они и проблемы для здравоохранения.
Логично было бы ожидать, что в случаях двойной несовместимости матери и плода — по АВ0 и по Резус — угроза для плода резко возрастёт. Однако на самом деле все наоборот. И число случаев, и интенсивность патологии при двойной несовместимости — по АВ0 и по Резус — резко снижаются [Доссе, 1959; Соловьева, 1964; Туманов, Томилин, 1969; Головачев, 1983]. Причина этому — «конкуренция антител». Эритроциты плода, попадая в организм матери, разрушаются под влиянием уже присутствующих в её крови АВ0-антител, не успевая вызвать иммунизацию к RH-антигену.
Поэтому в популяциях наибольший риск возникновения иммунного резус-конфликта, значимого с точки зрения здравоохранения, возникает при несовместимости матери и ребенка по RH, сопровождающейся совместимостью по АВ0. То есть при резус-отрицательности матери (RH) и резус-положительности (RH+) плода наибольшая угроза гемолитической болезни новорожденного возникает тогда, когда группы крови АВ0 одинаковы у матери и ребенка: например, А и А, В и В, 0 и 0. Такое сочетание групп крови АВ0 и Резус составляет, по разным оценкам, от 66 % [Соловьева, 1964] до 90 % [Michoud, 1961] всех случаев гемолитической болезни, вызванной резус-несовместимостью матери и плода.
Построив карту, отражающую вероятность того, что у резус-отрицательных матерей с группами крови А, В и 0, будут резус-положительные дети, обладающие группами крови АВ0, идентичными материнским, мы картографируем распространение основной группы генетически обусловленного риска возникновения резус-несовместимости матери и плода.
Мы не раз говорили, что карта является не только графическим, но и алгебраическим объектом, не только «картинкой», но и числовой матрицей, с которой можно производить любые необходимые преобразования. Мы постоянно пользуемся этим неоспоримым достоинством наших карт. Их «сглаживание», корреляция, расчёт главных компонент и генетических расстояний — все эти процедуры включают порой очень длинную цепь преобразований, которые мы совершаем с исходными картами. Покажем эту цепь на примере карты генетического риска: для создания единственной результирующей карты (рис. 5.2.23.) мы построили 115 промежуточных карт.
В табл. 5.2.6. указаны типы браков, в которых возможно появление детей, идентичных матери по группе крови А, В или 0, но с угрозой возникновения RH-конфликта. Чтобы получить карту генетического риска несовместимости матери и плода, были проведены следующие преобразования карт:
1. Получены карты распространения частот аллелей локусов АВ0 и RH (пять карт пяти аллелей);
2. Получены карты распространения генотипов родителей (17 карт, генотипы указаны в табл. 5.2.6.)
3. Перемножая карты родительских генотипов, получаем карты частот указанных типов браков. Сочетания генотипов с нулевой вероятностью возникновения резус-конфликта мы не рассматриваем и карты для них не строим. Для оставшихся 46 сочетаний родительских генотипов мы строим 46 промежуточных карт.
4. Умножив эти карты на вероятность, указанную в табл. 5.2.6., получаем вероятность возникновения RH — несовместимости в каждом из этих браков (ещё 46 карт).
5. Сложением этих карт получаем суммарную карту, которую умножаем на 1/3 (считается, что генетически эффективная часть популяции составляет около 1/3 от её численности).
6. Умножив результирующую карту на 100 000, получим карту генетического риска возникновения RH-конфликта матери и плода, выраженную в числе случаев на 100 000 населения.
Таблица 5.2.6.
Сочетание генотипов у родителей и вероятность появления у них детей с повышенным риском иммунного конфликта (резус-конфликт матери и ребенка при совпадении у них групп крови А, В и 0)
Полученная таким образом карта генетического риска резус-конфликта матери и плода при учете групп крови АВ0 и Резус дана на рис. 5.2.23. Карту для коренного населения всей Северной Евразии мы не приводим, так как в азиатской части частота RH*d близка к нулю и генетический риск минимален. Лишь некоторое его увеличение (около 500 случаев на 100 000) прогнозируется вдоль северной границы Казахстана и в среднеазиатских республиках. Однако в европейских районах с повышенной концентрацией гена RH*d величина генетического риска достигает весьма значимых величин (рис. 5.2.23.). В отдельных районах России, Белоруссии, Литвы и Грузии величина генетического риска резус-несовместимости матери и плода, угрожающей здоровью ребенка, составляет около 2000 случаев на 100 000 населения.
Однако все не так страшно. Обратим внимание, что мы говорим только о генетическом риске резус-конфликта. Дело в том, что генетический риск и риск развития гемолитической болезни новорожденного — это две разные вещи. Даже при наличии фактора несовместимости (генетический риск), гемолитическая болезнь возникает лишь у части детей из группы риска — примерно у 15 % (наш специальный расчёт по совокупности литературных источников). Будь доля больных детей постоянной во всех популяциях, география заболеваемости полностью повторяла бы географию генетического риска. Однако вариабельность этой доли велика. Поэтому география заболеваемости гемолитической болезнью новорожденных начинает зависеть не только от генетического риска, но и средовой компоненты — как внешней (демографической, экологической, социальной), так и внутренней (например, индивидуальный уровень гетерозиготности организма или даже резус-фактор бабушки новорожденного, повлиявший на иммунизацию матери в период её внутриутробного развития). Сопоставление географии наблюдаемой заболеваемости с географией генетического риска и географией гетерозиготности позволяет прогнозировать результативность профилактических мероприятий и соответственно их корректировать.
Подведем краткий итог рассмотрению географии отдельных классических маркёров в ареале русского народа.
Яркая закономерность выявляется геногеографической картой НР*1: чёткий тренд «юго-запад<=>северо-восток». Клинальная изменчивость с максимумом на юге q=0.51 и снижением частоты к северо-востоку q=0.17 нарушается зоной среднерусских значений на арктическом побережье (q=0.36). Это повышение частоты НР*1 в русских популяциях нельзя объяснить влиянием коренных народов Арктики — народы циркумполярной зоны характеризуются пониженными частотами НР*1. Можно выдвинуть гипотезу об отражении в генетическом ландшафте НР*1 этапа освоения северных окраин Руси новгородцами в XI–XIV веках.
Не менее чёткий тренд наблюдается и в географической изменчивости АВ0*А в русских популяциях: мы вновь видим падение частоты аллеля по направлению к северо-востоку. Несмотря на небольшой размах изменчивости АВ0*А, практически всё множество популяций соответствует картине плавного снижения частоты к востоку и северу, тем самым подтверждая объективность этой закономерности. При этом генетический ландшафт АВ0*А не только русского народа, но и генофонда Восточной Европы своеобразен и необъясним в терминах «переходной зоны» между Европой и Азией.
Генетический ландшафт русского генофонда по АВ0*0 демонстрирует тот же тренд, но является почти зеркальным отражением АВ0*А — с северо-востока на юг и юго-запад идет не увеличение, а падение частоты. И вновь, несмотря на небольшой размах изменчивости, почти все популяции следуют рельефу плавного снижения частоты с севера к юго-западу. Сравнение с окружающими народами не исключает, что повышение частоты АВ0*0 в северных русских популяциях связано с финно-угорским субстратом — теми племенами и народами, которые освоили эти территории задолго до славян. По данному гену реконструируемый генофонд этих популяций тяготеет больше к западным финноязычным народам, чем к восточным, приуральским. Однако в генетическом ландшафте АВ0*0 на Русском Севере проявляется не только дославянский субстрат, но и потоки славянской колонизации. «Прорыв» низких частот, который разделяет на две части Русский Север, может являться следом борьбы за северные территории Новгорода и низовских земель — ростово-суздальских, а затем московских. Возможно, именно их продвижение на север отражено на карте АВ0*0, сохранившей следы этих генных потоков.
По локусу MN различия между всеми популяциями Восточной Европы (GST=1.2) намного меньше селективно-нейтрального уровня (GST=2.6). При этом гетерогенность русского народа (GST=1.2) равна изменчивости всех народов Восточной Европы по MN, то есть охватывает изменчивость всего коренного населения региона. При полной «безликости» и одинаковости этнических частот MN*M по всей Европе, в пределах русского генофонда обнаруживается четкий тренд изменчивости. Рельеф задают полярно расположенные элементы — ядра максимумов на юго-востоке и западе ареала, область низких значений на Русском Севере. При почти полной аморфности основных территорий эти два полюса создают высокую корреляцию MN*M с широтой: r=0.44. Снижение частоты на Русском Севере, возможно, связано с влиянием дославянского населения, включённого в русский генофонд в процессе колонизации северных территорий.
Карта аллеля АСР1*А демонстрирует в «исконном» русском ареале чётко выраженный тренд: рост частоты аллеля АСР1*А (от 0.18 до 0.41) в направлении «северо-запад<=>юго-восток». Этот тренд нельзя объяснить ни панойкуменным возрастанием частоты аллеля в северных широтах, ни влиянием евразийских степей. Вместе с тем, для ближайших финно-угорских народов наблюдается нарастание частоты аллеля в том же направлении: с севера (и с запада) на юг. Это позволило выдвинуть гипотезу об отражении в «русском» тренде АСР1*А финно-угорского субстрата — дославянского населения Русской равнины.
Карта другого аллеля этого локуса — АСР1*С — при средней частоте аллеля в русском ареале q=0.03 выявляет общее снижение частоты к северу от Волго-Окского междуречья (до 1–2%) и повышение частоты АСР1*С в центральных, восточных и южных областях (до 7 %). Однако при столь низких частотах требуются много большие выборки и большее число изученных популяций. Это замечание относится и к карте низко полиморфного аллеля PGD*C (0.02ST=0.35, то есть в 4 раза ниже селективно-нейтрального уровня GST=1.36).
Для аллеля Р1*М2 характерна иная — не широтная, а долготная изменчивость, реже наблюдаемая в русском генофонде. На карте распространения аллеля Р1*М2 в «исконном» русском ареале видна хорошо выраженная клинальная изменчивость: падение частоты в направлении «запад<=>восток» от q=0.23 до q=0.04. Корреляция частоты Р1*М2 с долготой достигает значений r=0.9. Этот тренд совпадает с градиентом частот в Северной Евразии, где частота аллеля в целом убывает в направлении с запада на восток.
Карты других генетических систем не выявляют столь чётких трендов. Однако и для них можно выделить некоторые особенности. Так, для генетического ландшафта аллеля GC*2 структурообразующим элементом является «впадина» (перепад значений от 0.38 до 0.14), следующая вдоль сорокового меридиана (40°
в. д.). Для карты аллеля GC*1S характерна широтная изменчивость с повышением частоты аллеля от 0.48 на северо-западе и северо-востоке русского ареала до q=0.68 к югу от 55 параллели (55° с.ш.).
Своеобразен генетический ландшафт аллеля TF*C2. Для него характерны три широтных зоны: северная — повышенных частот (q=0.21), центральная — пониженных частот (q=0.06), южная — со среднерусскими частотами (q=0.15).
Карты всех аллелей локуса PGM1 являются мозаичными и не поддаются интерпретации, так что информативность локуса PGM1 для изучения русского генофонда невелика. При этом средний по локусу PGM1 уровень межпопуляционной изменчивости (GST=0.75) в два раза меньше селективно-нейтрального уровня (GST=1.36), что указывает на возможное действие стабилизирующего отбора. Лишь в генетическом рельефе аллеля PGM1*1- всё же можно предположить некоторую закономерность. В целом средние (q=0.10) и низкие частоты (q=0.00) PGM1*1- характерны для западных (новгородско-псковских) и волго-окских популяций. Высокие (q=0.18) частоты PGM1*1- наблюдаются к северу и востоку — в вологодских и костромской популяциях, вновь снижаясь на крайнем севере.
В генетическом рельефе ESD*1 мы снова видим чередование четырёх широтно расположенных волн (с колебанием частот от 0.79 до 0.94). При этом впадину низких значений на юго-востоке русского ареала нельзя объяснить влиянием соседних тюркоязычных народов, поскольку у них частота аллеля достаточно велика.
Карта аллеля GLO1*1 ещё своеобразнее: центральная зона занята высокими значениями частоты аллеля (q=0.48), а к северу и к югу частота аллеля снижается до минимальных значений (q=0.27). Причём такой ландшафт прямо противоположен ожидаемому из характеристик соседних народов.
ВЫВОДЫ
Из серии карт изменчивости отдельных генов в ареале русского генофонда удается сделать лишь два общих вывода.
Во-первых, карты классических генных маркёров являют довольно сложные ландшафты, среди которых можно всё же — с определённой степенью достоверности — выделить широтную изменчивость. Хотя при этом непрерывная клинальная изменчивость прослеживается на картах лишь нескольких аллелей — НР*1, АСР1*А, MN*M, АВ0*А, АВ0*0. Широтное направление в целом соответствует географии диалектов и определённым историческим этапам — колонизации северных окраин Руси, освоения степи и др.
Вторым, но более интересным результатом анализа отдельных генов является тот факт, что повышение или понижение частоты какого-либо аллеля на границах русского ареала в большинстве случаев нельзя объяснить обменом генами с соседними народами.
Например, частоты аллеля MN*M в русских популяциях, формирующие ядра высоких значений, нельзя однозначно вывести из частот в популяциях окружающих их народов. И снижение частоты АСР*А у русских Поволжья не объясняется смешением со степными народами, поскольку у последних частота этого аллеля повышена. Мы приводили и другие примеры. Это служит указанием на большую, чем можно было предположить, роль не смешений, а внутриэтнических процессов в формировании русского генофонда (возможно, основным фактором может быть дрейф генов в окраинных популяциях).
Картографирование частот аллелей позволило выявить клинальную изменчивость в русском генофонде для ряда аллелей. Однако для подавляющего большинства изученных генов клинальная изменчивость не обнаружена. В целом, мы видим ряд чрезвычайно разнообразных генетических ландшафтов — долготный тренд, «диагональная» изменчивость, широтно расположенные волны колебания частоты аллеля, «лоскутное одеяло». Какова роль того или иного ландшафта в русском генофонде, покажет дальнейший анализ обобщённых карт (главных компонент и генетических расстояний). Однако уже на этом этапе можно говорить о своеобразии русского генофонда, пространственную структуру которого нельзя понять лишь из знания генофонда окружающих его народов. Этот результат указывает на значительную гетерогенность и сложность формирования русского генофонда.
Мы рассмотрели русский генофонд на фоне не только его соседей, но и в «глобальном» масштабе — в пространстве Северной Евразии и Евразии в целом. При этом оказалось, что, переходя от глобального рассмотрения к регионам (вложенным «матрёшкам»), мы можем обнаруживать исчезновение глобальных закономерностей. Именно это мы и обнаруживаем в генетическом ландшафте АВ0*В и RH*d. На евразийских картах RH*d и АВ0*В генофонд Восточной Европы играл роль переходной зоны и обнаруживал чёткий тренд «запад-восток». Однако перейдя с глобального (Евразия) на этнический уровень (русский ареал), мы не находим в русском генофонде такого тренда: и по RH*d, и по АВ0*В корреляции с долготой нет! На карте русского народа мы не видим даже намёка на общий трансевразийский тренд «запад-восток»! Более того, мы не видим вообще никаких чётких закономерностей. Карты подобны «лоскутному одеялу», где области высоких значений мирно соседствуют с областями низких значений. Как мы говорили, чёткая закономерность на глобальном уровне не «обязывает» этносы к её «исполнению». В ладу с собственной историей этнический генофонд может её «отменять» или преобразовывать в свою собственную версию этнического ландшафта.
Итак, реальность опровергает простую схему, предполагающую, что континентальный тренд выложен, как из «кирпичиков», из этнических трендов, и каждый из этносов отражает ту часть всеобщего тренда, которая ему положена в соответствии с размером и местом его ареала. С изменением масштаба исследования, при последовательном переходе к более частным регионам и далее к этносам континентальный тренд может быть многократно перекрыт более частными событиями истории этих генофондов.
Эти примеры демонстрируют важный методический принцип. Основные — глобальные — тренды формируются под действием факторов истории и природы в течение длительного времени, и для их выявления необходим соответствующий пространственно-временной масштаб. Соответствие масштаба времени действия эволюционного фактора масштабам генофонда и его географического ареала — важнейший принцип в изучении закономерностей формирования генофондов [Рычков, 1973, 1984; Рычков, Ящук (Балановская), 1980, 1983].
§ 1. Велики ли генетические различия между популяциями? Что такое гетерогенность? — Гетерогенность русского народа — Гетерогенность 63 народов Евразии — Гетерогенность «типичного этноса» региона — Гетерогенность русского народа выше «типичного этноса» в Западной и в Восточной Европе, на Кавказе и на Урале — Фактор русского ареала
§ 2. Главные сценарии генофонда: Метод главных компонент — Ведущий сценарий широтной изменчивости — Второстепенный долготный сценарий — Сходство с антропологией — Неожиданность широтной картины и своеобразие русского генофонда
Сорок четыре генетических маркёра, наиболее подробно изученные в русском населении, обнаружили самые разные генетические ландшафты и направления изменчивости. Мы описали (раздел 5.2.) их полиморфизм, их пространственную изменчивость и разнообразие. Однако закономерности, общие для большинства генов, выявить не удалось. Они лишь неявно просвечивают сквозь плотную вуаль своеобразия отдельных генов. Это означает, что само строение, сам «каркас» генофонда остались почти столь же неведомыми, как и до анализа отдельных генов. Общая структура генофонда — его архитектоника — настоятельно требует проведения специального анализа. Очевидно, что для выявления «общей модели» генофонда надо тем или иным образом обобщить информацию по всем классическим маркёрам.
Один из вариантов такого обобщения — статистический анализ межпопуляционной изменчивости (GST) — мы опишем в § 1. Он позволяет измерить гетерогенность русского генофонда, а затем сравнить её с ближними и дальними соседями по Евразии. Этот вид анализа — GST или FST-статистики — был наиболее разработанным и самым популярным в популяционной генетике человека. Однако, выявляя уровень изменчивости, этот метод не может описать, как эта изменчивость реализуется в ареале генофонда. Чтобы осуществить это, геногеография обычные многомерные методы биометрии переводит на язык карт. Преобразуясь в синтетические карты главных компонент и генетических расстояний, они сообщают, каковы обобщённые параметры генофонда в каждой точке карты. География обобщённых черт русского генофонда рассмотрена в § 2.
ГЕТЕРОГЕННОСТЬ
Насколько велика генетическая изменчивость русского народа? Насколько генетически различаются его популяции между собой? Ответ на этот вопрос можно получить, лишь сравнив размах генетических различий между русскими популяциями и размах генетических различий между популяциями у других народов Евразии. Эту характеристику для краткости мы назовём «гетерогенностью» этнического генофонда. Чтобы её определить, мы для каждого народа рассчитаем, насколько разные популяции этого народа генетически отличаются друг от друга. И выразим эти различия числом — показателем гетерогенности этноса. А затем, имея такие оценки, мы можем сравнить народы по показателям их гетерогенности. У «монолитных» этносов, где все популяции генетически схожи, как близнецы, гетерогенность будет близка к нулю. У генетически подразделённых народов, где одни популяции совсем непохожи на другие, гетерогенность будет велика.
Популяционная генетика позволяет дать численную оценку гетерогенности с помощью GST- Напомним, что GST≈FST. Этот важнейший показатель (подробно описанный в Приложении), эквивалентен средним генетическим расстояниям между двумя случайно выбранными популяциями. Чем больше GST, тем больше гетерогенность, тем больше генетически различны, тем дальше генетически удалены друг от друга популяции одного и того же народа. Напомним (см. Приложение, раздел 2.), что из-за действия отбора показатели GST могут оказаться очень разными. Эти эффекты мы уже видели в разделе 5.2., рассматривая изменчивость русского народа по разным маркёрам. Но для случайной выборки генов среднее значение GST аннулирует эффекты отбора и близко к селективно-нейтральной изменчивости. Иными словами, такое значение GST позволяет оценить истинные генетические различия между популяциями.
ГЕТЕРОГЕННОСТЬ РУССКОГО НАРОДА
Мы оценили гетерогенность русских популяций по всем сорока четырем классическим маркёрам, включенным в анализ (и перечисленным в табл. 5.2.1).
Гетерогенность русского народа оказалась равной[38] GST=2.00.
Но много это или мало? Чтобы ответить на этот вопрос, надо оценить масштаб изменчивости. Для этого рассмотрим показатели гетерогенности (GST) ряда народов Евразии (табл. 5.3.1), в разное время рассчитанные нами.
ГЕТЕРОГЕННОСТЬ 63 НАРОДОВ ЕВРАЗИИ
Мы видим (табл. 5.3.1), что в сравнении с другими народами Евразии межпопуляционные различия между русскими популяциями можно оценить как умеренные.
Таблица 5.3.1.
Генетическая гетерогенность русского народа и гетерогенность других народов Евразии (генетические различия популяций в пределах этноса)
Есть народы — и их большинство! — гетерогенность которых намного меньше, чем для русских популяций. Но есть и народы (тофалары, эвенки, нанайцы, коряки, нивхи), которые в три раза более гетерогенны, чем русский народ. Становится ясно, что простой перебор разных народов не очень информативен — народы могут попасться разные. Для корректного ответа нам надо классифицировать их, например, разнести по историкогеографическим регионам.
ОДИНАКОВА ЛИ ГЕТЕРОГЕННОСТЬ НАРОДОВ В РАЗНЫХ РЕГИОНАХ ЕВРАЗИИ?
Приглядимся внимательнее к этносам, приведенным в таблице 5.3.1. Даже в этих данных проглядывает закономерность — на западе Евразии гетерогенность народов меньше, чем у коренных народов востока Евразийского континента.
Конечно, колебания гетерогенности в пределах каждого историко-географического региона велики. Обратим внимание (табл. 5.3.1.) и на то, что разные народы изучены совершенно по разному числу классических маркёров: словенцы и чехи по 3 локусам, а адыги, осетины и черкесы — по 18 локусам; чехи по 7 аллелям, а русские — по 44 аллелям. Более того, даже когда народы сходны по числу изученных маркёров, сам перечень этих маркёров обычно различается. Но только анализ по большому числу генетических маркёров (как подробно обсуждается в Приложении) даёт устойчивую величину гетерогенности. Если набор маркёров мал и неслучаен, то величина GST зависит от того, оказалось ли у нас при расчёте GST больше генов, подверженных дифференцирующему отбору (то есть генов с завышенными оценками GST) или же генов, подверженных стабилизирующему отбору (то есть генов с заниженными оценками GST). Поэтому при небольших и неслучайных наборах генов действие отбора может либо завышать, либо занижать оценки гетерогенности этноса. Чтобы избежать этого, лучше всего оценить GST по большому и идентичному набору генов во всех регионах.
Тогда попробуем поставить вопрос корректней. Различаются ли по гетерогенности «средние», «типичные» народы Западной Европы, Восточной Европы, Кавказа, Урала, Сибири? Ответив на этот вопрос, можно будет и сказать, насколько велика гетерогенность русского народа в сравнении с другими народами Евразии. В таблице 5.3.2. для полной сопоставимости результатов мы рассчитали все показатели GST для регионов Северной Евразии по одному и тому же набору генных маркёров — по 39 аллелям 18 локусов.
ЧТО ТАКОЕ ГЕТЕРОГЕННОСТЬ «СРЕДНЕГО» НАРОДА В РЕГИОНЕ?
В этой таблице приведена гетерогенность GST уже не конкретных народов, а как бы «среднего» или «типичного» народа для того или иного региона. Это все тот же показатель гетерогенности GST, показывающий насколько популяции одного народа различаются друг от друга. Только после расчёта для каждого из народов, показатели гетерогенности GST всех народов в регионе усреднены. Таким образом, мы выявляем «средний» для этого региона уровень гетерогенности этноса, то есть типичную гетерогенность для народов данного региона. Можно взглянуть и иначе: мы определяем гетерогенность «среднего», или «типичного», народа каждого региона Северной Евразии — Восточной Европы, Кавказа, Урала, Средней Азии, Сибири. А также и для «Западной» Европы, которую лучше бы назвать «не-Восточной». Она включила в себя все европейские народы за пределами бывшего СССР, то есть все народы, кроме тех, что вошли в Европу Восточную.
СРАВНЕНИЕ ГЕТЕРОГЕННОСТИ «СРЕДНИХ» НАРОДОВ В РАЗНЫХ РЕГИОНАХ.
Сравнивая эти оценки (табл. 5.3.2., рис. 5.3.1.), мы видим, что все шесть регионов занимают три ступени по величине средней гетерогенности их народов. На нижней ступеньке расположились Западная Европа и Кавказ: «средний» народ Кавказа (GST=0.8) близок по невысокому уровню гетерогенности к «типичному» народу Западной Европы (GST=0.7).
Рис. 5.3.1. Гетерогенность русского народа в сравнении с «типичной» гетерогенностью народов разных регионов Евразии
На следующей ступени расположились Восточная Европа, Урал, Средняя Азия. Они делят между собой второе место: по гетерогенности «средние» народы этих трёх регионов близки друг к другу: 1.2
Таблица 5.3.2.
Генетическая гетерогенность «среднего» («типичного») народа в разных регионах Евразии
РУССКИЙ ГЕНОФОНД НА ФОНЕ СОСЕДЕЙ
Теперь мы знаем, насколько отличаются по своей внутренней подразделенности — гетерогенности — генофонды народов в разных регионах Евразии (рис. 5.3.1).
Большинство народов Западной Европы характеризуются существенно меньшей гетерогенностью, чем русский народ: GST для «типичного» народа Западной Европы GST=0.7) в три раза меньше, чем для русского народа (GST=2.0)! Это означает, что популяции в пределах «среднего» западноевропейского народа намного больше похожи друг на друга, чем схожи между собой русские популяции. То есть, в европейском масштабе гетерогенность русского народа чрезвычайно велика, а большинство народов Западной Европы в сравнении с русскими генетически «монолитны».
Сравнивая русские популяции с гетерогенностью «типичных» народов на юге и на востоке от русского ареала, мы вновь видим «нестандартность» русского генофонда. Он намного гетерогенней (GST=2.0), чем народы Кавказа (где GST=0.8). И превосходит даже гетерогенность «типичного» народа Урала (GST=1.4). Это неожиданно.
Ведь Уральский регион включает в себя популяции не только Приуралья, но и южного, и северного Урала, и Зауралья — в него вошли и башкиры, и тундровые ненцы, и даже ханты и манси Западной Сибири. То есть Уральский регион постепенно перетекает в Сибирь — и естественно было ожидать большей гетерогенности уральских народов, их приближения к гетерогенности сибирских этносов (в Сибири GST=3.9).
И, тем не менее, гетерогенность русского народа оказалась выше гетерогенности генетически «среднего» народа Уральского региона. Поэтому уже не является неожиданностью, что русские популяции (GST=2.0) отличаются друг от друга больше, чем в среднем восточноевропейские народы (GST=1.2). А ведь при расчёте этого показателя участвовали и данные по русскому народу, повышая эту оценку. Так что можно считать установленным более высокую гетерогенность русского народа (GST=2.0) по сравнению с соседями со всех сторон: на западе (GST=0.7), на юге (GST=0.8), на востоке (GST=1.4) и в ближайшем окружении на Восточно-Европейской равнине (GST=1.2).
Анализируемая изменчивость русского народа ограничена нами границами «исконного», исторического ареала. Но и в таких скромных рамках русский ареал, несомненно, велик. Большому ареалу — большая изменчивость. Хотя в ареале русского народа нет особых географических преград для распространения генов, но само географическое расстояние уже служит фактором изоляции, создавая генетические отличия популяций друг от друга. Бесспорно, этот фактор целиком подчинен брачным традициям — лишь они судят, велико ли или мало расстояние для поиска брачного партнера. Какое расстояние считать настолько большим, что не стоит искать невесту за его пределами? Каждый народ «структурирует» географическое пространство в лад традициям заключения браков, устоявшимся веками. Но как раз для русского народа был несвойственен большой радиус брачных связей: по поговорке «хоть за курицу, да на соседнюю улицу». Поэтому в столь большом ареале естественно ожидать и большие различия между русскими популяциями, что мы и обнаружили по данным генетики.
Однако этнография не выделяет в русском народе чётко фиксируемых подразделений. И антропологи, прежде всего, указывают на антропологическое единство русского народа, несмотря на его большой ареал [Происхождение…, 1965; Алексеева, 1998, 2002].
Поэтому, установив наличие высокой генетической гетерогенности русского народа, важно выяснить — есть ли пространственные закономерности в изменчивости русских популяций и чем они определяются: влиянием иных народов или собственной историей русского народа? Этим вопросам мы уделили внимание при описании карт отдельных генов (раздел 5.2) и рассмотрим теперь на примере обобщённых карт в следующем § 2.
Поиск наиболее общих и устойчивых закономерностей в строении русского генофонда пронизывает всю книгу. Он предпринят в каждой главе второй части книги — и проведён в каждой главе по своей системе признаков — антропологии (соматологии и дерматоглифики), классических маркёров, ДНК маркёров, фамилий. Следующая, третья часть будет целиком посвящена взгляду на архитектонику русского генофонда «извне» — в европейском и евразийском масштабах. Во многих разделах книги дается сравнительное рассмотрение полученных обобщённых характеристик генофонда. Карты генетических расстояний от русского народа до всех популяций Восточной Европы рассматриваются в 8 главе (раздел 8.3). Поэтому здесь мы ограничимся описанием синтетических карт главных компонент, полученных по классическим генетическим маркёрам.
КАРТЫ ГЛАВНЫХ КОМПОНЕНТ.
Синтетические карты главных компонент изменчивости русского генофонда построены на основании 35 карт аллелей 13 локу-сов, достаточно полно и равномерно изученных в русском ареале (АВ0, АСР, ESD, GC, GLO, HP, MN, PGD, PGM, PI, PTC, TF, RH) Число степеней свободы этого набора маркёров d.f.=22.
В таблице 5.3.3. приведены коэффициенты корреляции «простых» карт с главными компонентами — первой, второй и третьей. Таблица показывает, какие из аллелей внесли основной вклад в формирование той или иной главной компоненты. Для удобства чтения приведены только те аллели, которые вносят основной вклад в формирование данной компоненты (их связь с главной компонентой выше r=0.4), и расположены они по степени интенсивности их связи с компонентой. Мы видим, что наибольший вклад в формирование карты первой главной компоненты внесли аллели TF*C1, PGM1*2-, АСР1*С, 6PGD, АВ0*А. Наибольший вклад в формирование карты второй главной компоненты внесли аллели P1*M1, RH*d, P1*M2, GC*1S, Р1*МЗ. Наибольший вклад в формирование карты третьей главной компоненты внесли аллели TF*dCHI, PGM 1*1+, PGM 1*2+, ESD, HP.
Таблица 5.3.3.
Классические маркёры, корреляция которых с картами 1, 2 или 3 главных компонент превышает 0.4 (г>0.4)
Первая главная компонента описывает 22 % общей изменчивости классических маркёров, вторая — 15 %, третья — 14 %. Таким образом, первые три главных компоненты описывают половину всей общей изменчивости всех 35 исходных признаков классических маркёров. Первые пять главных компонент отражают уже две трети (67 %) общей дисперсии (четвёртая компонента — 10 %, пятая — 7 %). Первые десять главных компонент отражают 90 % общей дисперсии. Первые пятнадцать главных компонент описывают уже практически всю общую дисперсию — 98 %. Столь резкий перепад между вкладами первых компонент и отражение ими основной дисперсии всех изученных признаков указывает на высокую эффективность метода главных компонент при изучении карт классических маркёров.
При анализе антропологических данных на долю первой компоненты нередко приходится до 60 % и более общей дисперсии, что определяется высокой корреляцией между самими признаками [Дерябин, 2001]. Но при анализе большой совокупности нескорре-лированных генетических маркёров 20 % изменчивости, падающей на первую компоненту, является достаточно высоким показателем, указывающим на информативность применения компонентного анализа [Cavalli-Sforza et al., 1994]. Дело в том, что большинство антропологических признаков связаны между собой внутригрупповой корреляцией (понятно — большой рост и длинные ноги). Для классических маркёров (несцепленных локусов) подобные связи не существуют. Надо только отличать внутригруппповые корреляции от межгрупповых. Примером межгрупповой корреляции может быть связь между курчавыми волосами и темной кожей: единственное, что связывает эти признаки — это то, что они оба они встречаются в популяциях негроидов. Межгрупповые корреляции создаются не физиологией, не анатомией, а историей или экологией, и поэтому могут быть выявлены между любыми признаками, связанными исторической судьбой.
Малость ареала, в котором изображены главные компоненты (рис. 5.3.2–5.3.3) — особенно после анализа генетического ландшафта АВ0 и Резус — вызывает изумление и недоумение. Куда девались популяции, которые мы видели на больших пространствах карт хорошо изученных генов? Отчего так сократился ареал при переходе к обобщенным картам? Напомним, что исходные варианты карты — до оценки надёжности прогноза — были построены для каждого аллеля на просторах всей территории, видимой на карте. Поэтому мы могли создать и синтетические карты в том же обширном ареале, который мы видели на картах АВ0, RH или HP.
Однако если эти три локуса изучены в среднем по 120 русским популяциям, то остальные локусы — в среднем лишь по 21 популяции, и ареал, по которому они разбросаны, намного уже. Если бы мы включили в анализ главных компонент всю территорию, мы бы опирались на ненадежный картографический прогноз, а это опасно. Поэтому при добавлении каждого нового гена «средняя» карта надёжности, как шагреневая кожа, сокращалась в размере, пока не приобрела тот небольшой ареал, который мы видим на рис. 5.3.2–5.3.3. Этот ареал мал, зато надёжен.
ПЕРВЫЙ СЦЕНАРИЙ.
Классические маркёры (рис. 5.3.2.)
Рис. 5.3.2. Карта первой главной компоненты изменчивости русского генофонда по классическим маркерам.
Самый главный сценарий изменчивости русских популяций представлен картой первой главной компоненты. Он отражает изменчивость наибольшего числа карт отдельных маркёров (22 % общей дисперсии) и потому является главным сценарием русского генофонда. В отличие от сложного рельефа карт отдельных маркёров, мы видим простую и четкую закономерность: значения постепенно изменяются от северных к южным русским популяциям. Таким образом, для русского генофонда оказывается характерна в первую очередь широтная изменчивость по оси «юг-север».
Напомним, что ось «юг-север» указывает только на ось и ничего не говорит о направлении изменчивости: с тем же правом мы можем дать этой оси имя «север-юг». Это связано с тем, что главные компоненты — это новые синтетические признаки, и меняются они от «минус бесконечности» до «плюс бесконечности», а их средняя равна нулю. К тому же ещё и каждый из этих «полюсов бесконечности» с равным правом может быть обозначен как «плюс» или «минус». Поэтому понятие минимальных или максимальных значений для главных компонент является чистой условностью. Сами главные компоненты ничего не могут сказать и о направлении миграций — для этого надо привлекать данные других наук, а также смотреть, с какими признаками каждая из главных компонент более всего связана (см. табл. 5.3.3. и табл. 5.3.4.).
Этим то главные компоненты и хороши: они выделяют элементы структуры генофонда и его каркас в чистом виде. Они позволяют провести 7 районирование генофонда — а это главная задача всех наук, так или иначе связанных с географией. «Окружающая среда представляется географу не складом случайных вещей, а в виде сот, состоящих из ячеек — районов. Районирование играет в географии такую же роль, как классификация в биологической систематике. Районированием фиксируются различия от места к месту, формируется каталог «всего сущего на Земле» [Родоман, 1990, с. 41].
Среди второстепенных элементов отметим, что «северный полюс» компоненты б «находится не на самом севере ареала. Еще севернее за ним намечается иной элемент ландшафта с более высокими значениями компоненты. Напомним, такое же явление мы видели на антропологических картах — и соматологии, и дерматоглифики (раздел 4.4). Другим любопытным элементом ландшафта, также отчетливо проявившимся и на карте соматологии, является «коридор» среднерусских значений, опускающийся вдоль западной границы России (рис. 5.3.2).
Наибольшие отличия по оси «юг-север» находят прямые аналогии в диалектологическом членении русского языка на северное, южное наречия и переходные среднерусские говоры. Вместе с тем, история формирования как генофонда, так и государственно-сти на своих важнейших этапах проходила по иной, ортогональной оси «запад-восток». Примерами взаимодействия по оси «запад-восток» могут служить как расселение славянских племён и позднее русских, сопровождавшееся ассимиляцией финно-угорского населения, так и (в определенной степени) татаро-монгольское иго и длительное взаимодействие русских княжеств и татарских ханств, сопровождавшееся вынужденными миграциями населения. Напомним, что различия между западными и восточными популяциями были обнаружены и при первом же геногеографическом анализе антропологических данных (см. разделы 2.3., 4.4): инструментарий многомерных расстояний выделил три зоны: западную («славянскую»), восточную («субстратную»)и промежуточную между ними («рифтовую»).
Поэтому нельзя считать широтную изменчивость однозначно и естественно вытекающей из истории русского народа. Скорее широтную изменчивость можно рассматривать как фактическую выявленную структуру генофонда, в объяснении происхождения и времени формирования которой остается полагаться на авторитет будущих комплексных исследований.
ВТОРОЙ СЦЕНАРИЙ.
Классические маркёры (рис. 5.3.3. )
Второй сценарий изменчивости русского генофонда по классическим маркёрам представлен картой второй главной компоненты. Она описывает меньшую долю общей изменчивости отдельных генов (15 % общей дисперсии) и потому служит воплощением второго по значимости сценария в истории формирования русского генофонда. Основным элементом его является экстремум с минимальными значениями — он занимает центральную часть «исконного» русского ареала и простирается от Волго-Окского междуречья на юге до Онежского озера на севере. Еще севернее — в бассейне Онеги и Северной Двины намечается район с повышением генетического рельефа.
Рис. 5.3.3. Карта второй главной компоненты изменчивости русского генофонда по классическим маркерам.
Но главная зона высоких значений расположена на западе ареала. Она слагается из двух локальных ядер. Одно из них лежит между Ладожским и Чудским озерами. Другое рас- 60° полагается в Брянских и Смоленских землях.
Но в целом коридор экстремумов тянется по западным окраинам ареала, напоминая о пути из варяг в греки.
Такой же западный экстремум мы видели на карте второй компоненты по данным антропологии (раздел 4.4). Но там он был более мощным, являлся основным структурообразующим элементом и формировал долготный каркас всего ландшафта. Корреля- 0 ция с аналогичной картой по дерматоглифике снижена 50 из-за шероховатостей её ландшафта (раздел 4.4). Но в целом второй сценарий кожных узоров выявляет те же структурообразующие элементы: минимум в центральной части ареала, резкое повышение рельефа на самом севере (в устье Онеги), и западные ядра повышенных значений.
ТРЕТИЙ СЦЕНАРИЙ.
Классические маркёры.
Третий сценарий изменчивости русского генофонда 40° по классическим маркёрам представлен картой третьей главной компоненты. Его значимость примерно такая же (14 % общей дисперсии), что и второй компоненты.
Этот третий сценарий сформирован хребтом высоких значений, протянувшимся долготно с севера на юг и занимающим всю восточную часть ареала и часть центральных областей. Он включает ростово-суздальские земли и тянется на север в бассейн Онеги и Северной Двины. В зоне противоположных — низких значений — оказываются земли московские, тверские, новгородские, псковские.
ОБЩИЕ ЧЕРТЫ ДВУХ ПОРТРЕТОВ: ГЕНОФОНД И ФЕНОФОНД
Сравним главные сценарии генофонда и фенофонда. Генофонд представлен обобщёнными картами классических генных маркёров. Фенофонд — обобщенными картами антропологических признаков, полученными в предыдущей главе (раздел 4.4.). Использование геногеографической технологии даёт уникальную возможность — измерить сходство портретов.
КОРРЕЛЯЦИИ. Коэффициенты корреляции между картами главных компонент всех систем признаков — классических генных маркёров, соматологии и дерматоглифики, фамилий, ДНК маркёров — приведены и анализируются в заключительной 10 главе (табл. 10.1.1). Фрагмент этой таблицы, касающийся только классических маркёров, приведён в таблице 5.3.4. При их интерпретации стоит помнить отличие корреляций между картами от «обычных» корреляций. При «обычном» расчёте по табличным данным географическое пространство остается за скобками. Если в таблице указаны «русские Архангельской области», то они могли быть изучены по генетическим маркёрам где-нибудь на востоке около коми Приуралья, а по дерматоглифике — на западе вблизи Карелии. И, несмотря на такую полярность географического положения, в таблице при расчёте корреляций они принимались за одну точку.
При построении карты географическое положение популяции становится решающим. И если две «родственные» популяции изучены по разным признакам в разных точках ареала (а это сплошь и рядом!), то одни и те же элементы ландшафта будут смещены соответственно на запад или на восток. При этом общий образ карты (общий паттерн, общая модель) будут похожи — не так важно небольшое смещение в пространстве одних и тех же элементов! А вот коэффициенты корреляции при этом могут резко упасть и даже приобрести для этой части ареала противоположный знак — ведь корреляция рассчитывается не для «русских Архангельской области», а для каждого узла густой сетки карты. Поэтому коэффициенты корреляции надо использовать, не абсолютизируя их конкретных значений: они служат подсобным средством, а основным — сравнение самих карт, их образов и ландшафтов. Образ, возникающий при внимательном рассмотрении карты, зачастую глубже и правдивее любых её количественных характеристик. «Но карта тем и своеобразна, тем и хороша, что она субъективна в той мере, в какой субъективна даже строго научная работа; она изображает действительность, очеловеченную интуицией, дискретизованную интеллектом. Географическая карта — это вербализованное изображение» [Родоман, 1990, с. 44]. Поэтому, хотя мы многие годы упорно разрабатываем технологии количественного анализа и сравнения карт, мы призываем читателя всё же почаще смотреть на сами карты, а не только на их численные суррогаты.
Мы видим, что карта первой главной компоненты изменчивости классических маркёров 1РСс обнаруживает необычайно высокое сходство с главными сценариями антропологии (r=0.85) и ДНК маркёров (r=0.71). Огромное сходство трёх типов карт — антропологии, классических и ДНК маркёров трудно было ожидать: ведь все они строились по разным изученным популяциям.
Более того, они отражают как бы три этапа в изучении русского генофонда — от определения расовых признаков антропологии через анализ классических маркёров до технологий молекулярной генетики. И то, что на всех трёх этапах изучения русского генофонда мы обнаруживаем одну и ту же его архитектонику, одну и ту же «общую модель» генофонда, один и тот же его план и каркас — это убеждает нас, что мы действительно выявили основные и реальные черты строения русского генофонда. Тем более, что связь первого сценария классических маркёров и ещё двух столь отличных типов признаков — дерматоглифики и фамилий — тоже велика: она превышает r=0.4 (табл. 5.3.4).
Таблица 5.3.4.
Коэффициенты корреляции между главными компонентами изменчивости классических генетических маркёров исоматологии, дерматоглифики, фамилий и ДНК маркёров
Показательно, что и карта второй главной компоненты классических маркёров (2РСс) также коррелирует со всеми вторыми сценариями всех изученных типов маркёров. Конечно, коэффициенты связи намного ниже — они колеблются в пределах 0.2
В целом, общая картина связи между тремя главными сценариями пяти типов признаков убедительно свидетельствует, что мы на верном пути: можно быть уверенными, что дальнейшее развитие популяционных исследований русского генофонда прояснит многие детали, которые пока видны, как в тумане: однако основные вехи мы, бесспорно, уже обнаружили.
ШИРОТНАЯ ИЗМЕНЧИВОСТЬ ЛАНДШАФТОВ. Выявление именно широтной изменчивости в русском генофонде тем удивительнее, что ожидать можно было лишь противоположного — долготного — хода изолиний. Для Восточной Европы показана долготная изменчивость (глава 8). Русский народ занимает основную территорию Восточной Европы и сложился на основе многих восточноевропейских племён. Поэтому именно долготная изменчивость и должна была бы проявиться, если русский генофонд действительно складывался, как и Русское государство, «прираста-нием», механическим включением в себя всё новых и новых групп населения, входивших во всё более расширяющиеся границы Русского государства. Соответственно то, что обобщающие карты генофонда и фенофонда выявляют совершенно иную, чем для Восточной Европы, «собственно русскую» широтную изменчивость, указывает на принципиальный факт своеобразия русского генофонда. Это явление сквозило в многообразии географии отдельных генов (раздел 5.2.) — как часто в их описании нам приходилось констатировать, что невозможно объяснить их изменчивость, опираясь на генофонды окружающих народов! Это своеобразие состоит в том, что основное направление изменчивости русского генофонда не сводимо к исходной изменчивости тех племён и народов, во взаимодействии с которыми он формировался. По-видимому, широтная изменчивость возникла или же усилилась в ходе собственной истории русского генофонда.
ДОЛГОТНАЯ ИЗМЕНЧИВОСТЬ ЛАНДШАФТОВ. На картах второго и третьего по значимости сценариев изменчивости русского генофонда мы видели соответственно «западный» и «восточный» хребты, тянущиеся долготно с юга на север. Это значит, долготная изменчивость просто отошла на задний план, уступив приоритет широтной изменчивости, но оставаясь весомым фактором изменчивости русского генетического ландшафта. Это наблюдение вновь подтверждается со стороны антропологии — коэффициентами корреляции между вторыми (долготными) компонентами соматологии, дерматоглифики и генетики.
Общность показаний трёх «заслушанных» свидетелей (соматологии, дерматоглифики, классических маркёров) говорит, что мы уже имеем общий очерк архитектоники русского генофонда. Ограничимся пока таким кратким описанием — в последующих двух главах будут рассмотрены портреты генофонда, данные ещё двумя независимыми свидетелями: ДНК маркёрами (глава 6) и русскими фамилиями (глава 7). Перейдем к ним и сравним показания не трёх, а пяти свидетелей. Это поможет нам повысить достоверность наших знаний о русском генофонде.
ДОСТОИНСТВА… УСЛОВНЫЕ
Не за поколения, а прямо на глазах исследователей меняется инструментарий изучения генофонда: уже сейчас генетическая изменчивость популяций анализируется главным образом на уровне полиморфизма ДНК. И для подрастающего поколения генетиков анализ классических маркёров отходит в область прошлого, а антропологическое изучение — в область преданий.
Однако, цель этой книги — дать возможность каждому самому увидеть, потрогать руками и убедиться, что все эти признаки — и столь ощутимые признаки антропологии, и гены-«невидимки», и фамилии — стоят в одном строю при изучении генофонда. Поэтому и ДНК маркёры мы используем в качестве ещё одной системы с теми же правами, что и все остальные системы признаков.
Конечно, самые популярные ДНК маркёры — митохондриальная ДНК и Y хромосома — очень своеобразные системы. У них отсутствует рекомбинация, и потому они позволяют проводить целый ряд видов анализа, недоступных для всех остальных маркёров. Например, определять время мутаций, и благодаря этому датировать миграции, выявлять множество вариантов со своими чётко очерченными географическими ареалами. Тем не менее, здесь мы используем и эти маркёры «в общем строю» с другими признаками, стараясь каждой системе задавать одни и те же вопросы. Иначе как сопоставить ответы? Поэтому в данной книге особые возможности нерекомбинирующих маркёров задействованы лишь отчасти, а основной акцент сделан на сопоставимости всех типов признаков.
С точки зрения методики — генотипирование ДНК маркёров проще, в большей степени унифицировано, легче поддаётся автоматизации. К тому же образцы ДНК легче хранить, чем образцы крови, по которым изучаются классические маркёры.
С точки зрения методологии — на уровне ДНК можно изучить полиморфизм разных «разделов» генома, тогда так классические маркёры отражают полиморфизм лишь структурных генов, подверженных прямому действию отбора.
С точки зрения геногеографии, однако, ДНК маркёры выглядят пока не столь блестяще. Из данных о ДНК полиморфизме сейчас можно извлечь меньше информации о русском генофонде, чем из классических генетических маркёров и антропологических признаков. И единственная причина в том, что объём данных, накопленный за годы изучения ДНК полиморфизма, существенно меньше массива данных по классическим маркёрам, формировавшегося десятилетиями. При изучении общих свойств генофонда оказывается не так важно, будем ли мы пользоваться аутосомными ДНК маркёрами или же классическими маркёрами — различия между ними невелики. В главе 8 приведены примеры удивительного сходства результатов, полученных по ДНК и по классическим маркёрам; и такое совпадение результатов является не исключением, а правилом (см. Приложение, а также [Рычков, Балановская, 1990; Chikhi etal., 1998а, b, 2002]).
Конечно, привлекательная черта ДНК маркёров — множество их типов: это и митохондриальная ДНК, и гаплогруппы Y хромосомы, микро- и минисателлитные маркёры, диаллельный полиморфизм и многие другие, перечисленные в главе 1. Перспектива сравнения разных типов ДНК полиморфизма выглядит заманчивой и при этом вполне реальной. Прогресс технологий анализа ДНК позволяет уже в ближайшие годы изучить многие популяции по тысячам ДНК маркёров.
Но и тогда будет небесполезно использовать накопленные данные по классическим маркёрам — случилось так, что у совокупности «классических» данных есть важное преимущество перед ДНК маркёрами. Изучение ДНК полиморфизма обычно проводится одновременно по множеству маркёров на ограниченных коллекциях ДНК, представляющих лишь немногие популяции. Можно ожидать, что и в дальнейшем, при быстро растущем числе анализируемых маркёров, они будут изучаться все на тех же ДНК коллекциях, все на том же наборе популяций. Тогда любая случайность в выборке будет умножаться на число изученных маркёров и решающим образом сказываться на результатах. А характер сбора выборок для ДНК маркёров порой оставляет желать лучшего: как правило, экспедиционное обследование проводится исследователями, лишь недавно работающими в области популяционной генетики.
Напротив, разные классические маркёры изучены в разных популяциях. Тем самым случайные смещения в результатах взаимно компенсируются. Это своеобразное преимущество массива данных по классическим маркёрам приобретает всё большее значение по мере лавинообразного умножения ДНК маркёров, которые анализируются для одних и тех же коллекций ДНК, то есть на одних и тех же выборках.
МИЛЛИОН МАРКЁРОВ… НА НЕНАДЕЖНЫХ ВЫБОРКАХ
К тому же нацеленность на охват максимального числа маркёров в таких работах отодвигает в тень число и качество изучаемых популяций. И вполне возможна ситуация, что исследование, лучшее по числу и спектру типированных маркёров, будет проведено не на самых лучших выборках. Последствия этого для изучения генофонда могут быть драматичными.
Представим, что изучены восточные славяне. Украинцы и русские представлены выборками, собранными в столичных вузах (студенты которых съехались из различных частей страны, причём более чем вероятно, что многие студенты-киевляне будут иметь в родословных предков из России, а студенты Москвы — родственников на Украине). А выборка третьего восточнославянского этноса — белорусов — собрана в селе, вдали от городов и магистралей. Можно ожидать, что первые две выборки будут близки между собой, а белорусская — только за счет дрейфа генов — будет значительно отличаться от них. Такие соотношения популяций и будут получены при изучении на этих выборках по прекрасной многотысячной панели маркёров. Однако вывод, что русские и украинцы генетически сходны, а генофонд белорусов резко своеобразен — это вывод будет неверен: он обусловлен не генетическими взаимоотношениями реальных русских, украинских и белорусских популяций, а лишь ошибками в формировании ДНК коллекций. Но при этом такой вывод будет казаться хорошо обоснованным по количеству и качеству изученных ДНК маркёров. Это показывает, насколько тщательно и продуманно должны быть собраны популяционные выборки. И чем большее число ДНК маркёров изучается по ним — тем выше требования к репрезентативности выборок.
СТЕПЕНЬ ИЗУЧЕННОСТИ РУССКОЙ ДНК
Для добротного анализа генофонда нужно располагать данными по целому ряду популяций из разных частей ареала, а многие ДНК маркёры изучены в одной-двух, в лучшем случае нескольких русских популяциях. Напомним, что в анализ классических маркёров мы включали лишь те, которые были изучены в десяти и более популяциях (см. раздел 5.1. и Приложение, раздел 6). Причина такой скудости данных по ДНК полиморфизму, как нам кажется, в том, что большинство исследователей пока интересуется сравнением разных народов. Задача же изучения разных популяций одного народа, как правило, не ставится. Но именно эта задача главная в данной книге: детальное изучение гетерогенности русского генофонда.
Оставим в стороне вопрос о том, можно ли получить достоверные результаты о сходстве народов, если характеристика каждого неточна? (Когда появятся данные по множеству популяций каждого народа, многие нынешние положения о взаимном генетическом сходстве народов, видимо, придётся пересмотреть.)
Обратимся к вопросу — сколько популяций нужно изучить, чтобы надёжно охарактеризовать русский генофонд по какому-либо маркёру?
В статьях, посвящённых изменчивости какого-либо ДНК маркёра, нередко можно встретить такую популяцию, как «русские» (обычно без каких-либо пояснений). Иногда указывается географическая локализация или иные сведения об изученной популяции. В этом смысле можно считать, что русский генофонд охарактеризован по большому числу ДНК маркёров. Однако эти данные фрагментарны и не дают никакой информации о структуре русского генофонда. Они могут дать очень приблизительную оценку отличий русского генофонда от иных народов, но не позволяют изучить гетерогенность русского генофонда — для этого нужны данные по многим популяциям из географически разных областей. Именно поэтому данные по многим локусам выше названы «фрагментарными» — они характеризуют только один фрагмент русского генофонда. Лишь в том случае, если по каждому маркёру изучена не одна, а несколько популяций, и они представляют разные части генофонда, мы получим его надёжные характеристики.
Трижды предпринимались попытки изучить одни и те же ДНК маркёры не для одной, а для целого ряда русских популяций. Первая такая попытка была предпринята коллективом под руководством С. А. Лимборской при активном участии авторов данной книги. Полученные данные — частоты аутосомных ДНК маркёров — вошли в монографию и статьи [Лимборская и др., 2002; Popova et al., 2001; Belyaeva et al., 2003]. Но анализ структуры русского генофонда не проводился. Немногим позже Б. А. Малярчук начал планомерные работы по изучению полиморфизма митохондриальной ДНК в русских популяциях. Им изучен ряд популяций, главным образом сосредоточенных в южных областях Восточной Европы [Malyarchuk, Derenko, 2001; Малярчук и др., 2001; Малярчук и др., 2002; Malyarchuk et al., 2002; Малярчук, Деренко, 2004]. Одновременно авторы этой книги продолжали проводить систематические, область за областью, экспедиционные обследования русского генофонда. Сформированные ДНК коллекции изучены по маркёрам митохондриальной ДНК, Y хромосомы и ряду диаллельных аутосомных маркёров. Полученные данные будут опубликованы в ближайшее время, но часть из них представлена уже в этой книге.
Из этого обзора видно, что наиболее интенсивно для русского генофонда изучалась митохондриальная ДНК. Именно её изменчивости посвящена основная часть данной главы. Также данные, полученные совсем недавно по Y хромосоме, позволили провести подробный анализ и этих маркёров. Но ещё раз подчеркнём, что из-за немногочисленности изученных популяций вся совокупность этих данных пока даёт лишь предварительное представление о русском генофонде — менее полное, чем рассмотренные в главе 5 данные по классическим маркёрам.
СПИД протекторная мутация — Её большое значение — Её любопытная история — Элегантность её географии — Распространение в русском ареале — Западнорусская аномалия
Выше мы говорили о том, насколько важно для изучения пространственной структуры русского генофонда охватить популяции из различных частей его ареала. К сожалению, география изученных популяций надёжна лишь для немногих аутосомных ДНК маркёров. Пожалуй, лучше всего в русском ареале изучено распределение мутации в гене CCR5. Поэтому рассмотрим географию именно этого популярного ДНК маркёра.
В последние десять лет эта мутация — делеция 32 нуклеотидов в гене рецептора хемокинов (CCR5del32) — привлекает большое внимание исследователей всего мира. Причина очевидна: гомозиготы по мутантному гену CCR5del32 почти полностью устойчивы к инфицированию ВИЧ-1.
Имеются данные для 22 русских популяций (табл. 6.1.1). Правда, для трёх из них географическая привязка или отсутствует [Stephens et al., 1998], или проблематична [Libert et al., 1998], или характеризует население за пределами «исконного» ареала (русские Новосибирска [Yudin et al., 1998]). Но остальные 19 популяций позволяют картографировать распространение мутации CCR5del32 достаточно подробно.
Таблица 6.1.1.
Частоты мутантного аллеля — делеции CCR5del32 — в русских популяциях
МЕХАНИЗМ УСТОЙЧИВОСТИ К ВИЧ-1
Молекулярные механизмы такой устойчивости хорошо изучены [Dragic et al., 1996; Dean et al., 1996; Samson et al., 1996]. Вирус использует хемокиновый рецептор для проникновения в клетку. Мутация приводит к отсутствию рецептора на поверхности клетки, а это препятствует проникновению вируса. В то время как гомозиготные носители делеции обладают почти полной устойчивостью, у гетерозиготных пациентов СПИД все-таки развивается, но медленнее, на два-три года позже, чем обычно [Zimmerman et al., 1997; Galvani, Novembre, 2005]. Кроме del32, в гене CCR5 и прочих генов семейства хемокинов (CCR2, SDF1) обнаружены и другие мутации. Некоторые из них тоже снижают темпы инфицирования и относятся к СПИД протекторным генам, но их влияние слабее CCR5del32 [O’Brien, Moore, 2000].
ГЕОГРАФИЯ И ВОЗРАСТ ДЕЛЕЦИИ
Известно, что мутация CCR5del32 встречается главным образом у европейцев (в среднем 10 %). Частота её в Европе снижается с севера на юг. За пределами Европы мутация встречается с низкими частотами в смежных регионах (Северная Африка, Ближний Восток, Средняя Азия), но отсутствует в более отдалённых от Европы регионах: в Африке южнее Сахары, в Восточной и Юго-Восточной Азии, в коренном населении Америки [Martinson at al., 1997, 2000].
Такой простой тренд необычен для распространения генов в популяциях человека. И он стал особенно интригующим, когда появились данные по возрасту мутации. Основываясь на изменчивости микросателлитных маркёров, сцепленных с геном CCR5, Либерт с коллегами [Libert at al., 1998] показали, что мутация возникла примерно 2000 лет назад. Данные другой группы [Stephens et al., 1998] оценили возраст мутации всего в 700 лет. Впрочем, 95 % доверительные интервалы в обоих случаях покрывают несколько тысячелетий. Тем не менее, нет сомнений, что мутация возникла лишь однажды и возникла в Европе. Следовательно, частота мутации в населении Европы возросла от нуля до 10 % за сравнительно короткое время. Согласно законам популяционной генетики, такое резкое изменение частоты в столь большой популяции не может быть вызвано случайным дрейфом генов [см. обзор Galvani,
Novembre, 2005]. Остается предполагать действие естественного отбора в пользу этой мутации. Это сразу возникающее впечатление — действия отбора в пользу мутации — было подтверждено и математическим моделированием [Stephens et al., 1998].
Эпидемия СПИДа началась слишком недавно, чтобы изменить частоты генов. Следовательно, нужно найти иные факторы естественного отбора, действовавшие в историческое время. Опираясь на тот факт, что хемокиновые рецепторы взаимодействуют, кроме ВИЧ-1, и с другими патогенами, было выдвинуто предположение, что мутация может определять устойчивость сразу к нескольким инфекционным заболеваниям.
ГИПОТЕЗЫ
«ГИПОТЕЗА ЧУМЫ» [Stephens et al., 1998] постулирует, что частота мутации возросла в результате эпидемий чумы. Гипотеза основана на том, что в средневековой Европе от чумы погибала заметная часть населения. Это должно было привести к заметному действию естественного отбора в пользу любого фактора, определяющего устойчивость к болезни. Эта гипотеза, хотя и получила широкое распространение, никогда не имела прямых доказательств. Более того, недавно было показано, что мутации в гене CCR5 не влияют на протекание чумы у мышей [Mecsas et al., 2004].
«ГИПОТЕЗА ОСПЫ». Но, возможно, что инфекционным заболеванием, приведшим к распространению мутации, была оспа [Galvani, Slatkin, 2003]. Эпидемии оспы, хотя были не столь драматичны, как чума, но поражали европейцев непрерывно. Причём жертвами обычно были дети, что могло ускорить изменение частоты аллеля в поколениях. Опять-таки, и эта гипотеза основывается не на клинических или молекулярно-генетических данных, а на статистическом анализе возможного действия эпидемий оспы.
«ГИПОТЕЗА КЛИМАТА». Кроме гипотез, связанных с инфекционными заболеваниями, предпринимались и другие попытки объяснить закономерности в пространственном распространении мутантного аллеля. Было изучено возможное действие климата и обнаружена сильная отрицательная корреляция между частотой мутации и рядом температурных факторов [Balanovsky et al., 2001, 2005; Limborska et al., 2002].
«ГИПОТЕЗА ВИКИНГОВ» постулирует, что мутация возникла в Скандинавии и распространилась по Европе в «век викингов», когда норманнские корабли достигали самых отдалённых побережий Европы [Lucotte, 2001].
ЕВРАЗИЙСКАЯ КАРТА РАСПРОСТРАНЕНИЯ МУТАЦИИ
В целом надо признать, что факторы, повлиявшие на распространение мутации del32, поняты не до конца [Galvani, Novembre, 2005]. Для их лучшего понимания необходимо, в первую очередь, иметь точную картину распространения мутации в населении мира.
Закономерности распространения мутации CCR5del32 в глобальном масштабе рассматривались как нами, так и многими иными авторами в целом ряде работ — по мере того, как накапливались данные о частотах мутации [Martinson et al., 1997; Libert et al., 1998; Stephens et al., 1998; Lucotte, 2001; Limborska at al., 2002; Galvani, Slatkin, 2003]. Недавно, объединив наши данные по русским и иным популяциям Восточной Европы с данными из опубликованных источников, мы составили общемировую сводку данных по частотам мутации del32. Эта база данных представлена здесь в виде карты распространения мутации в Евразии (рис. 6.1.1). Карта построена по данным о 185 популяциях, из них 35 — собственные неопубликованные данные авторов и их коллег [Balanovsky et al., 2005].
Рис. 6.1.1. Карта глобального распространения мутантного аллеля CCR5del32.
На карте (рис. 6.1.1.) видна четкая закономерность: частота максимальна на севере Европы (на побережьях Балтийского и Белого морей), и во всех направлениях от этой зоны частота плавно снижается. Модификация этой карты, вычленяющая основной паттерн изменчивости, демонстрирует концентрические круги — постепенное убывание частоты по мере удаления от зоны максимальных частот в Беломоро-Балтийском регионе [Balanovsky et al., 2005].
ИЗМЕНЧИВОСТЬ В РУССКОМ АРЕАЛЕ
Для данного маркёра в масштабе Евразии свойственна едва ли не самая элегантная, четкая и простая пространственная изменчивость, которую только приходилось видеть авторам этой книги. Тем удивительнее, что распределение мутации в русском ареале носит довольно сложный характер (рис. 6.1.1). Наибольшие частоты отмечены на Русском Севере — во всех трёх изученных популяциях Архангельской области. Именно они формируют беломорскую часть беломоро-балтийского максимума, выявившегося при анализе в глобальном масштабе. К югу и западу русского ареала частота снижается. Таким образом, распределение мутации в русском ареале согласуется с глобальным трендом в двух аспектах: высокая частота на севере (в зоне беломоро-балтийского максимума) и снижение частоты к югу.
РУССКАЯ АНОМАЛИЯ
Но есть и важное расхождение. В глобальном масштабе частота мутации падаёт не только и не столько к югу, сколько с запада на восток — по мере удаления от Балтийского побережья. Но в русском ареале частота, напротив, снижается не к востоку, а к западу! Западные русские популяции (псковские, вплотную примыкающие к зоне Балтийского максимума, и смоленская популяция) обладают существенно меньшей частотой мутации (5–9%), чем центральные и даже восточные русские популяции (10–15 %). Кроме того, Вологодская популяция, расположенная вблизи северного русского максимума частот (16–19 %), имеет частоту мутации лишь 5 %. Достоверность этой геногеографической аномалии подтверждаётся объёмами и качеством выборок.
Трудно предположить, что могло сформировать такую чересполосицу в расположении зон высоких и низких частот в русском ареале. Эта аномалия достаточно ярко видна не только в «русском масштабе», но и является одним из важнейших нарушений плавного хода изолиний и на «евразийской» карте распространения мутантного аллеля (рис. 6.1.1). Остается надеяться, что по мере дальнейшего изучения «смоленско-псковско-вологодская» аномалия — зона низких частот, столь некстати расположившаяся рядом с зоной максимальных частот, будет более чётко оконтурена, что, в свою очередь, поможет лучше уяснить причины этого феномена.
ВТОРОЙ МИРОВОЙ МАКСИМУМ
Карта распространения мутации в Евразии (рис. 6.7.7.), благодаря нашим новым (пока ещё неопубликованным) данным, выявила ещё один феномен — второй мировой максимум CCR5del32 в Западной Сибири. Пока он основан только на данных по шорцам (q=0.17). Данные по шорцам достаточно репрезентативны (154 человека) и представляют не одну, а несколько выборок с большой части этнического ареала шорцев. Аналогичные данные для шорцев были получены М. И. Воеводой с соавторами. В одной из популяций хантов [Yudin et al., 1998] выявлена высокая частота мутации (q=0.12; выборка 61 человек). Поэтому, хотя результаты требуют развертывания исследований в этом регионе, сам выявленный феномен второго мирового максимума может считаться установленным.
ИТОГ
Изменчивость CCR5del32 позволяет сделать два вывода в отношении русского генофонда.
Во-первых, по этому маркёру выявилась особость населения Архангельской области. Причём, хотя эффективный популяционный размер именно на этих территориях особенно невелик, необычно высокие частоты нельзя объяснить лишь генетическим дрейфом. Ведь все три Архангельские популяции, причём географически и генетически изолированные друг от друга, отклонились от среднерусской частоты в сторону увеличения частоты мутации и примерно на одну и ту же величину, тогда как действие дрейфа предполагает случайное по направлению и силе отклонение.
Во-вторых, изменчивость частоты этого маркёра в русских популяциях столь велика, что заметна даже в глобальном масштабе, на «евразийской» карте (рис. 6.1.1).
Самый изученный маркёр — Его особенности
§ 1. Изученные русские популяции: Кто их изучал — Почему обязательно «исконный» ареал? — Качество выборок — Семь «хороших» популяций
§ 2. География гаплогрупп: Самая частая гаплогруппа — Самые редкие гаплогруппы — Умеренные гаплогруппы — Особый профиль Русского Севера — Редкость «азиатских» гаплогрупп у русских — Пенеги — Древние пласты Севера?
§ 3. Русские популяции в генетическом пространстве мтДНК: Главный кластер популяций — Особостъ севера — Призрачное своеобразие юга — Значительная дифференциация русского генофонда — Выявляемая при корректном анализе
§ 4. Сказка об изолах и миграх: Генетическая память популяции
§ 5. Прокрустово равенство: сколько «русских» гаплотипову соседей по Европе? Ищем общие гаплотипы — Ненасытная Харибда — Коварная Сцилла — Мужественный Прокруст — Общий восточно-европейский генофонд — Русские и финно-угры — Русские и славяне
Я научила женщин говорить…
Но, Боже, как их замолчать заставить!
С девяностых годов XX века и до настоящего времени митохондриальная ДНК (мтДНК) является, пожалуй, наиболее интенсивно изучаемым ДНК маркёром. Одна из причин такого внимания к мтДНК кроется в её малости (в сравнении с ядерным геномом). Это позволило унифицировать набор маркёров мтДНК. Если выбор аутосомных маркёров огромен, и разные лаборатории изучают различные гены, то мтДНК стала общим местом популяционных исследований. Значение этого трудно переоценить — стандартизация программы популяционных исследований [Macaulay et al., 1999] позволила сосредоточить усилия многих и многих лабораторий на одной и той же системе маркёров, и накопить в общемировом масштабе внушительный объём данных о полиморфизме мтДНК (глава 9).
Благодаря концентрации усилий на одной генетической системе, её полиморфизм стал досконально изученным. Это стимулировало и разработку методологических вопросов — анализа медианных сетей, датировок времени возникновения аллелей (гаплогрупп) [Forster et al., 1996; Saillard et al., 2000], сравнения новых данных с результатами работ по классическим маркёрам. Стали обсуждаться вопросы воспроизводимости результатов популяционных исследований при повторном изучении тех же популяций [Yao et al., 2002] и, соответственно, различных стратегий формирования выборок. Многие иные проблемы, ранее едва просматривавшиеся на заднем плане ДНК исследований, встали на повестку дня, как только был накоплен определённый опыт беспрецедентно подробного (по масштабам ДНК исследований) изучения географии митохондриальной изменчивости.
Эта наработанная методология анализа нерекомбинирующих генетических систем уже перенесена на анализ Y хромосомы, и, видимо, будет широко использоваться и для гаплотипов других маркёров — X хромосомы и аутосомных.
Возможно, такой взгляд на мтДНК — просто как на самый изученный ДНК маркёр — покажется странным на фоне научной моды на использование мтДНК в решении проблем микроэволюции, филогеографии.
Однако такой взгляд позволяет сравнивать разные маркёры не только «потенциально» — по их теоретическим возможностям для изучения генофонда, но и «кинетически» — по той энергичности, с которой они изучаются в практике популяционных исследований.
Маршрут раздела таков. Сейчас мы вкратце рассмотрим особенности мтДНК — этот раздел читатель может смело пропустить и возвратиться, если последующее изложение покажется непонятным. Затем в § 1 мы рассказываем, что к настоящему времени сделано для изучения «митохондриального генофонда» русских популяций. Далее представляем попытку обобщения накопившейся информации — анализа изменчивости мтДНК в пределах русского генофонда и сравнения его с соседними группами населения на уровне гаплогрупп (§ 2-§ 3) и на уровне гаплотипов (§ 4-§ 5).
ОСОБЕННОСТИ МИТОХОНДРИАЛЬНОЙ ДНК
ДВА СВОЙСТВА. Для изучения генофонда важны две особенности митохондриальной ДНК.
Во-первых, мтДНК наследуется только по материнской линии: каждый человек получает свой гаплотип мтДНК от матери, то есть в передаче мтДНК принимают участие только женщины. Популяционному генетику это даёт возможность прослеживать популяционные процессы (миграций, динамики численности и т. д.), в различной степени затрагивающие представителей разных полов.
Во-вторых, у мтДНК нет рекомбинации, т. е. нет «перетасовывания» генов, пришедших от матери и пришедших от отца (просто потому, что от отца мтДНК не приходит). Благодаря этому вся мтДНК передаётся в поколениях единым «текстом» — гаплотипом. Это позволяет вычленять «линии» мтДНК (похожие «тексты», связанные единством происхождения), выявлять их «родословные», датировать время расхождения основных ветвей таких родословных, объективно фиксировать события возникновения новых вариантов мтДНК и пути их передвижения по Земле вместе с потоками мигрантов.
Эти свойства вызвали всеобщий интерес к мтДНК — к настоящему времени на территории Европы почти не осталось народов, для которых не имелись бы данные по мтДНК, причём многие получены по обширным выборкам.
УСТРОЙСТВО мтДНК. Митохондриальная ДНК представляет собой небольшую молекулу, расположенную в клетке особняком — не в ядре, как основная часть генома, а в митохондриях. У мтДНК есть свои особенности метаболизма. Так, например, считается, что мутации в митохондриальной ДНК происходят примерно в 100 раз чаще, чем в ядерной.
МтДНК содержит немногим более 16000 нуклеотидов («букв», которыми написан текст мтДНК). Каждому из них присвоен номер, определяющий его место — позицию — в тексте. В митохондриальной ДНК можно выделить два типа участков.
Первый — участки, кодирующие митохондриальные белки; они составляют основную часть (более 15000 нуклеотидов) мтДНК. В этих участках мутации редки — то есть случайные ошибки при передаче текста, когда какая-то «буква» вдруг заменяется другой, встречаются редко, поскольку отсеиваются отбором.
Однако известно довольно много позиций (определённых мест в пронумерованной последовательности нуклеотидов мтДНК), в которых у разных людей может находиться не строго определённый, а тот или иной нуклеотид. В основном они находятся в некодирующей части мтДНК. Считается, что большинство этих мутаций произошли за историю человечества лишь однажды, и поэтому все люди, имеющие данную мутацию, являются между собой более или менее близкими родственниками по материнской линии. Во всяком случае, они связаны более тесным родством, чем те, у кого нет данной мутации.
ГАПЛОГРУППЫ. Нужно оговориться, что повторные мутации в той же позиции изредка все-таки случаются. Поэтому отдельно взятая мутация в мтДНК может и не быть свидетельством общего происхождения, а произойти независимо. Надежное определение родства молекул мтДНК проводится по наличию не одной, а нескольких общих мутаций (как в кодирующей, так и в некодирующей частях мтДНК). Сочетание мутаций однозначно определяет гаплогруппу — т. е. совокупность («линию») митохондриальных ДНК, имеющих общую предковую форму. Однако индивидуумы, молекулы митохондриальной ДНК которых относятся к одной и той же гаплогруппе (т. е. имеющих одинаковые нуклеотиды в позициях, «диагностирующих» гаплогруппу) могут различаться по другим участкам, в частности, гипервариабель-ным сегментам.
ГАПЛОТИПЫ. Два таких участка (гипервариабельный сегмент 1 и гипервариабельный сегмент 2 — ГВС1 и ГВС2) представляют оставшуюся часть митохондриальной ДНК. Эта часть мтДНК не кодирует белки, в отличие от основной «кодирующей части». Каждый из этих сегментов состоит примерно из 400 нуклеотидов. Если при изучении кодирующей части обычно проверяются выборочно только несколько нуклеотидов[39], характерных для той или иной гаплогруппы, то при анализе ГВС1 проводится прямое «секвенирование» — определяется, какой именно нуклеотид расположен в каждой из 400 позиций этого сегмента. Иными словами, анализируются не несколько, а все 400 ДНК маркёров ГВС1. Данные по ГВС1 позволяют выделить не несколько гаплогрупп, а огромное множество вариантов мтДНК (гаплотипов). То есть каждую гаплогруппу можно подразделить на субгаплогруппы, а их — на целый ряд гаплотипов. Это многократно повышает разрешающую возможность анализа, в том числе определения возраста гаплогрупп.
Скорость накопления мутаций в некодирующих участках намного выше, чем в кодирующей части (поэтому они и называются гипервариабельными), — здесь одни и те же мутации часто возникают независимо, многократно. Поэтому точная классификация типов митохондриальной ДНК (гаплотипов) производится в два этапа: сначала для данной линии определяется принадлежность к той или иной гаплогруппе (на основании изучения кодирующей части), а затем точное систематическое положение внутри гаплогруппы (по ГВС1). Обычно кодирующую часть «смотрят» лишь на несколько ключевых мутаций, а для определения субгаплогруппы и гаплотипа привлекаются данные по ГВС1.
ФИЛОГЕОГРАФИЯ. Зная достаточное количество сочетаний мутаций в ГВС1, встреченных в популяции, можно с большой долей вероятности определить порядок возникновения этих мутаций во времени и, соответственно, составить «родословное древо» для гаплотипов митохондриальной ДНК. Это древо обычно представляется в виде так называемой медианной сети, которая отличается от обычной дендрограммы тем, что отдельные ветви могут сливаться друг с другом. Такое слияние ветвей указывает, что нам пока неизвестно, шло ли развитие по одному, другому, или обоим направлениям, но наличие какого-либо третьего пути маловероятно.
Установление такой филогенетической классификации митохондриальной ДНК имеет большое значение для популяционных работ, поскольку позволяет оценить число произошедших мутационных событий и, при ряде допущений об их скорости, вычислить время, прошедшее с момента возникновения данной гаплогруппы (ветви родословного древа мтДНК).
Подобно тому, как знание времени чеканки монеты, обнаруженной в археологическом памятнике, может помочь датировать памятник, так и знание времени возникновения гаплогруппы, обнаруженной в популяции, может способствовать лучшему пониманию истории популяции.
В обоих случаях, мы не знаем точной датировки популяции или археологического памятника (ведь монета или гаплогруппа могли бережно храниться и передаваться в долгой чреде поколений, с незапамятных времен). Но мы точно знаем, что памятник возник позднее, чем время, выбитое на монете. Поэтому, когда мы слышим, что датировки мтДНК восточных славян составляют 30 тысяч лет, не стоит гордиться, что славяне уже 30 тысяч лет существуют на свете. Это лишь означает, что славяне появились позднее, чем 30 тысяч лет назад (а когда именно — по-прежнему неизвестно). Насколько ценна такая информация, можно спорить. Но если с ней умело обращаться, то она может помочь установить, что одни древние популяции древнее других.
Изучив мтДНК, можно с высокой достоверностью определить эволюционные соотношения всех гаплотипов — как представленных в современном генофонде, так и отсутствующие «промежуточные формы». Это позволяет реконструировать процесс возникновения гаплотипов, локализовать во времени и в пространстве происхождение каждой конкретной гаплогруппы мтДНК. Эта область исследований получила название филогеографии. Сопоставление современного ареала гаплогруппы с древней зоной её возникновения открывает путь к прослеживанию миграций населения, а также иных событий демографической и этнической истории (сокращения численности и «экспансии», подразделение популяции, особенностей брачной структуры и других).
ДВА МАСШТАБА АНАЛИЗА. Изменчивость «митохондриального генофонда» можно изучать в двух «масштабах».
Первый — масштаб гаплогрупп. Обычно рассматривают распределение гаплогрупп по территории, сравнивают частоты гаплогрупп в разных популяциях, в том числе методами многомерного анализа: главных компонент, многомерного шкалирования, кластерного анализа.
Второй — масштаб гаплотипов. Он позволяет проводить более тонкий анализ. Здесь можно определить уровень гаплотипического разнообразия, сравнить спектр (набор) гаплотипов, встреченных в разных популяциях.
Своеобразный промежуточный уровень — разнообразие гаплотипов в пределах конкретной гаплогруппы. Зная величину разнообразия гаплотипов, можно рассчитать время, за которое это разнообразие могло накопиться в ходе мутационного процесса, то есть время, прошедшее с момента возникновения гаплогруппы.
В § 2 и § 3 мы проведём анализ в масштабе гаплогрупп, а затем перейдём к масштабу гаплотипов (§ 4 и § 5).
Русский народ — самый многочисленный в Европе и занимает самый большой ареал. Поэтому от его митохондриального генофонда можно ожидать значительного разнообразия. Мы видели (главы 2, 4) что вклад тех ли иных антропологических пластов различен в разных регионах. Поэтому данные по генетике «одиноких» русских популяций отражают лишь один из фрагментов генофонда и не могут дать характеристику русского народа в целом. А значит, необходимо изучить полиморфизм мтДНК во многих регионах, на всей обширной территории «исконного» ареала русского народа.
ИСТОРИЯ ИЗУЧЕНИЯ
Самые первые данные о мтДНК в русских популяциях появились давно [Лемза, Соколова, 1992; Петрищев, Кутуева, 1993; Казаковцева и др., 1998], но из-за методических различий (тогда типировались лишь немногие ПДРФ маркёры) они мало приложимы к современным исследованиям.
В работе [Orekhov et al., 1999] впервые были представлены данные о полиморфизме гипервариабельного сегмента мтДНК у русских — суммарно 103 человека из Костромской, Курской и Рязанской областей. К сожалению, в статье не указано, к какой из популяций относится каждый гаплотип. Поэтому сейчас, когда имеются данные по многим региональным популяциям, эти самые первые данные, как ни грустно, приходится оставлять за бортом нашего анализа генофонда. Для нас это яркий пример того, насколько важно при начале работы уделять внимание формированию выборок, а при её завершении — возможно полной публикации исходных данных и популяционных сведений о них. Несомненно, что при своем появлении, на фоне практически полного отсутствия данных по российским популяциям, эта работа была своевременной. Но если бы для каждого из гаплотипов была дана «привязка» к географически конкретным популяциям и по каждой популяции выборка была бы достаточна, то эта статья не потеряла бы своего значения и сейчас.
К настоящему времени в работах Б. А. Малярчука опубликованы данные по шести[40] русским популяциям со средним размером выборки N=66 [Малярчук и др., 2001, 2002]. В этих статьях представлены результаты ПДРФ анализа кодирующей части мтДНК для всех шести популяций, тогда как данные по сиквенсу ГВС1 опубликованы в отдельной статье для трёх из этих популяций. Соответственно, для трёх других популяций гаплогруппы определены с тем уровнем разрешения, который легко достигается с помощью небольшого числа ПДРФ маркёров. Этот уровень заметно ниже того, который достигается при комбинации информации ПДРФ и ГВС1. Отсутствие подразделения гаплогруппы U на субгаплогруппы в этих статьях особенно затрудняет их использование. Данные по трём из этих популяций опубликованы также в [Malyarchuk et al., 2002] где проведён анализ как ПДРФ, так и ГВС1. Правда, в статье не была указана принадлежность конкретных гаплотипов к той или иной популяции. Авторы благодарны Б. А. Малярчуку, предоставившему им такую информацию. Она позволила определить гаплогруппы с общепринятым уровнем разрешения, и эти данные использованы в § 5 для графика многомерного шкалирования.
Также имеются данные по русскому населению Ростовской области [Richards et al., 2000; Генофонд и геногеография…Т.2, 2003].
Северная популяция (Каргополь, N=76) изучена в работе [Belyaeva et al., 2003] и по ГВС1, и по ПДРФ кодирующей части. Авторы руководили сбором экспедиционных образцов в этой популяции, поэтому на эту выборку мы полагаемся уверенно.
Авторы этой книги, совместно с Эстонским биоцентром, возглавляемым Р. Виллемсом, также предприняли изучение полиморфизма мтДНК в пяти русских популяциях (средний объём выборки N=130). Все экспедиции были проведены коллективом под руководством Е. В. Балановской. Обследование северо-восточной (Архангельская область) и восточной (Костромская область) популяций проведено авторами книги. При работе в западной популяции (Смоленская область) нам помогали А. С. Пшеничное и Н. Н. Аболмасов. Обследование южных популяций проведено нашими коллегами из этих регионов: кубанских казаков — Э. А. Почешховой, а в Белгородской области сотрудниками М. И. Чурносова. Все экспедиции проведены по единому плану и с соблюдением строгих требований к формированию выборки. Все генотипирование мтДНК проведено О. П. Балановским на базе Эстонского биоцентра. Изучен как полиморфизм ГВС1, так и ПДРФ анализ кодирующей части мтДНК. Эти данные будут опубликованы в ближайшее время, и анализируются в данной книге.
В литературе имеются ещё данные по русскому населению Магадана, Башкирии, Томска и Новосибирска. Однако эти популяции находятся далеко за пределами «исконного» русского ареала, и потому здесь не рассматриваются.
ДАЛЬНЕВОСТОЧНЫЕ СЛАВЯНЕ
Конечно, такой подход изучения — только коренного населения на его «исконном» ареале — хотя и служит краеугольным камнем нашей книги, но не бесспорен. Можно предположить, что популяция «дальневосточных славян» (русские и украинцы Магадана, как пишут изучавшие их авторы, «происходящие из различных регионов бывшего СССР» [Malyarchuk, Derenko, 2001]) представляет не меньший интерес, чем популяции восточных славян. Действительно, «неинтересность» дальневосточных славян объясняется лишь тем, что эта популяция сформировалась всего несколько десятков лет назад и представляет собой сборную группу людей, происходящих из самых различных частей СССР. Но ведь тысячу лет назад восточнославянское население Волго-Окского междуречья также, по всей видимости, являлось чрезвычайно молодым образованием, сотканным из переселенцев из самых различных, более западных областей Киевской Руси. Почему же тогда мы считаем генофонд восточных славян интереснейшим объектом, а дальневосточных славян оставляем за бортом исследования? Неужели дело лишь в очаровании древности?
На этот вопрос не так просто ответить — особенно потому, что перед очарованием древности, и вправду, нам устоять нелегко. Но дело все же в другом. Сейчас, тысячу лет спустя, мы знаем, что восточные славяне Волго-Окского междуречья оставили многочисленное потомство, образовали устойчивые популяции и стали ядром русского народа, существующего уже в течение многих веков и широко расселившегося — вплоть до Дальнего Востока.
А вот какова дальнейшая судьба дальневосточных славян? Сформируется ли на их основе устойчивая в поколениях популяция? Или уже через несколько лет в тех местах будут жить новые мигранты, а нынешнее население, или их дети, будут населять другие города и страны? Неизвестно. Но очень велика вероятность второго исхода! А в таком случае генетически изученная популяция уже через несколько лет после её изучения перестаёт существовать, и опубликованные данные перестают соотноситься с каким-либо генофондом. Напротив, данные по устойчивой популяции продолжают адекватно описывать её генофонд и по прошествии нескольких поколений. Именно поэтому (этот вопрос рассматривается в главе 7 и в Приложении) мы изучаем лишь «истинные» популяции, одним из критериев которых является их устойчивость в чреде поколений и заключение не менее 50 % браков внутри популяции. И именно поэтому каждый народ изучается на его «исконной» территории — там, где в течение веков формировался генетический портрет этого народа, какая бы судьба его не постигла далее (он колонизировал или его колонизировали).
ВЫБОРКИ
В популяциях, обследованных нашим коллективом, мы всегда стремились к тому, чтобы размер выборки составил около 150 человек — в два раза больше, чем принятый для анализа аутосомных маркёров. Увеличение выборки необходимо, чтобы компенсировать гаплоидность мтДНК[41] и возможно более полно охватить разнообразие гаплотипов[42]. Обследовались группы деревень или небольшие города вдали от магистралей — с целью избежать влияния недавних миграций. Письменное информированное согласие было получено от каждого из обследованных. Все четверо бабушек и дедушек обследованных были рождены в пределах ареала данной популяции. На практике это означает, что у подавляющего большинства обследованных все их предки происходили из того административного района данной области, в котором проводилось экспедиционное изучение. Остальные генеалогические линии обследованных ведут к соседним районам той же области. Таким образом, благодаря тщательному анкетированию обследованных людей, собранные выборки действительно репрезентативно представляют коренное население изученных регионов.
Аналогично собрана и выборка русских Каргополя — оба автора принимали деятельное участие в работе этой экспедиции.
Что же касается популяций, обследованных Б. А. Малярчуком, то требования при формировании выборок были менее строгими: обследование проводилось на базе областных больниц и станций переливания крови, изучалось население крупных городов, и основное внимание было уделено русской национальности и месту рождения обследованных и их матерей [Малярчук, Деренко, 2004]. То есть анкетирование проводилось до второго, а не третьего поколения, как в наших выборках. И единицей обследования выступала область, а не район (меньшая географическая точность).
Эти методические различия могут иметь важное следствие: результаты недавних (происходивших в XX веке) миграций могут намного сильнее проявляться в данных Б. А. Малярчука. Тем самым эти данные могут в большей мере представлять смешанное (а не коренное) русское население, проживающее в изученных регионах. Это необходимо иметь в виду при интерпретации практически всех результатов, поэтому при каждом виде анализа мы оговариваем, данные по каким именно выборкам были использованы. В § 3 мы ещё раз вернемся к этому вопросу.
АНАЛИЗИРУЕМЫЕ ПОПУЛЯЦИИ
В таблицах 6.2.1. и 6.2.2. указаны все выше перечисленные популяции.
Можно видеть, что изучены различные региональные группы, которые охватывают практически весь «исконный» русский ареал. Из них семь популяций (Каргополь, Пинега, Унжа, Смоленск,
Белгород, кубанские казаки, юго-восточные русские) представлены качественными выборками, тогда как данные по остальным популяциям, как только что описывалось, по тем или иным параметрам не подходят для геногеографического анализа. Поэтому основной анализ выполнен по семи перечисленным популяциям.
Это число популяций, к сожалению, недостаточно для проведения картографического анализа. Но оно позволяет набросать митохондриальный портрет русского населения, выявить особенности региональных популяций, оценить межпопуляцион-ную изменчивость в пределах русского генофонда.
Таблица 6.2.1.
Русские популяции, изученные по маркёрам митохондриальной ДНК.
Таблица 6.2.2.
Данные по митохондриальной ДНК и Y хромосоме в русских популяциях, опубликованные за время подготовки книги к печати.
Анализ изменчивости и антропологических, и классических генетических маркёров мы начинали с «простых» карт отдельных признаков (главы 4, 5). Но для мтДНК количество изученных популяций пока недостаточно для картографирования. Слишком схематичны и неточны были бы карты, построенные всего по семи популяциям. Поэтому мы решили попробовать пока без карт уловить тенденции в географическом распределении гаплогрупп.
И основной тенденцией вновь оказалась широтная изменчивость, которая столь ярко проявилась при анализе классических маркёров и антропологических признаков (главы 4, 5): деление русского ареала на север и юг.
ГАПЛОГРУППА Н
Частота этой «европейской» гаплогруппы варьирует в русских популяциях в широких пределах. Она резко падает с севера на юг: от почти 50 % в Архангельской области до 35–40 % у южных русских, при промежуточных частотах в центре ареала. Снижение частоты гаплогруппы Н к югу характерно и для населения Европы в целом.
ГАПЛОГРУППЫ I. UL U2. U3. X
Эти гаплогруппы встречены только в южной половине русского ареала, причём практически в каждой изученной популяции, но при этом отсутствуют в северных популяциях (Пинега, Каргополь). Конечно, это отсутствие временное — при дальнейшем увеличении выборок эти гаплогруппы скорее всего обнаружатся и на севере, но можно полагать, что их частоты будут намного ниже, чем на юге. Все эти пять гаплогрупп редкие: средняя частота у русских 1–2%.
ГАПЛОГРУППЫ К. R. Т. U5A. U5B
Эти гаплогруппы более частые и встречены повсеместно. Но и для них частоты на севере и на юге различны: гаплогруппы К, R и U5b встречаются на Русском Севере несколько чаще, а Т и U5a — реже, чем в остальных русских популяциях.
ВОСТОЧНО-ЕВРАЗИЙСКИЕ ГАПЛОГРУППЫ А. С. D. Z
Любопытно распределение восточно-евразийских гаплогрупп. Этот термин обозначает гаплогруппы, основная зона распространения которых — Восточная и Центральная Азия (раздел 9.2.). Поэтому восточноевразийские гаплогруппы могли бы маркировать монголоидный вклад в генофонд. Когда мы рассматриваем не только русские, а все популяции Восточной Европы, то география восточно-евразийских гаплогрупп очень четкая — каждая из гаплогрупп чаще встречается на востоке региона (глава 8). Что же касается русских популяций, то такого тренда мы у них не видим: восточно-евразийские гаплогруппы встречаются в них хотя и с низкой частотой, но повсеместно. Уже не первый раз в этой книге мы сталкиваемся с тем, что распределение генов в русском ареале отнюдь не следует закономерностям, которые выявлены в глобальном масштабе.
Суммарная частота всех восточно-евразийских гаплогрупп в русских популяциях (2.2 %) практически так же низка, как и в населении Западной Европы (например, в популяциях французов в среднем 0.5 %). При этом в популяциях Восточной Азии эти гаплогруппы доминируют, составляя 85-100 % от всех гаплогрупп у монголов, китайцев, эскимосов. Таким образом, данные по митохондриальной ДНК указывают на отсутствие сколько-нибудь значительного монголоидного пласта в русском генофонде.
Впрочем, хотя для отдельных восточно-евразийских гаплогрупп в русском ареале тренды не обнаруживаются, их суммарная частота может оказаться информативным показателем. Хотя она для русских и невелика (2.2 %), но прослеживается тенденция её некоторого увеличения к востоку. Так, в восточной русской популяции (Унжа) суммарная частота восточно-евразийских гаплогрупп — 3.8 %. На северо-востоке русского ареала (Пинега) суммарная частота ещё чуть выше — 6.2 %, правда, она возрастает только за счет одного очень специфичного варианта гаплогруппы D, частота которого достигает 5.6 % и который связан скорее с севером Европы, чем с Азией (см. ниже «Пенеги»). Так что высокая доля восточно-евразийских гаплогрупп в этих двух восточных русских популяциях может быть связана с особенностями самого древнего пласта генофонда на Русском Севере. К тому же выборка Унжи невелика. Так что только дополнительные детальные исследования смогут показать, есть ли хоть сколько-нибудь реальное повышение частот восточно-евразийских гаплогрупп у восточных русских.
ПЕНЕГИ
Эта пинежская популяция вообще наиболее своеобразна: здесь не обнаружены гаплогруппы V, X и U5a, тогда как U5b присутствует с частотой в два раза выше, чем в других русских популяциях. Последняя черта могла бы сближать эту популяцию с саамами (генофонд которых представлен в основном лишь двумя гаплогруппами — U5b и V), но «саамская» гаплогруппа V отсутствует в популяции пенегов.
Северно-русская популяция в верховьях р. Пинеги обследована нами в 2001 г. Экспедиция была проведена как комплексная: она включала и сбор образцов крови для анализа ДНК и классических маркёров; и сбор генетико-демографической информации; и сбор данных о квазигенетических маркёрах (фамилии); и антропологическое обследование (расовая программа и антропологическая фотография). Антропологический раздел осуществляли акад. Т. И. Алексеева и к.б.н. А. Г. Новожилов.
Освоение Русского Севера является одной из вех в этногенезе русского народа. Особое внимание привлекают те группы, где предполагается значительное влияние субстратного дославянского населения. К ним относится и данная популяция, расположенная на северо-востоке Архангельской области на самой границе с республикой Коми. Нами был обследован ряд сельсоветов Пи-нежского района — Нюхченский, Сосновский, Сурский, Ново-Лавелевский — тянущиеся лентой вдоль Пинеги.
Результаты антропологического анализа показали, что население данной популяции близко не к субстратному населению восточных финно-угров, а к старожильческому русскому населению: выявленный антропологический тип полностью соответствует размаху изменчивости северного русского типа [Алексеева и др., в печати]. Население является высокорослым, с ярко выраженными чертами европеоидного типа, выраженной горизонтальной профилировкой лица, повышенным процентом светло-голубых глаз (№ 10–11) и русых волос, сильно выступающим носом. В целом, этот тип отражает влияние не низовской (Ростово-Суздальской) колонизации Русского Севера, а влияние более ранней северо-западной (Новгородской) русской колонизации и, возможно, балтского компонента. Но не исключено и влияние западных финно-угров, расселившихся на Пинеге до прихода сюда и славян, и коми («Сура поганая» русских источников).
Итак, по антропологическим данным пинежская популяция сближается с более западными популяциями. Что же показывает мтДНК? В таблице 6.2.3. приведены генетические расстояния от пинежской популяции до тех популяций Европы, с которыми могло быть связано её происхождение.
1) Малые генетические расстояния (менее 0.05). Наиболее сходным население Пинеги оказывается с другой северной русской популяцией (Каргополь). Также пинежские русские генетически сходны с немцами (!), литовцами и поляками, то есть очерчивается круг популяций, расположенных намного западнее, чем сама Пинега.
2) Средние генетические расстояния (0.05-0.07).
Популяции, среднеудаленные от Пинеги, охватывают широкий круг славянских популяций (русские, украинцы, чехи), а также одну балтскую (латыши) и одну западную финно-угорскую популяцию (эстонцы).
3) Большие генетические расстояния (более 0.07). Популяции, генетически значительно отличающиеся от пинежских русских — в основном финно-угорские (карелы, финны, коми). Особенно удивляет отличие пинежской популяции от соседних коми. В момент обследования население по Пинеге имело столь тесные контакты с республикой Коми, что предпочитало работать вахтовым методом там, а не в собственном районном центре (Карпогорах). Этнографические, культурные заимствования от коми в этих русских популяциях велики [Жеребцов, 1982], что подтверждает реальность долговременного контакта с коми. Но при этом по частотам гаплогрупп мтДНК пинежская популяция резко отличается от коми и вообще от финно-угорских популяций, и сближается с широким кругом балто-славянских популяций.
Таким образом, данные по мтДНК свидетельствуют, что пинежская популяция в целом генетически не связана с финно-угорским субстратом.
Такой результат стал для авторов неожиданностью, поскольку вся совокупность данных, рассматриваемых в этой книге, свидетельствует как раз о значительной или даже определяющей роли финно-угорского субстрата в формировании структуры русского генофонда. Данные по пинежской популяции (где, как мы видим, этот субстрат не выявляется) свидетельствуют, что эта популяция не укладывается в общую картину. А это, в свою очередь, говорит, что наша картина является слишком упрощённой, и нужны бы специальные усилия по приведению её в большее соответствие с ходом реального, сложного процесса смешения славянских и финно-угорских популяций.
Тем любопытнее, что те же данные по мтДНК, которые (в целом) показывают различия пинежской популяции и финно-угров, показывают их сходство в одной характерной частности. Речь идет о любопытном варианте гаплогруппы D с мотивом 126–136, который представлен на Пинеге двумя гаплотипами. Именно этот мотив был обнаружен и у саамов [Tambets et al., 2004]. Вообще, этот вариант гаплогруппы D географически приурочен к северу Восточной Европы — от финнов до северо-восточных русских и коми. Вполне возможно этот вариант маркирует древнюю общность генофонда на этой обширной территории.
Таблица 6.2.3.
Генетические расстояния от пинежской популяции (северо-восточные русские) до популяций Восточной и Центральной Европы
Мы рассмотрели изменчивость мтДНК русских популяций в географическом пространстве. Теперь рассмотрим положение русских популяций в генетическом пространстве. Наиболее полную картину даёт график многомерного шкалирования, показывающий генетические взаимоотношения популяций (рис. 6.2.1).
МЕТОД МНОГОМЕРНОГО ШКАЛИРОВАНИЯ
По частотам всех основных гаплогрупп рассчитаны генетические расстояния между всеми изученными русскими популяциями. Эту матрицу генетических расстояний мы уже использовали при сравнении пинежской популяции с соседями. В матрице содержится информация о генетическом сходстве между всеми возможными парами популяций. Метод многомерного шкалирования позволяет изобразить это сходство на графике. Каждая популяция изображается в виде точки. И расстояния между каждой парой точек соответствуют генетическому сходству между этой парой популяций. Чем больше популяций, тем сложнее изобразить их взаимное расположение на плоском графике. Метод многомерного шкалирования как раз и позволяет создать такой график с минимальным искажением.
График основан на частотах 12 гаплогрупп и показывает взаимное генетическое сходство 12 русских популяций (перечислены в табл. 6.2.1). Три из этих популяций (Краснодарская, Белгородская и Нижегородская) изучены только по ПДРФ маркёрам [Малярчук и др., 2001], поэтому для этих популяций нельзя подразделить гаплогруппу U. Для них можно определить частоты лишь сокращенного набора из 12 гаплогрупп: Н, V (в т. ч. Vpre), HV, I, J, К, Т, U, W, X, сумма восточно-евразийских гаплогрупп и «все прочие» гаплогруппы. Для сопоставимости, и остальные 9 популяций анализируются по этому сокращенному набору. По частотам гаплогрупп рассчитаны генетические расстояния Нея между каждой парой популяций. Полученная матрица генетических расстояний обрабатывалась в программе Statistica 6.0 методом многомерного шкалирования. Величины стресса (0.10), алиенации (0.13) и плавный вид диаграммы Шепарда свидетельствуют, что геометрическое расположение популяций на графике удовлетворительно описывает генетические расстояния между ними.
Рис. 6.2.1. График многомерного шкалирования русских популяций (по частотам 12 гаплогрупп мтДНК).
Обозначения приведены в тексте и в таблице 6.2.1.
КТО И ГДЕ В ГЕНЕТИЧЕСКОМ ПРОСТРАНСТВЕ?
На графике (рис. 6.2.7.), прежде всего бросается в глаза, что северные русские популяции (Пинега, Каргополь — обозначены на графике квадратами) размещаются в отдалении от основного кластера, в котором собрались практически все остальные русские популяции (кружки). Тем неожиданнее выглядит поведение самых южных русских популяций (обозначены треугольниками). Одна из них (Кубань) входит в основной кластер, а две прочих (Ставрополь и Краснодар) разлетелись в разные углы графика. Все три популяции (Краснодарского, Ставропольского краев и кубанские казаки Адыгеи, табл. 6.2.1.) представляют русское население Предкавказья, которое обычно рассматривается как единый южнорусский тип.
ОТ ЧЕГО РАЗЛЕТЕЛИСЬ ЮЖНЫЕ ПОПУЛЯЦИИ?
Столь разительные отличия между этими популяциями по маркёрам мтДНК, конечно, в какой-то степени могли бы быть вызваны смешением с соседними народами Кавказа, которые различаются между собой по спектру гаплогрупп. Но трудно представить, чтобы генофонд, к примеру, Краснодарского края определялся смешением именно с соседними коренными народами Северного Кавказа — слишком несоизмеримы численности населения. Тем более, что наши данные по аутосомным ДНК маркёрам показывают, что даже у кубанских казаков, издавна проживающих бок о бок с адыгами, не обнаруживается поток генов между этими популяциями! И данные по структуре браков Краснодарского края свидетельствуют, что обычно один из супругов происходит из далекого региона: Краснодарский край вбирает в себя мигрантов со всей России. Можно полагать, что такой тип брачной структуры относится не только к современности, но издавна характерен для русского населения южных регионов России [Наследственные болезни в популяциях…, 2002].
Такой «межрегиональный» характер браков должен был привести к максимальному сходству, а не к различиям южных популяций. Поэтому много более вероятно, что большие генетические различия связаны не с реальной структурой популяции, а с характером формирования выборок. Если часть обследованных не являлась в строгом смысле представителями коренного населения, то в выборке могли появиться гаплогруппы, необычные для южных русских популяций, и эти «залётные» гаплогруппы могли оказаться самыми разными в каждой из обследованных групп.
Рассмотрим, как частоты гаплогрупп в этих трёх популяциях отличаются от среднерусских частот (средних частот в популяциях, вошедших в основной кластер на рис. 6.2.1).
КРАСНОДАРСКАЯ ВЫБОРКА отличается повышенной частотой гаплогруппы J (18 % в Краснодарской популяции при среднерусской частоте 9 %) и сниженной частотой гаплогруппы U (10 % в Краснодарской популяции при среднерусской частоте 19 %). При этом частота гаплогруппы J у коренных народов Северного Кавказа (в среднем 8 %) вовсе не повышена, а близка к среднерусской. А частота гаплогруппы U у народов Северного Кавказа (25 %) отнюдь не ниже, а даже выше среднерусской (19 %). То есть отличия Краснодарской выборки от остальных русских популяций нельзя объяснить смешением с народами Кавказа. Остается предполагать, что в эту выборку попали представители каких-то третьих групп, или же своеобразных, нетипичных популяций.
СТАВРОПОЛЬСКАЯ ВЫБОРКА отличается от основного кластера русских популяций сниженной частотой гаплогруппы Н (35 % вместо 42 %) и повышенной частотой гаплогруппы X (8 % вместо 1 %). В данном случае смешение с местными северокавказскими популяциями отчасти могло сформировать такие частоты (средняя частота гаплогруппы Н на Северном Кавказе — 22 %). Хотя главную особенность Ставропольской выборки — совершенно необычную частоту X — трудно объяснить смешением, поскольку и на Северном Кавказе такая высокая частота X встречается лишь в немногих популяциях, а её средняя частота на Кавказе — 5 %. Чтобы объяснить высокую частоту X в русском населении Ставрополья, придётся предположить, что этот генофонд большей частью сформирован материнскими линиями не из Центральной или Южной России, а автохтонного кавказского населения, причём каких-то специфических групп. Очевидно, что такое предположение неправдоподобно. Вернее всего, что сам генофонд Ставропольского края вполне сходен со среднерусским, но конкретная рассматриваемая выборка плохо отражает генофонд Ставрополья. Впрочем, это легко можно будет проверить, когда появятся данные ещё по одной-двум русским популяциям из этого региона.
ВЫБОРКА КУБАНСКИХ КАЗАКОВ. Что же касается третьей популяции из Предкавказья — кубанских казаков (старожильческого русского населения Адыгеи), то эта популяция оказывается вполне «среднерусской». Ни по одной из гаплогрупп отклонения от среднерусских частот не превосходят 5 %. Поэтому и на графике она разместилась вблизи основного кластера русских популяций (рис. 6.2.1). А ведь именно в этой из трёх южных популяций и можно было ожидать максимального своеобразия — и вследствие большей давности их отделения от основной части русского генофонда, и вследствие их проживания вперемешку с коренным населением Северного Кавказа. В следующей главе мы покажем, сколь своеобразна эта популяция по данным о фамилиях. Поэтому близость кубанских казаков по мтДНК к среднерусским частотам лучше всего показывает истинное положение и других южных популяций в генетическом пространстве.
Небезынтересно, что как раз эта выборка кубанских казаков (наши данные) была собрана Э. А. Почешховой наиболее тщательно — собирались сведения о местах рождения родителей и бабушек-дедушек обследованных. Если рассматривать предков только по материнской линии, то выборка главным образом (60 %) состоит из уроженцев Майкопского района республики Адыгея, на 36 % — из уроженцев других районов Адыгеи и Краснодарского края и лишь оставшиеся 4 % бабушек со стороны матери происходят из Ростовской, Воронежской областей и Ставропольского края. Мы видим, что выборка, которая более чем на*95 % и на глубину трёх поколений представляет русское казачье население Краснодарского края, близка к общерусскому кластеру! А выборки, собранные менее тщательно в том же Краснодарском и в Ставропольском краях, располагаются весьма далеко от основного массива русских популяций.
Итак, необычные частоты гаплогрупп в Краснодарской и Ставропольской выборках задаются случайностями выборки, а не своеобычностью самой популяции. Третья — корректно сформированная — южная выборка оказалась близка к большинству русских популяций.
ВСЕГДА ЛИ ПОПУЛЯЦИИ РАЗЛЕТАЮТСЯ?
На графике (рис. 6.2.1) есть и другие примеры, когда из одного региона изучено несколько популяций. Например, две выборки из Белгородской области (Белгород 1 и Белгород 2), независимо собранные разными исследователями (см. табл. 6.2.1.) оказались генетически близки. Обе северно-русские популяции (Пинега и Каргополь) отличаются от основного кластера русских популяций повышенными частотами гаплогрупп Н, K, и U5b, сниженными частотами гаплогруппы U5a, и, по всей видимости, V. Важно, что эти обе северно-русские популяции на графике близки друг к другу. В противном случае их особенности можно было бы толковать как результат хаотического действия дрейфа генов. Однако трудно предположить, что дрейф, действуя на две популяции (разнесённые на 400 км!) сместил частоты одних и тех же гаплогрупп в одну и ту же сторону. Можно надеяться, мы имеем дело с реальным генетическим портретом населения Русского Севера.
ГЕТЕРОГЕННОСТЬ РУССКОГО ГЕНОФОНДА
Рассматривая «митохондриальный генофонд» русских популяций, надо количественно ответить на вопрос: какова гетерогенность русского генофонда? Велики или малы генетические различия между русскими популяциями по данным о мтДНК?
Средние генетические расстояния между семью русскими популяциями составили d=0.033. Это и есть оценка гетерогенности русского генофонда по мтДНК: величина различий русских популяций между собой.
МЕТОДИКА РАСЧЁТА. Для оценки различий использовались генетические расстояния Нея, рассчитанные в программе DJ, написанной Ю. А. Серегиным (программа представлена на нашем сайте www.genofond.ru). Исходные данные представлены частотами 21 гаплогруппы: Н; HV; HVpre; I; J; К; N1; R; Т; Ul; U2; U3; U4; U5a; U5b; U7; U8; V включая Vpre; W; X; а также суммой восточно-евразийских гаплогрупп А, В, С, D, G, Y. Мы рассчитали генетические расстояния между каждой парой русских популяций и величину средних генетических расстояний. Генетический смысл средних расстояний тот же, что и показателя межпопуляционной изменчивости GST — оба показателя оценивают размах различий между популяциями [Bodmer, Cavalli-Sforza, 1976].
ВЫБОРКИ РЕШАЮТ ВСЕ! (ИЛИ МНОГОЕ…)
Отметим, что если наша оценка дифференциации русских популяций по мтДНК составила d=0.033, то по данным Б. А. Малярчука она порядок ниже: d=0.002. По всей видимости, столь серьёзные расхождения возникли оттого, что в работе Б. А. Малярчука изучены популяции лишь из южной части русского ареала (Ставропольского и Краснодарского краев, Белгородской, Орловской, Саратовской и Нижегородской областей), тогда как в нашем исследовании юг и север, запад и восток представлены достаточно равномерно. По-видимому, межпопуляционные различия между южными популяциями действительно малы, что и было обнаружено Б.А. Малярчуком. Но, как мы видели (рис. 6.2.1), генетические различия между русским югом и русским севером по мтДНК очень велики и они определяют большую изменчивость русского генофонда в целом.
В работе [Малярчук, Деренко, 2004] приведён показатель дифференциации F, который по частотам 29 гаплогрупп составил FST=-0.0006, а по частотам гаплотипов ГВС1 FST=-0.0016. Авторы сделали вывод: «…Полученные результаты свидетельствуют об отсутствии генетической подразделённости по митохондриальным линиям между изученными популяциями русского населения...». Тем удивительнее полученная нами высокая оценка гетерогенности. Ведь FST с небольшой долей огрубления можно приравнять к использованному нами показателю — средним генетическим расстояниям (выше мы говорили о сходстве расстояний с третьим показателем — GST очень близким к FST).
Этот пример показывает, насколько важен охват самых различных частей ареала. Иначе легко сделать выводы, верные лишь для фрагмента ареала. Отметим, что в одной из недавних работ Б. А. Малярчук (с учетом новых полученных им данных по более широкому кругу популяций) оценил дифференциацию русского генофонда как значительную [Malyarchuk et al., 2004].
РУССКИЙ ГЕНОФОНД НА ФОНЕ НАРОДОВ ЕВРОПЫ
Имеющиеся данные показывают, что гетерогенность других европейских народов по мтДНК значительно меньше. Гетерогенность мтДНК русского генофонда по своему размаху соответствует скорее гетерогенности не отдельных европейских народов, а целых регионов Европы. Например, рассчитанные нами различия по мтДНК между всеми локальными популяциями в пределах Балканского региона составили ту же величину (d=0.033), что и различия между всеми русскими популяциями, а различия между локальными популяциями всей Западной Европы (от Испании до Скандинавии) лишь ненамного выше (d=0.041).
ИТОГИ
Итак, мы рассмотрели расположение в генетическом пространстве мтДНК всех двенадцати русских популяций, изученных к настоящему времени. Большинство популяций, независимо от своего географического положения, формируют единый кластер в генетическом пространстве. Особое положение занимают северные русские популяции, что, вероятно, отражает реальные особенности генофонда Русского Севера. Что же касается двух южных «разлетевшихся» популяций, то их поведение, по-видимому, зависит лишь от случайностей формирования этих выборок.
Средние генетические расстояния между всеми русскими популяциями (d=0.033) свидетельствуют о высокой гетерогенности русского генофонда на общеевропейском фоне.
Таковы основные итоги обобщенного анализа мтДНК на уровне гаплогрупп. Остаток «митохондриального» раздела данной главы мы посвятим анализу в другом масштабе — гаплотипов.
ЖИАИ-БЫАИ ИЗОАЫ И МИГРЫ…
В конце палеолита племя изолов укрылось в кольце непроходимых гор. Прошли тысячелетия, но эта популяция сохранилась в полной изоляции. На их высокогорном плато нет природных барьеров и велика подвижность населения — они охотники и скотоводы. Эти особенности образа жизни не позволили изолам разделиться на устойчивые подгруппы. В результате все изолы имеют примерно равные шансы вступить в брак друг с другом (рис. 6.2.2).
Рис. 6.2.2. Ареалы изолов (изолированная бесструктурная популяция) и мигров (подразделённая популяция)
А рядом с изолами — по ту сторону гор — в исторически недавнее время поселились мигры (рис. 6.2.2). Численность мигров и изолов одинакова. Но народ мигров составился из четырех разных племен, подобранных ими на долгом пути миграции. Так мигры и расселились — каждое племя в своей долине. Основная доля браков заключается в пределах племени. Но по большим праздникам устраиваются всеобщие ярмарки, где порой заключаются и межплеменные браки, и браки с другими народами.
Итак, народ мигров — подразделённая популяция, образовавшаяся совсем недавно.
Изолы — бесструктурная (панмиксная) и очень древняя популяция.
Изолы произошли от палеолитической популяции, имевшей лишь несколько древних гаплотипов мтДНК. С течением времени благодаря мутациям возникали все новые гаплотипы, нарастали молодые побеги родословного древа гаплотипов. Росло генетическое разнообразие внутри популяции. Так действовали мутации. Но второй, более мощный фактор — дрейф генов — это разнообразие уменьшал, случайно оставляя лишь малую часть гаплотипов, не считаясь с тем, новорожденные эти гаплотипы или очень древние. Но эти редкие случайно «выжившие» гаплотипы встречаются с высокой частотой, и вновь частота их может не зависеть от того, новорожденные эти гаплотипы или очень древние. Ведь дрейф работает «вслепую», безответственно и неотразимо, не считаясь с родословными.
Мигры же, собрав по пути множество гаплотипов, принесли их на свою новую родину. С тех пор прошло всего несколько поколений, и новые гаплотипы ещё не возникли. Зато племена мигров по-прежнему открыты внешним миграциям, пополняющим разнообразие гаплотипов.
РАЗНЫЕ ИТОГИ ДРЕЙФА У ИЗОЛОВ И МИГРОВ
Ни изолы, ни мигры не могут избежать действия дрейфа генов, истребляющего, один за другим, гаплотипы из их популяций. То, что дрейф именно так поступает с редкими генами, популяционная генетика открыла очень рано, и это стало хрестоматийным примером.
Причём тогда генетики работали с аутосомными генами, а не с мтДНК. Это важное различие: ведь мтДНК, во-первых, гаплоидна (не две, как для аутосомных генов, а только одна копия на геном человека), а во-вторых, передаётся только от половины родителей (от матерей). Перемножая эти величины, получаем, что число митохондриальных ДНК, переданных следующему поколению, в четыре раза меньше, чем для любого аутосомного гена. Поэтому дрейф действует на мтДНК примерно в четыре раза сильнее, эффективнее пропалывая гаплотипы.
Но дрейф по-разному действует на изолов и на мигров.
В панмиксной популяции изолов действие дрейфа непоправимо: исчезнувший гаплотип никогда не вернется.
А в подразделённой популяции мигров гаплотип, исчезнувший в одном из племен, может снова прийти из другого племени. Вероятность того, что этот гаплотип независимо исчезнет во всех четырех племенах, мала. Случайное уменьшение частоты в одной из частей подразделённой популяции может компенсироваться её случайным увеличением в другой, и в результате средняя частота у мигров более устойчива. Это явление стабильности подразделённой популяции описано во многих работах и подробно рассмотрено в Приложении.
МУХИ. Наиболее прямые доказательства устойчивости подразделённых популяций к дрейфу генов получены в известных работах Юрия Петровича Алтухова и Елены Юрьевны Победоносцевой, которые провели прямой эксперимент на дрозофиле. Мухи были расселены по отсекам популяционного ящика и обменивались генами точно так, как мы предположили для мигров — равная численность в отсеках, равновероятный обмен между отсеками, но основная часть скрещиваний происходит в отсеке. Исходная частота гена была 0.5 и оставалась практически неизменной: в течение 80 поколений варьировала от 0.6 до 0.4. (см. Приложение).
Другой ящик тех же мух, с той же общей численностью и в тех же условиях, но с полной свободой скрещивания, — моделирует панмиксную популяцию изолов. В ней — за то же время — частота гена упала от 0.6 до 0.1 и этот ген легко может быть потерян. Итак, подразделённая популяция устойчива и хранит генетическую память. А панмиксная — нет. Мы убедились, что они эволюционируют с разной скоростью.
ЛЮДИ. Конечно, история изолов и мигров сложнее этого эксперимента. В ней случались и засухи, и эпидемии, и войны. Порою численность увеличивалась, а потом резко падала. Это приводило к эффекту «бутылочного горлышка». Для генетической памяти мигров угроза невелика — подразделённая популяция об-ладаёт особым свойством репарации. Пусть даже одно из племен полностью исчезнет, средние частоты народа в целом изменятся незначительно. А на ареал исчезнувшего племени вернутся их отдалённые потомки — дети от межплеменных браков (земля предков всегда манит потомков). И тогда генофонд исчезнувшего племени будет отчасти восстановлен. Однако для генетической памяти панмиксной популяции изолов эффект «бутылочного горлышка» очень опасен, даже если численность потом восстановилась. При колебаниях численности дрейф генов действует ещё разрушительнее, так как средний по всем долгим поколениям эффективный размер популяции Ne близок к «диаметру бутылочного горлышка», а дрейф генов целиком и полностью зависит от эффективного размера популяции (см. Приложение).
ИЗУЧАЕМ ИЗОЛОВ И МИГРОВ… И ДЕЛАЕМ НЕВЕРНЫЕ ВЫВОДЫ!
Какие же результаты получим мы, изучив современных изолов? Дрейф генов приведёт к потере большинства гаплотипов — как древних, так и новых мутаций. То, какие именно гаплотипы мтДНК или Y хромосомы будут утеряны, — зависит от чистой случайности. Следовательно, от неё зависят и наши выводы.
Если уцелеет группа гаплотипов, несущих общую позднюю мутацию, — мы сделаем вывод о чрезвычайной молодости изолов. Если уцелеют две разные группы гаплотипов — мы сделаем вывод о смешении двух разных народов. И это когда перед нами самый древний в мире народ — прямой потомок палеолита, который за 20 тысяч лет своей истории не принял ни одного чужеродного гена!
А что же мигры? Популяция мигров, благодаря подразделённости, сохраняет феерическое разнообразие гаплотипов. Это именно та картина, которую представляла бы древнейшая популяция изолов, если бы на них не действовал дрейф. То есть мигры предстанут перед исследователем блестящей имитацией древней популяции.
Итог изучения мтДНК может быть таким: мигры — древнейшее коренное население края, а изолы — недавняя миграция неизвестно откуда. То есть прямая противоположность реальной истории.
В ЧЁМ ЖЕ ОШИБКА?
И эту злую шутку сыграло с нами игнорирование структуры популяций. Несомненно, в генофонде и изолов, и мигров записана их история. Но эти записи, переписываемые в каждом поколении, могут искажаться. У популяции есть генетическая память. Но подразделённые мигры имитируют чужую память, а панмиксные изолы свою память утратили.
В древних китайских хрониках о варварах говорилось, что они не помнят прошлого, не думают о будущем. И применительно к генофонду, его «цивилизованность» (твёрдая генетическая память) или «варварство» (её отсутствие) оказываются тесно связанными с подразделённостью популяции, её структурой.
СКАЗОЧНЫЕ УРОКИ
Эта сказка показывает, что для интерпретации результатов изучения мтДНК недостаточно представления о том, что разнообразие гаплотипов в популяции, благодаря мутациям, увеличивается с ходом времени. Для правильной интерпретации необходимо также знать: какова структура популяции? является ли популяция коренной? а если смешанной и пришлой, то где и как она формировалась? могла ли сохраниться генетическая память?
Миновав Элевсин и приближаясь уже к долине реки Кефиса в Аттике, Тесей пришёл к разбойнику Дамасту, которого называли обыкновенно Прокрустом… Прокруст, легендарный разбойник, имел ложе, в которое укладывал свои жертвы: если их рост был меньше длины ложа, он их растягивал, если больше — отрубал лишнее.
Дальше им пришлось миновать пролив, по одну сторону которого подстерегала корабли ужасная Харибда, а по другую — чудовищная Сцилла. Харибда выглядела подобно водовороту, втягивавшему в пасть воду вместе с кораблями. Сцилла же была некогда прекрасной девой, и злая Кирка, завидуя ей, превратила её в страшилище с шестью собачьими головами и двенадцатью ногами. Одиссей направил корабль мимо последней, решив пожертвовать шестью спутниками, так как понимал, что Харибда проглотит корабль целиком.
ЧТО ТАКОЕ ГАПЛОТИПЫ?
Мы понимаем под гаплотипом вариант мтДНК, который можно отличить от других таких же вариантов — неважно, различаются они по ГВС1 или же по ПДРФ маркёрам кодирующей части. Среди изученных нами 650 индивидуумов из исторического ареала русского народа выявлено 283 различных гаплотипа. Если добавить к ним все опубликованные и архивные данные по русским, то общая выборка составит 1584 образцов, а число гаплотипов в ней — 628. Это одна из самых больших выборок по мтДНК среди всех народов мира.
ВОЗМОЖНОСТИ ГАПЛОТИПОВ
Огромное разнообразие гаплотипов придаёт сравнению популяций потенциально большую разрешающую способность. Ведь мы можем обнаружить как гаплотипы, общие между двумя популяциями, так и те гаплотипы, которые присутствуют только в одной из них. Можем рассмотреть, присутствует ли данный гапло-тип в смежных популяциях и в каких именно. И проведем мы такой анализ не по десятку признаков (как в случае аутосомных генов или гаплогрупп мтДНК), а по сотням разных признаков (гаплотипов мтДНК). Например, мы рассмотрим гаплотипы, встреченные у русских и у соседних народов. И те популяции, с которыми у русских выявится больше общих гаплотипов, сочтём наиболее родственными.
НЕНАСЫТНАЯ ХАРИБДА: А ВСЕ ЛИ ГАПЛОТИПЫ НАЙДЕНЫ?
Несомненно, в русском населении существует некое конечное число гаплотипов. И при достаточно большой выборке они могут быть описаны почти все. Вопрос лишь в том, насколько велика должна быть такая выборка?
Этот вопрос вызван отнюдь не праздным любопытством. Для описания митохондриального генофонда популяции хотелось бы знать, какие именно гаплотипы там существуют, иметь их перечень. Это особенно важно для сравнения популяций. Если мы не знаем полного перечня гаплотипов, существующих в двух популяциях, то любые различия могут быть вызваны тем, что в одну из выборок эти гаплотипы просто не попали, хотя в популяции они присутствуют! Иными словами, при сравнении популяций по редким признакам (например, гаплотипам мтДНК) особенно важно знать, в какой степени наша выборка описывает реальную популяцию. Этот вопрос критичен и для практических целей судебно-медицинского использования мтДНК: «если данный гаплотип в популяции не обнаружен — то какова вероятность, что он там все-таки есть?»
ЧЕМ БОЛЬШЕ ВЫБОРКА, ТЕМ БОЛЬШЕ ГАПЛОТИПОВ
Чтобы ответить на этот вопрос, мы изучили скорость накопления гаплотипов при увеличении объёма выборки. Как можно видеть на графике (рис. 6.2.3), число гаплотипов в русских популяциях возрастает с увеличением объёма выборки линейно. И мы должны констатировать, что признаков насыщения не обнаружено. Насыщение должно было бы проявиться в постепенном выходе кривой на плато или, по крайней мере, в замедлении роста числа гаплотипов при увеличении выборки.
Рис. 6.2.3. График зависимости числа встреченных гаплотипов мтДНК от объёма выборки
Такая «ненасытность» приводит к весьма важному выводу: реальное число разных линий мтДНК в больших и географически подразделённых популяциях очень велико. Даже при выборках в тысячу и более образцов, по-прежнему в популяции остается множество невыявленных гаплотипов. Эту особенность мтДНК всегда необходимо учитывать, сравнивая популяции по спектру гаплотипов. Ведь если какой-либо гаплотип встречен у русских, но не обнаружен в иной популяции, это отнюдь не означает реального различия этих популяций. В действительности гаплотип может быть в обеих популяциях, но выявим мы его только при увеличении выборки.
КАК ПОСТРОЕН ЭТОТ ГРАФИК. Из общего массива в 1600 образцов из русских популяций случайным образом выбиралось по 100 образцов, и подсчитывалось число гаплотипов. На следующем шаге добавлялось ещё 100 образцов, случайно выбранных из оставшихся 1500, и подсчитывалось число гаплотипов в этой увеличившейся выборке. Всего было сделано 16 таких шагов — пока реальные доступные данные (1600 образцов) не были исчерпаны.
Грубая аппроксимация показывает, что соотношение между общим объёмом выборки и числом различных линий (гаплотипов) составляет примерно 7:3. Иными словами, число гаплотипов составляет около 40 % от числа исследованных образцов русского народа. Мы проверили это соотношение по данным о другом хорошо изученном народе — немцам, где исследовано лишь немногим меньше образцов — 1396. Число разных гаплотипов в этой выборке немцев составило 553, то есть соотношение осталось тем же — 40 %. Конечно, это соотношение должно несколько меняться в зависимости от разрешающей способности филогенетического анализа, то есть нашей способности отличать друг от друга «похожие» гаплотипы. Это соотношение должно зависеть и от структуры популяции, от соотношения миграций и дрейфа генов. Например, для саамов (лопарей), которые служат классическим примером мощного дрейфа, доля разных гаплотипов составляет, по нашим расчётам, только 11 % от объёма выборки (63 гаплоти-па в общей выборке 559 человек, информация Банка данных World Mitochondrial, см. Приложение раздел 5.).
КАК СРАВНИТЬ ПОПУЛЯЦИИ?
Сравнивать частоты гаплотипов, по всей видимости, нецелесообразно — слишком низка частота практически любого гаплотипа. И двукратные различия в частотах (в какой-то популяции один, а где-то встретилось два человека с таким гаплотипом) будут вызваны лишь случайностями выборки. Лучше сравнивать на качественном уровне: не важно, у скольких индивидов встречен данный гаплотип — важно, что он обнаружен в популяции. Тогда зависимость от объёма выборки будет меньше.
РАСЧЁТ ИНДЕКСА СХОДСТВА. Для каждой пары сравниваемых популяций мы подсчитывали число общих филогенетических линий (гаплотипов) мтДНК. Индекс сходства оценили как соотношение (долю общих линий): в числителе — количество линий мтДНК, общих с русскими популяциями; в знаменателе — суммарное число линий мтДНК, обнаруженных в сравниваемой популяции.
Такой способ расчёта, на первый взгляд, решает проблему «нерепрезентативности» любых наших выборок (в том смысле, что в них представлены далеко не все гаплотипы, реально присутствующие в популяции). Решает за счет того, что мы подсчитываем не число, а долю гаплотипов, общих между двумя популяциями. Ведь все гаплотипы имеют одинаковую вероятность «потеряться» (присутствовать в популяции, но отсутствовать в выборке). И если для изучаемой популяции «А» общие гаплотипы обнаруживаются преимущественно с популяцией «В», и реже с популяцией «С», то это означает, что таково реальное соотношение митохондриальных генофондов этих популяций. При этом мы предполагаем, что при увеличении объёма выборок число общих гаплотипов должно увеличиться в каждой сравниваемой паре популяций, но само соотношение останется примерно тем же.
КОВАРНАЯ СЦИЛЛА: В ЧЁМ ОШИБАЕТСЯ ИНДЕКС СХОДСТВА?
К сожалению, проверка показывает, что это не' вполне так. На рис. 6.2.4. приведена зависимость доли общих гаплотипов от объёма выборки (нижняя линия). Ясно видно, что такая зависимость имеется: чем меньше объём выборки, тем больше индекс сходства, тем больше доля общих гаплотипов.
ВЕРОЯТНОЕ ОБЪЯСНЕНИЕ. Можно предположить, что это вызвано наличием в популяциях сравнительно частых гаплотипов. Например, для населения Европы такими гаплотипами окажутся: в гаплогруппе Н гаплотип CRS и гаплотип с заменами «304–311»; в гаплогруппе J — гаплотип с заменами «069–126». Эти гаплотипы очень часты в Европе в целом, и поэтому встречены почти в каждой изученной европейской популяции. Число таких гаплотипов невелико. Но именно за счет своей повсеместности они всегда окажутся общими между любыми популяциями. Тем самым они являются как бы постоянной «прибавкой» к числу общих гаплотипов. И чем меньше объём выборки, тем больше сказывается это постоянное прибавочное число, тем больше оно завышает долю общих гаплотипов и повышает индекс сходства популяций.
Рис. 6.2.4. Сходство популяций зависит от объёма выборки (при прямом подсчёте доли общих гаплотипов между популяциями Европы).
Примечание. Для десяти европейских популяций подсчитаны три показателя: общее число гаплотипов в них; число гаплотипов, общих с русскими популяциями; доля гаплотипов, общих с русскими популяциями. Все 10 рассматриваемых популяций характеризуются разными объёмами выборок. График показывает, как три перечисленных параметра (отложенных по оси ординат) зависят от объёма выборки (ось абсцисс). Общее число гаплотипов при увеличении объёма выборки возрастает. Число гаплотипов, общих с русскими, также возрастает. Доля гаплотипов, общих с русскими, снижается. Это снижение хорошо видно на аппроксимирующем графике (жирная пунктирная линия). Для совместимости на одном графике число общих гаплотипов приводится умноженное на 10, а доля — умноженная на 1000.
Справедливо ли такое объяснение или есть другие причины зависимости сходства популяций от объёма выборки, в любом случае из-за этой зависимости любые выводы повисают в воздухе. Достаточно увеличить выборку, и обнаруженное ранее сходство популяций исчезнет! Наименее похожими на русских окажется население тех стран, где генетические исследования проводятся более интенсивно, а наиболее сходными будут просто слабо изученные народы! Необходим способ расчёта, корректирующий эту зависимость.
ПРОКРУСТ СПЕШИТ НА ПОМОЩЬ
Нами использован, пожалуй, самый простой, прямой, а потому надёжный способ такой коррекции — Прокрустов. Все сравнения проведены на выборках одного и того же объёма. Чтобы выровнять объёмы выборок, из каждой случайным образом было отобрано одно и то же число образцов, и дальнейшие сравнения проводились именно с этими новыми выборками одинакового объёма. Естественно, при этом происходила потеря части данных — все выборки приходилось выравнивать по самой маленькой из них (по размеру прокрустова ложа). Тем не менее, только такой прокрустов подход («отрубать лишнее») позволяет нам быть уверенными, что полученные результаты не зависят от того, что какая-то популяция изучена по большей выборке, а отражают что-то более объективное, можно надеяться — реальное сходство популяций.
СРАВНЕНИЕ РЕГИОНОВ. А НЕ ЛОКАЛЬНЫХ ПОПУЛЯЦИЙ
Зная, какие гаплотипы встречены в каждой из русских популяций, можно было бы сравнить разные русские популяции и определить, какие из них наиболее сходны друг с другом. Похожий анализ мы проводили по данным о частотах гаплогрупп (§ 3). Но осторожность не позволяет нам сделать это по данным о гаплотипах: выборки по каждой популяции составляют 100–150 человек, что слишком мало для определения спектра гаплотипов. Поэтому мы не можем провести анализ внутри русского генофонда, сравнив между собой разные русские популяции. Но можем объединить данные по всем русским популяциям, получив многосотенную выборку. И сравнить такой общерусский спектр с аналогичными спектрами соседних групп населения (табл. 6.2.4).
НА КОГО МЫ ПОХОЖИ?
Начиная со сказки об изолах-миграх и до мифов Древней Греции, мы только делали предостережения самим себе — они ясно показывают, как легко выводы о генофонде могут оказаться несоответствующими реальности. Поэтому теперь во всеоружии и с максимальной осторожностью сравним спектр гаплотипов в русских популяциях и у их соседей по Европе.
Диаграмма (рис. 6.2.5.) показывает, что по степени сходства с русским генофондом его соседи располагаются в следующем порядке: восточные славяне, волго-финские народы, западно-финские народы, западные славяне, тюркские народы Урала, южные славяне, германоязычные народы, народы Кавказа.
То, что по спектру гаплотипов русские оказались похожи на прочих восточных славян, не удивительно. Однако западные и в особенности южные славяне заметно отличаются от русских. У финноязычных народов (как западных, так и волжских) несколько больше общих гаплотипов с русскими, чем у славянских народов! Это можно трактовать в терминах финно-угорского субстрата в русском населении. Тюркоязычные народы и население Кавказа, несмотря на тесное соседство с современной зоной расселения русских, имеют с ними меньше общих гаплотипов мтДНК.
Таблица 6.2.4.
Группы населения, сравниваемые с русскими по спектру гаплотипов
Эти результаты показывают общность митохондриального генофонда Восточной Европы. Во всех языковых группах этого региона (восточные славяне, финно-угры, тюрки Уральского региона) мы видим общий массив гаплотипов мтДНК. Все эти группы народов по спектру гаплотипов похожи на русские популяции и, соответственно, должны быть и похожи друг на друга. На Кавказе и в Западной Европе спектр гаплотипов уже несколько отличается. Западные славяне, судя по рис. 6.2.5., присоединяются к восточноевропейскому кластеру, а южные славяне отличаются от него так же, как Кавказ и Западная Европа.
Сравнительно низкая доля общих линий между русскими и южными славянами требует объяснения. Можно вспомнить, что в ходе славянской экспансии как восточные, так и южные славяне расселились на территориях со значительно отличающимся субстратным населением: финноязычным на востоке и иллирийским на юге. Смешение с этими различными субстратами могло привести к заметным различиям между двумя славянскими группами по мтДНК. Нельзя также исключать, что предковые группы южных и восточных славян были исходно генетически различными.
Рис. 6.2.5. Доля общих линий между русскими популяциями и смежными группами населения
ОСНОВНЫЕ ЧЕРТЫ «МИТОХОНДРИАЛЬНОГО ПОРТРЕТА»
В разделе 6.2. мы рассмотрели изменчивость «митохондриального генофонда» в двух масштабах.
В МАСШТАБЕ ГАПЛОГРУПП (§ 2-§ 3): гетерогенность русского генофонда по мтДНК оценивается как высокая; рассмотрена география гаплогрупп в пределах «исконного» русского ареала; методом многомерного шкалирования обнаружено деление русских популяций на основной и северно-русский кластеры; оказалось, что «дыхание Азии» в русском генофонде не чувствуется.
В МАСШТАБЕ ГАПЛОТИПОВ (§ 4-§ 5): проведен более тонкий анализ и удалось сравнить по спектру гаплотипов русские популяции с их соседями. Восточно-европейский генофонд, составленный славянскими, финно-угорскими популяциями и тюрками Урала, предстает по этим маркёрам как единый континуум. Русские популяции целиком относятся к этой общности. При этом по спектру гаплотипов они особенно похожи на финно-угорские популяции. Это указывает на большую роль финно-угорского субстрата в формировании митохондриального генофонда русских популяций.
«МИТОХОНДРИАЛЬНЫЙ ПОРТРЕТ» рисует картину русского генофонда, близкую к тем портретам, которые были получены и по данным антропологии, и по классическим генетическим маркёрам. Данные по мтДНК также показывают чётко выраженные различия между южными и северными русскими группами. Размах этих различий заметен даже в общеевропейском масштабе изменчивости, но нигде не выходит за его рамки. Прослеживаются особенности генофонда, отражающие влияние смежных групп, в особенности финно-угорских популяций.
Подробнее итоги изучения мтДНК описаны в разделе 6.4.
§ 1. Новейший маркёр в популяционной генетике: Романтический аргумент — Дробность выделения гаплогрупп — Часовая и минутная стрелки эволюции
§ 2. Изученные русские популяции: Фрагментарные литературные данные — И подробные собственные — Надежно изученный ареал — Полунаука
§ 3. География гаплогрупп — взгляд извне и изнутри: Восемь главных гаплогрупп — «Славянская» R1a убывает к северу — «Северо-евразийская» N3 убывает к югу — «Балканская» I1b опять к северу — Сюрпризы викингов (I1а) — Странности европейцев (R1b) — Средиземноморские мозаики (E3b, J2) — Уральская печать на русском генофонде (N2)
§ 4. Гетерогенность русского генофонда по Y хромосоме: Выше, чем по мтДНК — Выше, чем по классическим маркёрам — Выше, чем у большинства народов Европы — Гетерогенность европейских народов по классическим и новейшим маркёрам
§ 5. Русские популяции в географическом и в генетическом пространстве: Главный сценарий — Широтная изменчивость — От севера к югу — Север гетерогенен внутри себя
Всем известно, как весома
Для нас Игрек-хромосома:
Хоть мала и некрасива,
С нею вся мужская сила!
В самый разгар бума митохондриальных исследований, когда на изучении мтДНК сосредоточились усилия большинства популяционных генетиков, на сцену стремительно вышла другая генетическая система — Y хромосома. Хотя ей ещё не удалось потеснить мтДНК с позиций лидера, Y хромосома уверенно заняла место рядом с ней. Образовавшийся дуэт быстро стал принятым стандартом, и самым информативным сейчас считается одновременное изучение мтДНК и Y хромосомы, прочие маркёры считаются не столь важными.
Отнюдь не умаляя значения прочих ДНК маркёров (некоторые типы которых, например аутосомные SNP гаплотипы, могут занять лидирующее положение уже в ближайшие годы) нужно признать, что сейчас львиная доля популяционных исследований приходится на мтДНК и Y хромосому. Полиморфизм Y хромосомы изучен уже в нескольких сотнях популяций по всему миру, уровень её изученности постепенно приближается к той же степени подробности, что и мтДНК. Генотипирование Y хромосомы было стандартизовано в 2002, когда вышла статья с современной классификацией гаплогрупп [YCC, 2002]. Все нынешние исследования опираются на эту классификацию и постепенно уточняют её, в том числе путем внедрения новых маркёров.
В этом разделе рассматриваются предварительные результаты, полученные авторами при изучении полиморфизма Y хромосомы в русском ареале.
Ты помнишь, что было в начале?
Уже ты не помнишь, а жаль…
Из двух половинок печали
Сложилась большая печаль.
Формально, с методических позиций обе «половинки» — отцовская Y хромосома и материнская мтДНК — это простые системы нерекомбинирующих маркёров. Именно на явлении полного сцепления маркёров, входящих в эти системы, основаны новые методы, ставшие знаменем «новой популяционной генетики». Её своеобразными методами являются расчёт возраста гаплогруппы по разнообразию её субвариантов и возможность определять последовательность возникновения гаплогрупп, воссоздавать «родословное древо» гаплогрупп и гаплотипов. Других нерекомбинирующих систем (кроме мтДНК и Y хромосомы) в геноме человека нет; точнее, они лишь «частично нерекомбинирующие» и поэтому проблематичнее для использования.
ДВЕ ПОЛОВИНКИ ПЕЧАЛИ
Такая «методическая» аргументация в пользу внедрения Y хромосомы в арсенал генетических маркёров, несомненно, убеждаёт. Вместе с тем, в годы быстрого внедрения Y хромосомы имел хождение и «романтический» аргумент: если мтДНК, наследующаяся по женской линии, маркирует историю «женской части популяции», то Y хромосома, наследующаяся по мужской линии, есть её естественное дополнение — вторая половинка, рассказывающая об истории «мужской части популяции». И обе системы вместе опишут весь генофонд популяции. И сейчас можно встретить веру в то, что митохондриальная ДНК описывает одну половинку генофонда, Y хромосома — другую, и из двух этих половинок можно сложить целый генофонд.
Этот романтизм оставил след в неуклюжей терминологии вроде «мужского генофонда» (Y хромосома присутствует только у мужчин). Однако, с точки зрения классической популяционной генетики, гендерное подразделение генофонда («по полу») выглядит спорным и грустным. Ведь мы изучаем не отдельные гены и не отдельных людей, а популяции человека, которые не могут быть «мужскими» или «женскими».
При этом широко известно, что обе системы — мтДНК и Y хромосомы — могут не «дополнять» друг друга, а смещать оценки параметров генофонда в одну и ту же сторону. Это ясно видно хотя бы из того, что обе системы являются гаплоидными и «однородительскими». Поэтому дрейф генов действует на них в четыре раза сильнее, чем на аутосомные маркёры. Соответственно изменяются и оценки ряда генетических параметров популяции — в первую очередь столь важного, как оценка гетерогенности генофонда. Это приводит к тому, что генофонд через призму мтДНК может искажаться примерно тем же образом, что и через призму Y хромосомы. И тогда совместное использование этих маркёров может послужить не их взаимной проверке, не взаимодополнению, а взаимному подтверждению искажённых (по сравнению с основной частью генофонда) оценок. Из этого уже «сложится большая печаль».
Видимо, самая безопасная стратегия — пользоваться самыми разными маркёрами и обдуманно компенсировать недостатки одних параллельным использованием других маркёров, лишенных этих конкретных недостатков. Это вселяет надежду сохранить объективность и независимость своих выводов.
ИЗУЧЕНИЕ Y ХРОМОСОМЫ
Популяционная изученность Y хромосомы уже сейчас приближается к уровню мтДНК. Но необходимо учитывать, что объёмы выборок по Y хромосоме, как правило, существенно меньше, поскольку изучается ДНК лишь мужчин. А они, если не прилагать специальных усилий, составляют обычно менее половины выборки. К тому же результаты первых работ (примерно до 2000 года) сейчас уже малопригодны, поскольку набор используемых для ге-нотипирования маркёров был слишком невелик. Так что сейчас Y хромосоме следует отвести второе место. Но потенциально её разрешающая способность (возможность выделять все более дробные гаплогруппы) намного выше, чем мтДНК, и это привлекает к Y хромосоме все большее внимание исследователей.
Генотипирование Y хромосомы состоит в определении, к какой гаплогруппе относится каждый образец ДНК. Доказательством принадлежности к гаплогруппе служит наличие специфического для данной гаплогруппы маркёра (или маркёров). Как правило, это SNP маркёры — замена одного из нуклеотидов Y хромосомы.
Поскольку классификация гаплогрупп представляет собой иерархическое, ветвящееся дерево, то становится особо важным, с каким разрешением проведено генотипирование: определена ли принадлежность образца к гаплогруппе, или к её определенному варианту, или же с точностью до субварианта и так далее.
SNP и STR — ЧАСОВАЯ И МИНУТНАЯ СТРЕЛКИ ЭВОЛЮЦИИ
Определение гаплогрупп Y хромосомы проводят по набору диаллельных маркёров (обычно SNP) — точно так же, как гаплогруппы мтДНК определяются диаллельными ПДРФ маркёрами в её кодирующей части («часовая стрелка»). Что же касается гипервариабельного сегмента мтДНК («минутная стрелка»), то и у Y хромосомы есть его аналог — набор микросателлитных локусов (STR). Подобно тому, как ГВС1 в мтДНК состоит из быстро (по сравнению с ПДРФ-маркёрами) мутирующих сайтов, так и микросаттелиты Y хромосомы мутируют намного быстрее SNP-маркёров: они соотносятся как минутная и часовая стрелки эволюции. И если в мтДНК каждая гаплогруппа, определенная по ПДРФ-маркёрам, вмещает в себя целый веер линий, выявленных по ГВС1, то и каждую SNP-гаплогруппу Y хромосомы можно подразделить на множество гаплотипов, определяемых по панели микросаттелитов.
Но при этом для мтДНК разрыв между ГВС1 и ПДРФ-маркёрами не так велик, как аналогичный разрыв между двумя типами маркёров Y хромосомы. Для мтДНК, хотя и не со стопроцентной вероятностью, но все же возможно определить гаплогруппу по мотиву в ГВС1. Для Y хромосомы корреляция между микросателллитным гаплотипом и SNP-гаплогруппой меньше, хотя её удаётся выявить [Rootsi et al., 2004]. В большинстве работ изучаются только SNP маркёры и соответственно распределение гаплогрупп Y хромосомы. Что же до микросаттелитных маркеров, то их анализируют реже — по минутной стрелке не определишь, который час. Ими пользуются для оценки возраста в пределах отдельных гаплогрупп и некоторых других видов анализа [Roewer et al., 2005].
ЛИТЕРАТУРНЫЕ ДАННЫЕ
Как и большинство генетических маркёров, Y хромосома наиболее изучена в Европе. В том числе есть данные и по русским популяциям (табл. 6.З.1.). В работе [Wells et al., 2001] представлены северные русские (N=49; русские Архангельска, проживающие там не менее трёх поколений [Евсеева, личное сообщение]), поморы (N=28; студенты Архангельска, все предки которых происходят из поморских сел [Евсеева, личное сообщение]) и русские Ташкента (N=89). В статьях [Rosser et al., 2000] и [Karafet et al., 2002] представлены данные по русским «вообще» без указаний о географической привязке популяций (объёмы выборок N=122 и N=61, соответственно). Ни в этих статьях, где русские были лишь одним из многих изученных этносов, ни в других известных нам работах не предпринимались попытки изучить русский генофонд по маркёрам Y хромосомы[44]. Надо заметить, что и самих этих данных, как по их суммарному объему (N=349), так и особенно по географической приуроченности (фактически описаны лишь «русские-неизвестно-откуда» и «северные русские») для выявления структуры генофонда явно недостаточно.
НАШИ ДАННЫЕ
Независимо от перечисленных работ, мы целенаправленно провели анализ полиморфизма Y хромосомы в русских популяциях, изучив 1228 индивидов из 14 популяций (табл. 6.3.1). Наше экспедиционное обследование было спланировано так, чтобы охватить коренное русское население из многих географически различных регионов, но не выходя за пределы «исконного» ареала русского народа. Все дальнейшее изложение опирается только на полученные нами данные.
Таблица 6.3.1.
Русские популяции, изученные по частотам гаплогрупп Y хромосомы
Проблема «исконного» русского ареала рассматривалась в главах 4 и 5. Основными участниками и/или организаторами экспедиций, проведенных под общим руководством Е. В. Балановской в 2000–2005 гг., были О. П. Балановский, И. В. Евсеева, Э. А. По-чешхова, М.И. Чурносов. Также участвовали М. Н. Болдырева,
О. Бобрецова (северные популяции), И. Н. Лепендина, М. С. Жер-лицына, И. Н. Сорокина, В. Ю. Песик, Н. А. Рудых (южные популяции), А. С. Пшеничное (западные популяции).
Генотипирование маркёров Y хромосомы выполнено О. П. Балановским при участии С. Роотси на базе Эстонского биоцентра, возглавляемого Р. Виллемсом. Определены частоты гаплогрупп Y хромосомы на основе типирования SNP-маркёров.
Информация из опубликованных источников не используется, как говорилось, из-за неясной географии популяций, а для северно-русских выборок — из-за их небольших объёмов. Надо сказать, что 14 популяций — не так мало даже в сравнении с хорошо изученными классическими маркёрами (в среднем 35 русских популяций, но карты включались в анализ, если изученных популяций было хотя бы 10) или дерматоглификой (28 популяций). Благодаря наличию этих данных, Y хромосома становится одним из наиболее изученных ДНК маркёров для русских популяций. Для сравнения — по мтДНК надёжно изучено в два раза меньше популяций (7 популяций в «исконном» ареале).
Полученные данные уникальны — ни для одного другого народа мира пока нет столь обширных данных. На примере русского народа впервые можно увидеть, каковы могут быть различия «отцовских» генов между разными популяциями одного и того же народа.
География изученных русских популяций обширна (табл. 6.3.1). Еще лучше, чем из таблицы, это видно на карте. Четырнадцать изученных популяций отмечены темными кружками на всех картах (рис. 6.3.1.-6.3.9).
Возникает вопрос, весь ли «исконный» русский ареал мы изучили, обследовав эти популяции? Ответ можно получить, воспользовавшись методом карт надёжности, подробно описанном в Приложении. Такая карта надёжности для наших 14 популяций представлена на рис. 6.3.1. Эта карта показывает, какие территории могут считаться охваченными генетическим изучением. Те территории, которые расположены далеко от изученных популяций, представлены как зоны недостоверного прогноза — по нашим данным мы не можем надёжно прогнозировать частоты гаплогрупп на этих территориях. Например, среди изученных популяций нет ни одной из Волго-Окского междуречья. Но наличие данных по окружающим регионам (Тверская, Костромская, Орловская области) делает интерполяцию на междуречье достаточно надёжной. Однако на северо-западе (Ленинградская и запад Архангельской областей), как показывает карта надёжности, данных не достаёт: для этой территории мы не можем дать надёжного прогноза.
Рис. 6.3.1. Карта надёжности картографического прогноза для русских популяций, изученных по гаплогруппам Y хромосомы [Balanovsky et al., 2008]
Обозначения популяций: 1 — Мезень; 2 — Пинега; 3 — Красноборск; 4 — Вологда; 5 — Кострома; 6 — Тверь; 7 — Псков 2; 8 — Псков 1; 9 — Смоленск; 10 — Орёл; 11 — Курск; 12 — Воронеж; 13 — Белгород; 14 — кубанские казаки.
НАДЁЖНЫЙ АРЕАЛ
Картографирование частот гаплогрупп (карты на рис. 6.3.2.-6.3.9) проведено лишь для территории, надёжно обеспеченной исходными данными (надёжная область на рис. 6.3.1). Поэтому северо-западные части «исконного» русского ареала остались в некартируе-мой области. Напротив, на юге в картируемую область вошла популяция кубанских казаков, которая, строго говоря, находится за пределами «исконного» ареала. За этими исключениями, область, в которой картографирована изменчивость Y хромосомы, примерно соответствует ареалу, в пределах которого анализировались и антропологические признаки, и классические маркёры, и фамилии (карты в главах 4, 5, 7).
ВЫДУМКИ ЖУРНАЛИСТОВ
К сожалению, эта карта ещё до выхода нашей книги появилась в журнале «КоммерсантЪ Власть», где была истолкована в прямо противоположном смысле: будто бы чисто техническая карта надёжности, просто заданная расположением наших изученных популяций, определяет ареал русского народа [КоммерсантЪ Власть, 2005; № 38]. Это было бы смешно, если бы мы могли посмеяться вместе с читателями. Нам же пришлось на это и другие столь явно ошибочные утверждения давать опровержения [см. на сайте www.genofond.ru]. Ведь так очевидно, что границы русского ареала могут очертить только гуманитарные науки, а генетика может лишь послушно планировать свои исследования в очерченных ими географических рамках.
Но уже не смешно, а опасно, когда простому планированию полевых исследований, по произволу журналистов, придаётся сила научного свидетельства об историческом ареале народа. Это и есть «…полунаука, самый страшный бич человечества, хуже мора, голода и войны, не известный до нынешнего столетия. Полунаука — это деспот, каких ещё не приходило до сих пор никогда. Деспот, имеющий своих жрецов и рабов, деспот, пред которым все склонилось с любовью и суеверием, до сих пор немыслимым, пред которым трепещет даже сама наука и постыдно потакает ему» [Ф. М. Достоевский. «Бесы»].
Поэтому, чтобы не потакать геополитическим спекуляциям, нам пришлось «обрезать» надёжно изученный ареал русского народа по современной политической границе России (рис. 6.3.1).
В этом параграфе мы осмотрим генетический портрет русского народа на фоне Европы. Знание того, как гаплогруппы Y хромосомы распространены в глобальном масштабе, помогает понять, что означает их присутствие (или отсутствие) у русских. Это взгляд на русский генофонд извне. А различия в частотах гаплогрупп между самими русскими популяциями выявляют внутреннюю структуру русского генофонда — это мы назовём взглядом изнутри. Оба взгляда мы будем бросать на одни и те же карты (рис. 6.3.2.-6.3.9). Сначала на карте мы будем рассматривать общеевропейскую закономерность в распространении гаплогруппы, а потом её изменчивость внутри «надёжного» русского ареала (оконтурен серой линией на всех картах). Исходные данные для «европейского» картографирования описаны в Приложении (раздел 5).
Известно, что гаплогруппы Y хромосомы географически специфичны, причём в намного большей степени, чем аутосомные маркёры и мтДНК. Многие гаплогруппы Y хромосомы имеют конкретные, чёткие ареалы. Если гаплогруппы мтДНК называют «континент-специфичными», то гаплогруппы Y хромосомы часто приурочены к более дробным географическим регионам. Поэтому именно Y хромосома многообещающа для изучения изменчивости внутри этноса, для выявления различий между близкими популяциями, которые неотличимы по другим маркёрам.
Многие гаплогруппы, обнаруженные в коренных русских популяциях, редки и не удовлетворяют 1 % критерию полиморфизма: лишь восемь гаплогрупп встречаются со средней частотой выше 1 % (табл. 6.3.2). Но сумма частот этих восьми гаплогрупп составляет 95 %, что даёт нам право во всех видах анализа учитывать лишь эти гаплогруппы, опуская прочие редкие варианты. Рассмотрим географию этих восьми гаплогрупп.
Таблица 6.3.2.
Частоты гаплогрупп Y хромосомы в русском генофонде (в среднем по 14 популяциям, lz28 человек)
Примечание: указаны гаплогруппы, удовлетворяющие критерию полиморфизма (средняя частота q>0.01).
ГАПЛОГРУППА R1a (рис. 6.3.2.)
Для русских популяций эта гаплогруппа самая частая — она встречается почти у каждого второго (табл. 6.3.2).
ИЗВНЕ. В глобальном масштабе основной ареал этой гаплогруппы — Восточная Европа, хотя она также встречается в Западной Европе, Южной Сибири и Индостане. «Европейская» карта (рис. 6.3.2) показывает приуроченность этой гаплогруппы к ареалам западных и восточных славян, а также балтов. Можно было бы сказать, что в Европе эта гаплогруппа чётко приурочена к балто-славянской языковой общности, если бы её частота не была резко снижена у южных славян.
ИЗНУТРИ. В пределах изученного русского ареала (область, оконтуренная на карте серой линией) видны различия между большей западной и меньшей северо-восточной частями генофонда. На западе и юге частота R1a превышает 50 % и лишь местами снижается до 40 %. На северо-востоке (за Волгой и в бассейнах Вет-луги, Сухоны, Вычегды) частота R1a ниже 40 %. И лишь на самом севере (на Мезени) вновь возрастает. Вернувшись к западной зоне высоких частот, мы увидим, что с юга её ограничивает некоторое снижение частоты у украинцев. При этом в белорусских популяциях частота R1a столь же велика, как в западных русских популяциях. Пока остаётся открытым вопрос о том, является ли гаплогруппа R1a маркёром расселения восточных славян, а её сниженная частота, соответственно, свидетельством мощного финно-угорского пласта на северо-востоке русского ареала.
Рис. 6.3.2. Карта распространения гаплогруппы R1a в Европе и в русском ареале [Balanovsky et al., 2008]
Обозначения: К — число изученных популяций; N — число узлов сетки; MIN, MEAN, МАХ — соответственно, минимальная, средняя, максимальная частота.
ГАПЛОГРУППА N3 (оис. 6.3.3.)
Эта вторая по частоте гаплогруппа в русском генофонде, вбирает в себя пятую часть (19 %) фонда Y хромосом.
ИЗВНЕ. Основной ареал N3 — Сибирь (до 90 % в отдельных популяциях) и Восточная Европа. Как бы ни решился вопрос о прародине этой гаплогруппы, её заметная частота у русских показывает некую долю общности между русским генофондом и коренным населением Северной Азии. Такая общность по маркёрам Y хромосомы неожиданна, поскольку по другим системам признаков генофонды Восточной Европы и Сибири резко различны (см., например, главу 9). Любопытно, что балтоязычные популяции (латыши и литовцы), которые по R1a решительно объединялись со славянами, по гаплогруппе N3 ещё более решительно от них отмежёвываются. Карта показывает резкий перепад частот (более чем на 20 %!) примерно по границе балтов и славян: с одной стороны Латвии и Литвы, и с другой — стран с преобладанием славяноязычных популяций (России, Белоруссии и Польши).
ИЗНУТРИ. В пределах русского ареала для N3 вновь обнаруживается картина широтной изменчивости, как и для R1a. Мы опять видим на карте две области. Только их значения обратные предыдущей карте: высокие частоты на севере, низкие — на юге. Удивителен довольно резкий перепад в частотах N3 между севером и югом и строго широтная граница между зонами высоких и низких частот. Данные по смежным народам подтверждают, что N3 приурочена к северной половине Восточной Европы. Русский генофонд тем самым полностью подчиняется восточноевропейской закономерности о концентрации N3 к северу от 57 параллели. И снова, учитывая редкость N3 у белорусов и украинцев, можно обсуждать толщину финно-угорского пласта в русском генофонде и его залегание преимущественно на севере.
ГАПЛОГРУППЫ I1а и I1b (рис. 6.3.4. и 6.3.5.)
Эти две сестринские гаплогруппы можно назвать, ориентируясь на зоны их максимальных частот, Скандинавской и Балканской гаплогруппами. Их распространение в русском ареале может помочь нам обнаружить связи русского населения с этими двумя регионами.
ИЗВНЕ. Частота I1а максимальна в Скандинавии, и постепенно снижается к югу. Напротив, I1b распространена главным образом на Балканах, и её частота постепенно снижается к северу. Вся центральная полоса Европы оказывается зоной интерференции этих гаплогрупп. У русских преобладает «балканская» гаплогруппа, хотя частота «нордического» варианта также существенна. Соотношение I1а:I1b составляет 1:2. При этом у белорусов и украинцев «нордическая» гаплогруппа, по сравнению с «балканской», практически незаметна. Соотношение I1а:I1b составляет 1:5 для украинцев и 1:15 для белорусов [Пшеничное, Атраментова, Ищук, Чурносов, Тегако, Виллеме, Балановская, неопубл. данные]. Для украинцев естественна близость с географически соседним населением Балкан.
Рис. 6.3.3. Карта распространения гаплогруппы N3 в Европе и в русском ареале [Balanovsky et al., 2008].
Рис. 6.3.4. Карта распространения гаплогруппы Нb в Европе и в русском ареале [Balanovsky et al., 2008].
ИЗНУТРИ. Внутри русского ареала распространение «Балканской» гаплогруппы I1b (рис. 6.3.4.) закономерно: частота плавно падает с юга (>13 %) на север (0 %). То есть, тренд I1b снова широтный. Но только изменение частоты I1b не резкое, как для N3, а постепенное. Мы видим, что тренд, обнаруженный в русском генофонде, полностью встраивается в более общий, панъевропейский тренд распространения гаплогруппы I1b.
Но её сестринская гаплогруппа уже не подчиняется европейской закономерности. Генетический рельеф «Скандинавской» гаплогруппы I1a (рис. 6.3.5.) в русском ареале оказывается неожиданным. Казалось бы, высокие значения I1а должны быть вблизи Скандинавии, на северо-западе русского ареала. Там, а также по западной границе можно ожидать «варяжское» влияние в виде повышенных частот I1а. Однако компактный локальный максимум I1а (11–12 %) вырисовывается совсем в другой области, на северо-востоке. Это ядро ясно выделяется на фоне окружающих низких частот (менее 6 %), свойственных всему остальному русскому ареалу. Реальность этого ядра повышенных значений опирается на данные по трём русским популяциям, изученным по обширным выборкам. Конечно, по сравнению с частотами в Скандинавии (25–40 %) этот локальный максимум второстепенен. Но его удаленность от основной зоны высоких частот гаплогруппы в Скандинавии требует объяснений. Трудно предположить тесные связи Скандинавии именно с Заволжьем и бассейном Вычегды, помимо прочих русских территорий. Видимо, популяционная история гаплогруппы
I1a сложнее, чем простая экспансия из Скандинавии, и, возможно, включает древние связи между финно-угорскими племенами Восточной Европы и предками германоязычных скандинавов.
Рис. 6.3.5. Карта распространения гаплогруппы I1a в Европе и в русском ареале [Balanovsky et al., 2008]
ГАПЛОГРУППА R1b (рис. 6.3.6.)
ИЗВНЕ. R1b свойственна населению Западной Европы, что ярко выявляется на карте. Присутствие гаплогруппы у русских выражено в той же небольшой степени, что и в целом для популяций Восточной Европы (например, 6 % у украинцев и 3 % у белорусов).
ИЗНУТРИ. В русском ареале R1b встречается с частотой от нуля до 13 %, в среднем составляя 6 %. В отличие от предыдущих гаплогрупп, в её распределении по русскому ареалу чёткой географической закономерности нет. Для большинства популяций характерны средние частоты. Повышенные частоты отмечены в трёх популяциях на востоке, пониженные — в одной на северо-востоке. Учитывая, что основная зона R1b — Западная Европа, неожиданно, что её частота в русском ареале возрастает скорее к востоку, чем к западу. Впрочем, эта слабая тенденция может быть случайной. Тем не менее, она подчёркивает отсутствие заметных влияний на русский генофонд из Западной Европы, которые должны были бы выразиться на карте в клинальной изменчивости частоты «западноевропейской» гаплогруппы.
Рис. 6.3.6. Карта распространения гаплогруппы R1b в Европе и в русском ареале [Balanovsky et al., 2008]
ГАПЛОГРУППА E3b (рис. 6.3.7.)
ИЗВНЕ. E3b характерна для Северной Африки (до 80 %) и Средиземноморья в его самом широком понимании. В Европе наибольшие частоты отмечены на Балканах (10–20 %) [Semino et al., 2004]. До русского ареала доходит лишь «затуханье сахарской волны» (Н. Гумилев).
ИЗНУТРИ. Внутри русского ареала генетический ландшафт состоит в повышении частоты в центральной полосе и снижении к северу и к югу (подобные ландшафты мы уже не раз встречали среди самых разных признаков — генетики, фамилий, антропологии). Такой паттерн лишь отчасти согласуется с европейским трендом для этой гаплогруппы (снижение к северу).
Рис. 6.3.7. Карта распространения гаплогруппы ЕЗb в Европе и в русском ареале [Balanovsky et al., CQh 2008] E-OU
ГАПЛОГРУППА J2 (рис. 6.3.8.)
ИЗВНЕ. J2 преобладаёт на Ближнем Востоке и на Кавказе [Wells et al., 2001; Semino et al., 2000]. В русском генофонде она могла появиться не только со стороны Кавказа, но и Южной Европы (включая Балканы), где J2 также нередка [Semino et al., 2004]. В Европейском масштабе J2 следует тому же генетическом рельефу, что E3b: максимум в Средиземноморье и снижение к северу.
ИЗНУТРИ. Но «русский» ландшафт гаплогруппы J2 (рис. 6.3.8.) оказывается гомогенным в пятипроцентной шкале карты. Когда карта была перестроена в более дробной шкале, выявился ряд ядер повышенных частот на востоке, средние частоты на юге и отсутствие гаплогруппы на севере. Но средний объём наших выборок приближается к 100 образцам на популяцию. При таких выборках доверительный интервал для частоты 2 % приближается к наблюдаемому размаху её изменчивости. Это лишает основательности долгие рассуждения, поскольку тренды становятся неотличимы от случайных шероховатостей рельефа. Для анализа географии таких редких признаков нужно особое везение: наличие очень чёткого тренда, очень большие выборки или обилие изученных популяций.
Рис. 6.3.8. Карта распространения гаплогруппы J2 в Европе и в русском ареале [Balanovsky et al., 2008] w
ГАПЛОГРУППА N2 (рис. 6.3.9.)
ИЗНУТРИ. Гаплогруппа N2 как раз характеризуется очень чётким трендом. Хотя её средняя частота столь же невелика, как для E3b и J2, её распространение географически чётко приурочено. Гаплогруппа N2 встречена только на Русском Севере, в трёх популяциях Архангельской области.
ИЗВНЕ. Учитывая, что, основной ареал N2 — угорские народы Западной Сибири, а в Европе она встречается только среди волго-финских народов, финно-угорский отпечаток на генофонде Русского Севера виден по N2 рельефнее, чем по любому другому маркёру.
Рис. 6.3.9. Карта распространения гаплогруппы N2 в Европе и в русском ареале [Balanovsky et al., 2008]
ИТОГИ
ИЗВНЕ. Итак, по спектру гаплогрупп Y хромосомы и их средним частотам русский генофонд укладывается в более крупный регион Восточной Европы (доминирование восточноевропейских гаплогрупп R1a и N3). Видны связи практически со всеми смежными регионами: Западной Европой (наличие R1b), Скандинавией (I1а), Балканами (I1b, J2, E3b), Западной Сибирью/Уралом (N2). Лишь связь с Кавказом выявляется слабо, поскольку гаплогруппа G (наиболее частая у северокавказских народов), практически не встречается у русских и лишь чуть более часта у украинцев.
ИЗНУТРИ. Однако при таком видении русский генофонд выступает лишь точкой, которую мы сравниваем с другими точками — соседними регионами. Поэтому мы рассматривали не только средние показатели, но и карты распространения этих гаплогрупп в русском ареале. Это позволило увидеть внутреннюю гетерогенность русской «точки», занимающей большую часть Восточной Европы с десятками миллионов обитателей. По трём самым частым гаплогруппам (R1a, N3, I1b), а также для редкой N2 в русском ареале обнаружилась широтная изменчивость, согласующаяся с общеевропейскими трендами этих гаплогрупп. Распространение в русском ареале умеренно частых гаплогрупп R1b и На носит сложный характер и не согласуется с европейскими закономерностями. Наконец, редкие для русских гаплогруппы J2 и E3b распределены в русском ареале мозаично.
ТРИ МЕТОДА ОБОБЩЁННОГО АНАЛИЗА
В предыдущем разделе мы воспользовались уникальным свойством Y хромосомы — высокой географической специфичностью её гаплогрупп, их приуроченностью к конкретным территориям. Это позволило выявить связи разных частей русского генофонда с соседними группами народонаселения.
Однако каждая из гаплогрупп рисует свой эскиз портрета генофонда, видит только одну из множества его проекций, отражается в одной из граней кристалла. Чтобы выявить наиболее общие черты портрета генофонда, присутствующие подспудно в каждом эскизе, надо перейти к обобщённому анализу изменчивости Y хромосомы. Для этого мы применим обычный арсенал методов, который широко использовался и в предыдущих главах. Сначала (§ 4) количественно определим гетерогенность русского генофонда — величину межпопуляционных различий. И так же, как мы это делали для классических маркёров (глава 5), оценим гетерогенность по шкале «много» — «мало». Затем в § 5 рассмотрим карты главных компонент изменчивости по маркёрам Y хромосомы точно так же, как по признакам антропологии (глава 4) и классическим маркёрам (глава 5). И в заключение, оценим взаимное расположение русских популяций на графике многомерного шкалирования — так, как мы уже рассмотрели аналогичный график для мтДНК.
ГЕТЕРОГЕННОСТЬ Y ХРОМОСОМЫ. мтДНК И АУТОСОМНЫХ МАРКЕРОВ
Чтобы оценить размах межпопуляционных различий по Y хромосоме, для неё так же, как и для мтДНК (см. 6.2. § 3), была рассчитана матрица генетических расстояний М. Нея между 14 русскими популяциями. Ни для одного другого народа мира ещё не проводилось количественное измерение внутриэтнической изменчивости Y хромосомы в сравнении с изменчивостью других народов.
Средние генетические расстояния по гаплогруппам Y хромосомы составили d=0.142. Этот показатель оценивает гетерогенность генофонда, его внутриэтни-ческую изменчивость.
Различия между русскими популяциями по частотам гаплогрупп Y хромосомы (d=0.142) оказались в четыре раза больше, чем по мтДНК (d=0.033, см .раздел 6.2.).
ПАТРИЛОКАЛЬНОСТЬ. Это ожидаемый результат, поскольку во многих работах (на уровне межэтнических сравнений) показано, что изменчивость Y хромосомы намного более выражена, чем мтДНК [Seielstad et al., 1998; Rosser et al., 2000; Semino et al., 2000]. Это явление нередко связывают с патрилокальностью браков (т. е. переездом жены на родину мужа — при этом отцовские гены остаются на родине отца), тогда как при матрилокальности изменчивость Y хромосомы (отцовские гены «мигрируют» на родину матери), напротив, становится меньше, чем по мтДНК [Oota et al., 2001; Hamilton et al., 2005; Destro-Bisol et al., 2004]. Па-трилокальность, характерная для большинства народов, приводит к тому, что гены, наследующиеся по мужской линии, из поколения в поколение остаются в том же месте, тогда как мтДНК благодаря брачным миграциям интенсивно перемещается вместе с женщинами с их родины на родину мужа.
Рассмотрим теперь гетерогенность русского народа по аутосомным маркёрам (классическим). При расчёте тем же методом средних генетических расстояний она составила d=0.013.
Используя строго одну и ту же меру гетерогенности, можно смело утверждать, что различия между русскими популяциями по Y хромосоме (d=0.142) намного выше (рис. 6.3.10.), чем по мтДНК (d=0.033) и по классическим маркёрам (d=0.013). Можно рассудить, что если различия выявляются легче, то Y хромосома — удобная система для изучения структуры генофонда.
Рис. 6.3.10. Гетерогенность русского генофонда по данным о классических маркёрах, мтДНК и Y хромосоме.
Примечание: Средние генетические расстояния между всеми русскими популяциями по трём типам маркёров.
СРАВНЕНИЕ С ДРУГИМИ НАРОДАМИ
Итак, изменчивость русских популяций по Y хромосоме на порядок выше, чем по аутосомным маркёрам. Но надо ещё ответить на вопрос: велика или мала гетерогенность русского народа по Y хромосоме в сравнении с другими народами?
Полученная оценка гетерогенности (d=0.142) характеризует межпопуляционные, но вну/ирмэтнические различия: различия между русскими популяциями (то есть между популяциями внутри этноса). Ряд исследований показал, что изменчивость по Y хромосоме действительно велика, но почти все эти работы описывают только межэтническую изменчивость — различия между народами, а не внутри их.
Поэтому мы провели анализ внутриэтнической изменчивости в Европе (табл. 6.3.3.), обобщив опубликованные данные.
Таблица 6.3.3.
Гетерогенность народов Европы по гаплогруппам Y хромосомы
В анализ включены только народы, изученные по четырём и более популяциям с объёмом выборок более 70 человек в каждой популяции. Чтобы удовлетворить этому условию, популяции с небольшими объёмами выборок объединялись с соседями. (Для русских были объединены популяции «Пинега» и «Мезень», «Псков 1» и «Псков 2», «Тверь» и «Кострома», «Курск» и «Орел».)
Гетерогенность русского генофонда занимает третье место в ряду одиннадцати изученных народов Европы (табл. 6.3.3). Конечно, «места», занимаемые генофондами по степени их гетерогенности, могут измениться по мере изучения других народов Европы (и более подробного изучения тех же самых народов). Но уже сейчас можно сделать общий вывод, что по данным об Y хромосоме русский генофонд оказывается одним из наиболее гетерогенных этнических генофондов в Европе.
ГЕТЕРОГЕННОСТЬ НАРОДОВ ЕВРОПЫ: ДВА ТИПА МАРКЕРОВ
Таблица 6.3.3., суммирующая данные о гетерогенности по Y хромосоме, аналогична таблице 5.3.1., где гетерогенность рассчитана по классическим маркёрам. Для сопоставимости этих таблиц мы рассчитали гетерогенность Y хромосомы не только как средние расстояния, но и через близкородственную статистику — более «помехоустойчивую» величину GST Сравнение этих таблиц позволяет сделать три вывода:
1. Изученность Y хромосомы на внутриэтническом уровне пока оставляет желать лучшего — накоплены данные лишь о 11 народах, изученных в среднем по шести популяциям, а по классическим маркёрам проанализированы данные о 31 народе Европы, и эти народы изучены в среднем по 14 популяциям.
2. Гетерогенность народов по Y хромосоме оказывается почти в четыре раза выше, чем по классическим маркёрам. В среднем по Европе внутриэтническая изменчивость Y хромосомы составляет 3.3 (как следует из данных таблицы 6.3.3), тогда так по классическим маркёрам она составляет 0.9 (расчёт по данным таблицы 5.3.1., для сопоставимости из этой таблицы мы учитываем только европейские народы).
3. Несмотря на разницу в абсолютных величинах внутриэтнической изменчивости, её относительная величина у разных народов похожа по обоим типам маркёров. Например, гетерогенность русских и итальянцев высока и по Y хромосоме, и по классическим маркёрам, а гетерогенность поляков занимает одно из последних мест как по Y хромосоме (GST=1.1), так и по классическим маркёрам (GST=0.3).
Отметим также, что по Y хромосоме (табл. 6.3.3) изменчивость популяций в пределах одного народа, хотя и велика, но значительно (в пять раз!) меньше, чем изменчивость среднеэтнических частот гаплогрупп между рассмотренными народами Европы. Это означает, что «дифференцирующая мощность» гаплогрупп Y хромосомы с увеличением географических дистанций только растет!
ЧТО ЛУЧШЕ — ГЕНЕТИЧЕСКИЕ РАССТОЯНИЯ ИЛИ GST? Гетерогенность каждого народа мы оценили двумя мерами: как средние генетические расстояния между каждой парой популяций и как межпопуляционная изменчивость GST Хотя по абсолютной величине генетические расстояния в среднем оказываются в три раза выше, чем GST, но относительные величины обеих мер хорошо согласуются друг с другом. Кажущееся расхождение в случае турок вызвано необычно высоким уровнем филогенетического разрешения, с которым изучен этот народ (генотипирование проводилось на 26 гаплогрупп, тогда как для остальных народов — только на 8-12 гаплогрупп). Если же привести данные по туркам к общему уровню (8 гацлогрупп), то средние генетические расстояний уменьшаются с 16.5 до 3.5, а величина GST оказывается более устойчивой к изменению уровня филогенетического разрешения, сокращаясь с 1.3. только до 0.8. Более привычные молекулярным генетикам показатели AMOVA очень близки к GST и мы их здесь не приводим.
Мы определили величину гетерогенности русского генофонда по маркёрам Y хромосомы. Теперь рассмотрим, как эта межпопуляционная изменчивость реализована в географическом пространстве (карты главных компонент) и в генетическом пространстве (график многомерного шкалирования).
Рис. 6.3.11. Карта первой главной компоненты изменчивости Y хромосомы в русских популяциях [Balanovsky et al., 2008].
РУССКИЕ ПОПУЛЯЦИИ в ГЕОГРАФИЧЕСКОМ ПРОСТРАНСТВЕ
Карты главных компонент изменчивости Y хромосомы рассчитаны по тем же восьми картам, которые рассматривались в предыдущих разделах, и обобщают изменчивость этих восьми гаплогрупп. Карты главных компонент построены по той же технологии, что и карты главных компонент по классическим маркёрам, дерматоглифике и фамилиям (главы 5. 4, 7). Конечно, объём данных (число популяций и число гаплогрупп) по Y хромосоме меньше, чем по этим системам признаков, но всё же достаточен для проведения компонентного анализа.
ПЕРВЫЙ СЦЕНАРИЙ. Карта первой главной компоненты (рис. 6.3.11.) выявляет ландшафт широтной изменчивости русского генофонда. Эта картина уже знакома нам по данным соматологии, дерматоглифики и классическим генным маркёрам. Значения компоненты плавно изменяются от южных русских популяций к северным. Это означает, что таково основное направление генетических различий по маркёрам Y хромосомы — компонента описывает 40 % общей изменчивости. Первая главная компонента высоко коррелирует с шестью из восьми гаплогрупп (табл. 6.3.4.). Это говорит о том, что широтная изменчивость — действительно «повсеместный» тренд для системы Y хромосомы.
Сходство этого тренда с аналогичными трендами по другим системам признаков очевидно (рис. 4.4.3., 4.4.4., 5.3.2). Полиморфизм Y хромосомы в русских популяциях подчиняется той же господствующей тенденции широтной изменчивости, что и (прочие системы маркёров. Надо отметить, что преобладание широтной изменчивости выявляется именно обобщённой картой. На картах отдельных гаплогрупп четкая широтная картина видна лишь дважды (для R1a картина не полностью широтная), а на остальных картах столь явно не проявляется. Использование компонентного анализа позволяет сделать этот завуалированный тренд очевидным.
ВТОРОЙ СЦЕНАРИЙ. Второе по значимости направление изменчивости рисует довольно сложную картину: три ядра положительных значений на юге, северо-западе и севере, и ядро отрицательных значений на востоке. Подобные «четырёх-ядерные» ландшафты характерны для третьих компонент генофонда Восточной Европы (см. главу 8). Карту мы не приводим, так как важность этой компоненты невелика. Она описывает четвертую часть (26 %) общей изменчивости всех восьми гаплогрупп, то есть её значимость лишь в два раза выше каждой из исходных карт отдельных гаплогрупп.
Таблица 6.3.4.
Гаплогруппы Y хромосомы, корреляция которых с картами 1, 2 или 3 главных компонент превышает 0.4 (г>0.4)
Примечание: коэффициенты корреляции указаны по модулю.
РУССКИЕ ПОПУЛЯЦИИ В ГЕНЕТИЧЕСКОМ ПРОСТРАНСТВЕ
График многомерного шкалирования (рис. 6.3.12.) показывает относительное сходство всех 14 популяций друг с другом по частотам гаплогрупп Y хромосомы. (Этот график построен точно так же, как и график по гаплогруппам мтДНК, рассмотренный в § 3 раздела 6.2.). В нижней части графика виден плотный кластер из восьми популяций, тогда как остальные шесть популяций разбросаны далеко друг от друга в верхней части графика. Важно то, что все популяции, образовавшие компактный кластер, происходят из южной и центральной части русского ареала. И наоборот, все северные популяции генетически удалены друг от друга, занимая разные углы верхней половины графика.
Характерно, что в нижней половине графика (рис. 6.3.12.) оказались те популяции, которые на карте первой главной компоненты (рис. 6.3.11.) входят в зону положительных значений, а популяции, которые на карте обладают отрицательными значениями компоненты, на графике отошли в его верхнюю часть. На графике своеобразен северо-запад — одна из псковских популяций примыкает к южному кластеру, тогда как вторая вошла в «северную» зону.
Рис. 6.3.12. График многомерного шкалирования русских популяций по гаплогруппам Y хромосомы [Balanovsky et al., 2008].
Основная закономерность, видимая на графике, состоит в том, что на юге сходство популяций намного больше, чем на севере ареала.
ИТОГИ
Из такого чёткого соответствия между географией популяций и генетическими расстояниями между ними можно сделать два вывода.
Во-первых, мы вновь убедились в значимости различий между севером и югом русского ареала.
Во-вторых, на севере различия между популяциями намного выше. Центральные и южные русские популяции в сравнении с Русским Севером кажутся близнецами.
Портрет при нехватке пикселей — Гетерогенность — Широтность — Неповторимость — Многосоставность — Гаплотипы мтДНК — Сциллы, Харибды, Прокрусты… — Финно-угорский субстрат — Гаплогруппы Y хромосомы — Удивительная чёткость их географии — Опять финно-угры — Сходство портретов: кисти Классика и кисти Игрека — Итоги прошлого — Фундамент будущего
В этой главе мы постарались рассмотреть и обобщить все полученные к настоящему времени данные по ДНК полиморфизму в русских популяциях. Данных накопилось не то чтобы мало, скорее они бессистемны. Нам пришлось оставить за бортом всё то множество «одиноких» ДНК маркёров, которые изучены только в одной-двух русских популяциях. Ведь для выявления структуры генофонда русского народа нужны знания не о фрагментах, а о репрезентативном ряде его регионов.
ОСОБЕННОСТИ ГЛАВЫ О ДНК МАРКЁРАХ
Кроме важности самого предмета (ДНК полиморфизма) и ограниченного материала (объёма исходных данных), у этой главы есть и ещё одна особенность. Если в прочих главах мы анализируем те исходные данные, которые получены в разное время многими другими исследователями, то данные по ДНК полиморфизму в большинстве наши собственные — нашего коллектива и совместных работ с коллегами из других институтов, проведённых в рамках единого плана. Поскольку общий объём ДНК данных по русским популяциям невелик, это и позволило одному коллективу внести заметный вклад в общую копилку. Это вызывает у нас и больший интерес к ДНК данным, прочувствованным кончиками пальцев (а в экспедиционной части — и на своей шкуре), и большую уверенность в их интерпретации. Ведь экспедиция в каждую популяцию планировалась, исходя из этногенеза русского народа. Но главное — мы можем быть уверены в сопоставимости результатов, поскольку все популяции обследовались единым коллективом и по единой программе.
Повторимся, что для анализа генофонда годятся лишь маркёры, изученные во многих популяциях. Поэтому из аутосомных маркёров (первый раздел этой главы) мы рассмотрели лишь один, но наиболее подробно изученный — CCR5del32. Остальные разделы главы посвящены митохондриальной ДНК и Y хромосоме — системам, ставшим за последние 10 лет стандартом международных популяционных исследований. Но и по ним объём данных невелик. В науке накопились данные о 16 русских популяциях по мтДНК и 19 популяций по Y хромосоме[45]. Но из них только 10 популяций по мтДНК и 14 по Y хромосоме подходят для анализа структуры генофонда. Для сравнения — по антропологической программе изучена 181 популяция, дерматоглифической — 28, по классическим маркёрам в среднем 35, по фамилиям — 839 популяций. То есть ДНК маркёры, давая нам, по всей видимости, самую прямую информацию о генофонде, могут дать её лишь по немногим русским популяциям. И если по остальным маркёрам мы получаем изображение генофонда, составленное из десятков и сотен «пикселей», то для ДНК маркёров мы должны домысливать портрет генофонда по наброскам, составленным всего из десятка точек. Но поскольку во всех современных работах изучается именно ДНК полиморфизм, то в скором будущем можно ожидать значительного увеличения массива данных. Тогда станет ясно, насколько верны наши наброски генетических рельефов отдельных гаплогрупп. Утешает более высокая изменчивость мтДНК и тем более Y хромосомы (рис. 6.3.10.) — это вселяет надежду, что большая дифференцирующая способность самих маркёров отчасти компенсирует нехватку популяций.
Что же касается «обобщённого портрета» генофонда, то в его правдивости уже сейчас можно быть уверенным: главный сценарий изменчивости по ДНК маркёрам подтверждён независимыми свидетелями — главными сценариями антропологических данных и классических маркёров генетики, завершающими две предыдущие главы (4 и 5).
В том и состоит задача нашей книги, чтобы подытожить сведения о русском генофонде, собранные по антропологическим признакам и классическим маркёрам, и сравнить их с имеющимися уже сейчас данными по ДНК полиморфизму. Анализ каждого их этих столь разных типов маркёров (к тому же изученных в разных популяциях) проводится одними и теми же методами, что даёт реальную возможность их сравнения. Скорее всего, массивы данных по антропологическим и классическим маркёрам уже не будут значительно увеличиваться. Тем важнее научиться извлекать из них основную информацию о русском генофонде. Это позволит строить новые исследования ДНК полиморфизма не на песке расхожих мнений, а на каменном фундаменте, заложенном предыдущими научными исследованиями.
КАРКАС ГЕНОФОНДА
Основной вывод состоит в сходстве результатов, полученных по антропологическим признакам (и соматологии, и дерматоглифики), классическим маркёрам и ДНК маркёрам. Сходство показаний стольких (и столь разных!) очевидцев говорит о том, что для изучения основных черт генофонда, основных событий в истории популяций, основных географических закономерностей, основных взаимосвязей между демографией, географией, генетикой и историей населения можно пользоваться каждым из этих типов маркёров. Но самый верный путь — использовать все эти маркёры совместно. Взаимный контроль позволяет исключить влияние той субъективности, которую неизбежно вносит любой очевидец даже куда более простых событий, чем история русского генофонда.
Вкратце, эти основные результаты по русскому генофонду, полученные по всем системам признаков, можно свести к нескольким положениям.
1. РУССКИЙ ГЕНОФОНД ГЕТЕРОГЕНЕН: популяции из разных его частей значительно различаются между собой. Это «значительно», конечно же, относительно. Прежде всего, относительно Европы, но также и масштаба ареала. Гетерогенность русского народа выше, чем в среднем по Европе, но и сам русский ареал намного больше других этнических территорий.
2. ОСНОВНАЯ ЧЕРТА ГЕНОФОНДА — РАЗЛИЧИЯ МЕЖДУ СЕВЕРНЫМИ И ЮЖНЫМИ ПОПУЛЯЦИЯМИ. Постепенное широтное (север<=»юг) изменение значений главных компонент выявилось по всем пяти независимым системам признаков — соматологии, дерматоглифики, классических маркёров, Y хромосомы и фамилий (главы 4–7). Да и на картах отдельных признаков часто выявляется широтная изменчивость с теми или иными особенностями.
3. ГЕОГРАФИЧЕСКАЯ ИЗМЕНЧИВОСТЬ В ПРЕДЕЛАХ РУССКОГО АРЕАЛА НЕ ПРОДОЛЖАЕТ ГЛОБАЛЬНЫЕ ТРЕНДЫ МНОГИХ ПРИЗНАКОВ, а вырисовывает сложную внутреннюю структуру русского генофонда. Например, если евразийский тренд CCR5 — это ярко выраженное снижение частоты мутации с северо-запада Евразии во всех направлениях, то в русском генофонде на северо-западе не более высокие, а напротив, сниженные частоты мутации.
4. В РУССКОМ ГЕНОФОНДЕ ВИДНЫ ЧЕРТЫ СХОДСТВА С СОСЕДЯМИ, в особенности с финно-угорскими популяциями (как западными, так и восточными финно-уграми). Это говорит о той роли, которую сыграли финно-угорские племена в формировании русского генофонда.
Все эти общие закономерности русского генофонда выявились по данным и о мтДНК, и о Y хромосоме.
МИТОХОНДРИАЛЬНАЯ ДНК
ВЫСОКАЯ ГЕТЕРОГЕННОСТЬ. Различия русских популяций по частотам гаплогрупп мтДНК составили d=0.033. Этот размах различий между русскими популяциями столь же велик, как, например, различия по мтДНК между всеми популяциями Балканского региона, известного пестротой этнического состава и сложной историей популяций.
СЕВЕР — ЮГ. Частоты многих гаплогрупп мтДНК подчиняются широтной закономерности. Это выявилось и на графике многомерного шкалирования, построенного по частотам гаплогрупп: северные русские популяции заняли обособленное положение от кластера центральных и южных популяций.
ГАПЛОТИПЫ. Для мтДНК, в отличие от прочих систем признаков, можно провести и иные виды анализа, основанные не на частотах гаплогрупп, а на данных о спектре встреченных гаплотипов. Эта особенность вызвана огромным числом существующих гаплотипов мтДНК, намного большим, чем число аллелей любого другого локуса и уступающим лишь разнообразию фамилий. Тем самым мы получаем в руки не десяток, а сотни независимых маркёров, по которым можем сравнивать популяции.
ВСЁ НЕ ТАК ПРОСТО… Но в этом потоке данных есть камни, как легко заметные, так и подводные. Поэтому мы уделили много места методическим вопросам сравнения гаплотипов.
Во-первых, мы попробовали оценить общее число гаплотипов мтДНК, существующих не в выборках из популяций, а в самих реальных популяциях. Для этого изучили, как растет число гаплотипов в зависимости от объёма выборки. И оказалось, что даже при выборках в тысячу человек число невыявленных гаплотипов (в сравнении с числом выявленных) остается всё таким же огромным.
Поэтому вторым нашим шагом стала разработка метода подсчёта числа общих гаплотипов. Выяснилось, что объёмы выборок влияют самым решительным образом как на число, так и на долю общих гаплотипов между популяциями.
Чтобы избежать этого влияния объёмов выборок и получить несмещённые оценки, мы предложили «прокрустов» метод: проводить все сравнения на выборках одного и того же объёма, исключая «лишние» образцы из анализа.
ФИННО-УГОРСКИЙ СУБСТРАТ. Рассчитанные этим методом показатели выявили сходство русского генофонда как со славянскими, так и с финно-угорскими народами. Но оказалось, что доля общих гаплотипов у русских выше с финноязычными народами (как восточными, так и западными), чем с южными и западными славянами. Это наглядно демонстрирует вклад финно-угорского субстрата в русский генофонд, по крайней мере — по материнской линии.
Y ХРОМОСОМА
ФИННО-УГОРСКИЙ СУБСТРАТ. Впрочем, анализ Y хромосомы показывает, что и по отцовской линии этот вклад весьма велик. Из всех генетических систем — эта самая новая и быстро развивающаяся, и её использование для изучения русских популяций только начинается. Литературные данные немногочисленны. И мы провели специальный анализ русского генофонда, впервые обрисовавший его портрет по гаплогруппам Y хромосомы. Анализ проведён по собственным данным по частотам гаплогрупп Y хромосомы в 14 русских популяциях.
В таблице 6.4.1. приведена сводка данных по восьми гаплогруппам Y хромосомы, наиболее частым у народов Европы (подробнее данные приведены на нашем сайте www.genofond.ru).
ВЫСОКАЯ ГЕТЕРОГЕННОСТЬ. По Y хромосоме выявились необычайно высокие различия русских популяций между собой — в среднем d=0.142. Они намного выше, чем различия по мтДНК (d=0.033) или по аутосомным маркёрам (d=0.013). Гетерогенность русского генофонда по данным об Y хромосоме — одна из самых высоких среди народов Европы.
СЕВЕР — ЮГ. График многомерного шкалирования показывает, что эти различия особенно выражены между северными русскими популяциями, тогда как все южные и центральные популяции генетически более похожи друг на друга.
ГЕОГРАФИЯ ГАПЛОГРУПП Y ХРОМОСОМЫ. Из восьми гаплогрупп, наиболее распространённых
в русском генофонде, самая частая (R1a) оказалась «местной», свойственной всей Восточной Европе. Остальные гаплогруппы показывают взаимосвязи русских популяций с населением многих регионов. Перечислим их в порядке значимости: северо-восток Европы/Сибирь (гаплогруппа N3); Северная Европа (гаплогруппа I1а); Западная Европа (гаплогруппа R1b); Балканы (гаплогруппа I1b) и возможно другие регионы Южной Европы (гаплогруппы E3b, J2); Западная Сибирь/Урал (гаплогруппа N2).
Распределение этих гаплогрупп внутри русского ареала идет по географическим градиентам: для гаплогрупп R1a, N3 и lib они являются широтными, для остальных гаплогрупп — более сложными.
СХОДСТВО ОБОБЩЕННЫХ ПОРТРЕТОВ
Карта первой главной компоненты ДНК маркёров (Y хромосомы), обобщающая географические тренды всех гаплогрупп — чётко широтная. И её высокое сходство с картами первых компонент по другим системам (классические маркёры, антропология, фамилии) указывает, с одной стороны, на то, что и маркёры Y хромосомы идут в одном строю с другими системами признаков. С другой стороны, такое сходство под-тверждаёт надёжность результатов, полученных по Y хромосоме. Действительно, согласованность данных по Y хромосоме с данными по другим системам признаков удивительна: первая главная компонента изменчивости гаплогрупп Y хромосомы высоко коррелирует и с первой главной компонентой изменчивости классических генетических маркёров, и с первой компонентой антропологических признаков, и с первой компонентой дерматоглифики. Коэффициенты корреляции составляют соответственно 0.71, 0.73, 0.50 (табл. 6.4.1), сами карты представлены в заключительных разделах каждой главы.
ИТОГИ
Итак, анализ полиморфизма аутосомных маркёров, митохондриальной ДНК и Y хромосомы в русском генофонде выявил большое разнообразие русских популяций. Географически это разнообразие выражается, в первую очередь, в различиях между северными и южными русскими популяциями, при этом размах межпопуляционного разнообразия в пределах северной половины намного больше, чем на юге. Данные и по мтДНК, и по Y хромосоме указывают на финно-угорский субстрат в русском генофонде. Такие же выводы получены в предыдущих главах при изучении антропологических признаков и классических маркёров. Особенность ДНК маркёров (в первую очередь Y хромосомы) — в удивительной чёткости географического распределения гаплогрупп. По сравнению с большинством карт распространения классических маркёров (карты в главе 5), карты гаплогрупп Y хромосомы ясны, прозрачны и наглядно показывают генетические взаимоотношения популяций.
Авторы надеются, что результаты, описанные в этой главе, окажутся лишь прологом для интенсивных исследований структуры русского генофонда на основе как маркёров мтДНК и Y хромосомы, так и других систем ДНК полиморфизма.
Таблица 6.4.1.
Частоты гаплогрупп Y хромосомы у народов Европы и Передней Азии (среднеэтнические частоты в процентах).
Таблица 6.4.1.
Коэффициенты корреляции между главными компонентами изменчивости гаплогрупп Y хромосомы и других типов признаков — соматологии, дерматоглифики, фамилий и классических маркёров.
Примечания:
1. Рассчитаны ранговые коэффициенты корреляции между картами первых трёх главных компонент пяти типов признаков: соматологии, дерматоглифики, классических маркёров, фамилий, гаплогрупп Y хромосомы.
2. Значения ниже 0.2 не показаны (обозначены как «-»).
3. Значения около 0.5 и выше выделены шрифтом и заливкой.
4. Коэффициент корреляции указан по модулю.
5. Корреляции между компонентами одного ранга (например, между всеми первыми компонентами) выделены прямоугольниками.
Нынче поутру зашел ко мне доктор; его имя Вернер, но он русский. Что тут удивительного? Я знал одного Иванова, который был немец.
Изучение «фонда фамилий» может стать изучением генофонда. Передаваясь в чреде поколений, фамилии начинают вести себя подобно генам. Причём они вторят тем генам, которые генетика сейчас считает самыми информативными для изучения истории генофонда — «однородительским» маркёрам. В предыдущей главе мы уже дали описание этих маркёров: гаплогрупп Y хромосомы (NRY), передающихся по отцовской линии, и митохондриального генома (мтДНК), наследующегося по материнской линии. Теперь к ним можно добавить и фамилии — «квазигенетические» однородительские маркёры, передающиеся по отцовской линии.
Но, конечно же, фамилии, даже называясь квази-генетическими маркёрами, совсем не похожи на обычные гены. Фамилии не подчинены суровым биологическим законам, а следуют многозначным путям развития языка и культуры. Поэтому фамилии, передаваясь из поколения в поколение, ведут себя очень свободно — столь часто и прихотливо «мутируют», что прослеживать судьбу каждой из фамилий в отдельности непросто. Более того, одни и те же фамилии могут возникать независимо в разных точках пространства и времени, имитируя генетическое родство между исторически несвязанными популяциями.
Но, к счастью, изучение прихотливой истории отдельной фамилии не входит в обязанности популяционного генетика. Если мы хотим изучить генофонд в целом, то судьбы отдельных фамилий нам не столь важны — важно лишь, позволяет ли это «мелькающее отраженье» (Н. Гумилев) уловить общий образ генофонда. Если позволяет, и если мы найдём инструмент, чтобы извлечь такую общую информацию из географической изменчивости фамилий, то становится ясно: пренебречь столь ярким маркёром нельзя.
Именно одним маркёром, потому что всё множество фамилий можно приравнять к аллелям всего лишь одного локуса. И только из восхищения их многообразием мы называем фамилии обычно во множественном числе — «маркёрами». Впрочем, и здесь фамилии не одиноки. И другие «однородительские маркёры» являются по сути одним геном. Все гаплогруппы мтДНК — аллельные варианты одного локуса, и все гаплотипы Y хромосомы — аллельные варианты другого локуса.
Есть у фамилий и весьма замечательное достоинство, недоступное всём другим маркёрам. По фамилиям можно изучить всю популяцию целиком, а не только маленькую выборку из неё, как это приходится делать по любым признакам генетики и антропологии. Тем самым снимается весь клубок вопросов — а отражает ли выборка из популяции её реальный генофонд? И если отражает, то как?
Это достоинство фамилий столь велико, что мы не могли остаться равнодушными: организовали сбор и геногеографическое изучение русских фамилий. Хотя эта работа ещё в самом начале — нужны многие годы для кропотливого собирания данных по огромному русскому ареалу и их анализа — но первые итоги можно подвести и сейчас.
— Фамилию я согласен наследственную принять.
— Как? Наследственную? Именно?
— Шариков.
Фамилии и гены друг другу сродни — След в след — Фамилии спешат на помощь генетике — «Осмысленные» маркёры — Слишком изменчивы? — Зато представительны! — Как изучает фамилии лингвистика — И как с ними работает генетика
Генетическая летопись народа несёт в себе знаки не столько биологической истории популяции, сколько истории сложения народа. Поэтому и изучение фонда фамилий, вторящего генофонду, может стать историческим источником об этногенезе, о древних и современных массовых миграциях населения. Какие же свойства фамилий позволяют им стать маркёрами почти генетическими («квазигенетическими»)?
ЧТО ОБЩЕГО У ФАМИЛИЙ С ГЕНАМИ?
Методика применения фамилий в качестве аналога генетических маркёров общеизвестна. Она была разработана. F. Crow и А. P. Mange [Crow, Mange, 1965], получила широкое распространение и дальнейшее развитие как за рубежом, так и в работах отечественных генетиков — Ю. Г. Рычкова, А. А. Ревазова, Е. К. Гинтера, их последователей и учеников.
Главным аргументом, позволившим фамилиям стать инструментом популяционной генетики, стало прямое сравнение двух оценок межпопуляционных различий: одна — рассчитывалась по фамилиям, а вторая — по «истинно» генетическим маркёрам. У самых разных народов были параллельно изучены и частоты фамилий, и частоты классических маркёров генетики.
Затем оценена гетерогенность этих народов по фамилиям и по генам. Это позволило напрямую сравнить полученные величины гетерогенности — различий между популяциями одного и того же народа.
Смысл сравнения такой: если оценки гетерогенности по фамилиям (fr) окажутся близки к оценке гетерогенности по генам (FST), значит, фамилии дают верный результат, и их можно использовать для изучения генофонда.
Рис. 7.1.1. Сходство оценок гетерогенности генофонда, полученных по генам и по фамилиям
Оказалось, что у каждого из народов, проверенных таким способом, оценки гетерогенности по генам и по фамилиям очень близки друг к другу (рис. 7.1.1). А фамилии этих народов ничем не были похожи друг на друга — изучены народы и Прибалтики (литовцы), и Кавказа (адыгейцы), и Сибири (алтайцы, эвенки), и Дальнего Востока (нивхи, народы Приморья).
Мы видим, что какой бы народ мы не взяли, фамилии и гены ведут себя столь похоже, что их трудно различить. Так же трудно, как близнецов-братьев. Это удивительное сходство оценок по фамилиям и по генам даёт нам полное право использовать фамилии как аналоги генов и изучать с помощью фамилий генофонды.
ФАМИЛИИ СПЕШАТ НА ПОМОЩЬ ГЕНЕТИКЕ
Мы уже говорили, что антропологами (глава 4) были изучены более 180 (!) русских популяций. Это позволило выделить ареалы антропологических типов. На таком фоне особенно заметно, сколь неполны генетические исследования. Причина в том, что генетическое изучение требует забора крови и дорогостоящих лабораторных исследований. Поэтому классические маркёры исследованы в среднем лишь в 35 русских популяциях (глава 5), а изучение ДНК маркёров только-только перешло за первый десяток популяций (глава 6).
Причина столь уважительна, что становится ясно, что генетике вряд ли удастся догнать антропологию и выявить популяционную структуру столь же детально. И вместе с тем, очевидно, что только такое же подробное, с анализом локальной изменчивости, изучение русского генофонда способно дать реальные знания об его внутренней структуре и истории формирования.
Что же делать? Неожиданный выход из этой тупиковой ситуации дают фамилии. Фамилии можно изучить не в десятках популяций, и не в ста популяциях, а в сотнях и тысячах! И при этом мы, наконец, сумеем охватить исследованием не отдельные избранные популяции, а весь ареал целиком. Если антропологи тратят до получаса на обследование одного человека, а суммарные затраты времени генетиков в пересчёте «на один образец» намного больше, то «квазигенетик», работая с похозяйственными книгами в сельской администрации, может собрать сведения о фамилиях пятисот человек всего за несколько часов, а работа с компьютерными списками населения ещё многократно ускоряет процесс сбора первичных данных. Этим достоинством, столь важным для создания портрета генофонда, обладают лишь фамилии. Поэтому данными о разнообразии фонда фамилий занялись именно генетики.
Все прочие признаки, с помощью которых мы познаём генофонд, всегда дважды связаны с выборочным процессом.
Во-первых, это выборка самих популяций. Ведь для исследования выбирается малая часть из огромного массива реально существующих популяций. И мы всегда зависим от того, насколько правдиво эти «делегаты» рассказывают о той части населения, от имени которой они выступают.
Во-вторых, это выборка из популяции. Ведь для исследования выбирается малая толика людей из всего населения. И мы всегда зависим от того, насколько достойно эти «избранники» представляют свою популяцию.
При изучении фамилий можно вообще отказаться от выборок: и от избранных популяций, и от избранных людей. Можно изучать всю тотальную популяцию — со всеми малыми популяциями, и со всеми людьми, в них входящими. Используя этот источник информации в параллель классическим и ДНК маркёрам, мы можем получить максимально полную картину генофонда.
Итак, уникальное преимущество фамилий — возможность охватить огромное число популяций, причём не выборочно, а тотально — все население региона.
Недостаток фамилий — их чрезвычайная вариабельность не только в пространстве, но и во времени.
Поэтому в географии отдельной фамилии обычно проявляются итоги частных событий, и отдельные фамилии мало пригодны для изучения общих черт генофонда. Но если сравнить популяции не по одной, а по большому числу фамилий, то появляется надежда, что мы сможем добыть достоверную информацию о генофонде: оценить его подразделённость на исторически сформировавшиеся группы населения, выявить следы массовых миграционных потоков. Поэтому для изучения русского генофонда мы использовали фамилии не как явление лингвистики, этнографии или фольклора, а как особый класс генетических маркёров.
Причём ярких и «осмысленных» маркёров, которые охватывают сотни тысяч людей из сотен популяций и позволяют с новой стороны взглянуть на географическую изменчивость русского генофонда.
РУССКИЕ ФАМИЛИИ В ЛИНГВИСТИКЕ
В антропонимике (науке об именах и фамилиях) известны определённые закономерности процесса становления фамилий: их возникновение в определённых социальных слоях, более раннее появление фамилий на экономически развитых территориях и т. д., причём процесс «офамиливания» требует времени.
Фамилия — это семейное имя, то есть имя, носимое всеми членами семьи. Сам термин «фамилия» внедрился в России поздно — после указов Петра I. «Однако фамилии как элемент именования русских людей существовали и раньше, но назывались они прозвищами, прозваниями. В этом же значения употреблялось слово назвище. В царских указах о проведении переписей населения обычно говорилось, что следует записать всех людей, проживающих в таких-то местностях, «по именам с отцы и с прозвищи», т. е. по имени, отчеству и фамилии» [Суслова, Суперанская, 1991, с. 157].
Становление русских фамилий происходило на протяжении нескольких столетий. Княжеские фамилии появляются в XIV веке из названий уделов, а впоследствии, как и у бояр, из отчеств. Фамилии дворян складываются в XVI–XVII вв., также преимущественно из отчеств; основная часть духовенства приобретает фамилии в конце XVIII века, при этом более ранние зачастую происходят от названий церквей. У «именитого купечества» фамилии регистрируются с XVI века. Однако у основной массы населения (кроме внутрисемейных имён и имён, полученных при крещении) издревле бытовали так называемые «уличные» фамилии, «назвища» (имена, данные «улицей», общиной). Уличные фамилии в русской деревне существовали очень давно. Именно они попадали в переписные листы, когда требовалось записать всех жителей «по именам с отцы и с прозвищи». Они не были строго регламентированы, поскольку не фиксировались в обязательном порядке, но, тем не менее, передавались из поколения в поколение. Нередко человек обладал сложной составной фамилией, включавшей производные от семейного имени (например, Толстой), отчества (Иванов) и уличной фамилии (Коробейников). Так, например, Григорий Лукьяныч Скуратов нам более известен под семейным именем Мал юты. В 1861 году был принят закон о введении фамилий у всего населения страны. В крестьянской среде источниками послужили уличные фамилии, фамилии из отчеств или фамилии помещиков. Тем не менее, закрепление крестьянских фамилий порой продолжалось и в начале XX века, окончательно устоявшись лишь при сплошной паспортизации. «Отсутствие у крестьян вплоть до недавнего времени… фамилий, как особых, официальных именований, которые записываются в документах и связаны с различного рода регистрациями населения… объясняется образом жизни русского крестьянства, которое в массе своей постоянно проживало в деревне. В своих родных местах паспорта никому не требовались, а потому и не возникало необходимости в особом официальном именовании» [Суслова, Суперанская, 1991, с. 157].
Целый ряд работ посвящён изучению распространения русских фамилий и их географической приуроченности. Как правило, выделение зоны накопления/возникновения той или иной фамилии интерпретировалось с позиций диалектологии. В ряде случаев показано совпадение территорий встречаемости фамилий, возникших от диалектных слов, с ареалами этих диалектов. Анализировалось распространение и «кустов» фамилий, группируемых, например, по финалям. Так, например, фамилии с окончанием «-очкин» чаще встречаются в юго-западных областях, фамилии на «-ых», «-их» распространены на северных и южных территориях, но отсутствуют в центральных и т. д. Важно подчеркнуть, что в ряде работ выделяются также ареалы фамилий и их групп, связываемые с территориями русских княжеств. По-видимому, фамилии, возникая, распространялись в рамках административно-территориальных общностей [Никонов, 1974; Никонов, 1988; Суперанская и др., 1984].
Однако существует и другой способ исследования фамилий, когда изучаются не произвольно взятые фамилии или их группы, а одновременно исследуются массовые выборки фамилий на обширной территории методом картографирования. В нашей работе осуществлён вариант именно такого «массового» анализа современных русских фамилий: использованы методы непрерывного картографирования и обобщённого картографического анализа всего фонда фамилий.
РУССКИЕ ФАМИЛИИ В ГЕНЕТИКЕ
Частоты русских фамилий широко использовались для анализа инбридинга и груза наследственной патологии в Архангельской, Костромской, Кировской, Курской, Белгородской областях. Эти работы, в течение 20 лет проводимые академиком РАМН Е. К. Гинтером и его школой, создали важнейшую основу для изучения русского генофонда [Ревазов и др., 1986; Ельчинова и др., 1988; Гинтер и др., 1993, 1994; Чурносов, 1997; Сорокина, 2005]. Однако анализ ограничивался группой районов в одной области — «гипервариабельность» русских фамилий привела к заключению об их пригодности лишь при изучении небольших групп населения [Ельчинова и др., 1991 а, б].
Первое исследование в общерусском масштабе было проведено А. П. Бужиловой для 75 распространённых фамилий [Бужило-ва, 1999]. Результаты этого анализа показали, что географическая изменчивость распространённых русских фамилий отражает не только события районного масштаба, но и этническую историю русского народа в целом: обнаружена связь между зонами накопления определённых фамилий и основными антропологическими типами русского этноса [Бужилова, 1999]. В этом исследовании распространённость фамилий определялась по «качественному» принципу «есть-нет»: наличие или отсутствие фамилии в данной популяции. Успешность этого исследования позволила нам сделать следующий шаг и перейти к количественному анализу — не по принципу «есть-нет», а по частотам встречаемости фамилий. Такой количественный анализ полностью аналогичен анализу «настоящих» генетических маркёров. Поэтому мы провели компьютерный картографический анализ изменчивости частот встречаемости фамилий в русском ареале — причём как для тех же 75 распространённых фамилий (чтобы включить в анализ и данные, собранные А. П. Бужиловой), так и для всего фонда изученных нами русских фамилий (для оценки инбридинга).
Благодаря проведению в течение последних пяти лет (при поддержке РГНФ и РФФИ) интенсивных экспедиционных исследований, созданию Банка данных «ONOMA», преобразованию и анализу огромного массива информации (см. главу 3), мы впервые можем сравнить основные группы русского народа по всему фонду фамилий. Чем полнее будет становиться Банк, тем точнее мы сможем по разнообразию фамилий (см. Приложение) познавать разнообразие русского генофонда.
Кто откуда? — «Исконный», сельский, коренной… — От списков фамилий к их частотам — 67 тысяч русских фамилий — Пять основных регионов и три окраинных — И ещё 50 сельсоветов
В этом разделе мы опишем наши исходные данные о русских популяциях, включённые в «фамильный» анализ — их ареал, требования к популяциям, организацию данных. Описание банка «ONOMA» и сложных процедур преобразования списочного состава фамилий в популяционные частоты дано в Приложении (раздел 5).
Информация о фамилиях с каждым годом пополняется, и постепенно новые данные включаются в разные виды анализа. Но обновление и пересчёты — процесс бесконечный. Поэтому в этой главе мы решили сосредоточить внимание на пяти «главных» регионах и для них провели все основные виды анализа. В часть расчётов мы включили и информацию о трёх «окраинных» регионах. Но неполнота имеющейся информации пусть не огорчает читателя. Мы специально так спланировали исследование фамилий,
чтобы, охватив пять основных географических групп русского населения (запад, восток, север, юг, центр), получить общее представление о структуре фонда фамилий. А затем уже, представляя новые данные на сайте, можно бесконечно пополнять и уточнять «фамильный» портрет русского народа.
ГЕОГРАФИЯ ПОПУЛЯЦИЙ
На рисунке 7.2.1. показано географическое положение и условные названия изученных нами восьми регионов — пяти «основных» регионов (Восток, Центр, Запад, Север, Юг) и трёх «окраинных» регионов (Северо-Запад, Казаки, Сибирь). Всю условность таких названий мы сознаём, но они так просты и понятны! Экспедиционная работа по сбору фамилий была спланирована так, что среднее расстояние между пятью «основными» регионами превышает 1000 км. Эти пять регионов заключены внутри треугольника «окраинных» регионов, каждый из которых представляет свой тип окраин: Северо-Запад — рубеж ареала, Казаки
— этнографическая группа, Сибирь — «запредельный» генофонд, вне «исконного» ареала. Состав регионов и информация об их изученности приведены в таблице 7.2.1.
Мы взяли на себя смелость привести на этой карте (рис. 7.2.1.) взгляд на изученные русские популяции как бы «из космоса». И сделали это не случайно. «Лицом к лицу Лица не увидать. Большое видится на расстоянии» (С. Есенин). Мы часто недооцениваем масштабы русского ареала. Порой нам кажется, что от Мадрида до Парижа — бесконечность, а от казаков до поморов — рукой подать. На этой карте видно, что даже на фоне двух континентов — Евразии и Африки — изученные нами популяции занимают значительное пространство. Это важно иметь в виду, рассматривая изменчивость русских фамилий.
Рис. 7.2.1. Расположение восьми регионов, изученных по составу русских фамилий
Условные названия для регионов, изученных по фамилиям:
КАЗАКИ — кубанские казаки; ЮГ — Южный регион, ЗАПАД — Западный регион, СЕВЕРО-ЗАПАД — Северо-Западный регион, ЦЕНТР — Центральный регион, ВОСТОК — Восточный регион, СЕВЕР — Северный регион, СИБИРЬ — Сибирский регион.
В анализ включены данные о фамилиях более миллиона человек старше 18 лет, представлены более тысячи сельских популяций (табл. 7.2.1). Рассмотрим принципы организации и отбора данных.
Таблица 7.2.1.
Характеристика регионов, изученных по частотам фамилий
АРЕАЛ
Поскольку мы хотим изучить историю сложения генофонда, то нам нельзя опираться на популяции, сформировавшиеся исторически недавно в результате переселений или смешений. Этногенез народа и структуру генофонда необходимо сначала изучить по его «этническому ядру», а уже потом можно перейти к отдельным, поздно выделившимся популяциям.
Поэтому, хотя этнический ареал русских на протяжении столетий неуклонно расширялся, включая сначала окраины Русской равнины, а потом Урал, Сибирь, Кавказ и иные отдалённые земли, мы вновь, как и в предыдущих главах, ограничиваем его «исконной» территорией. География «исконных» популяций вновь повторяет основной маршрут Русской антропологической экспедиции, доныне остающейся образцом популяционных исследований и изучившей русский народ именно в «этнической зоне формирования русского населения в XI–XIV вв.» [Происхождение…, 1965].
Наше исследование охватывает основную историческую территорию формирования русского народа, которую мы условно называем «исконной» (см. Введение, главу 1). Данные охватывают коренное сельское население, мало затронутое миграциями последнего столетия.
В основные виды анализа мы не включали русские популяции, оторванные от основного ареала. В качестве дополнительного анализа нами изучены две такие популяции: кубанские казаки и население Сибири. Эти две популяции помогут нам бегло взглянуть, как ведут себя фамилии за пределами основного исторического ареала.
СЕЛЬСКОЕ НАСЕЛЕНИЕ
В анализ включалось только сельское население, а также небольшие города, сформировавшиеся из населения окружающих деревень.
Конечно, это очень сокращает объём данных и очень увеличивает объём работы. Города изучать быстро и весело — сразу в одном пункте получаешь информацию об огромном массиве населения. Исключив данные по городам, мы, конечно же, резко сокращаем объём выборки. Однако в любой популяционно-генетической работе всегда приходится проводить раздельно анализ сельского и городского населения — слишком разные генетические процессы они отражают, и слишком быстро меняется состав городов при общественно-политических переменах [Курбатова, 1975, 2004; Курбатова, Победоносцева, 1992; Медико-генетическое описание…, 1997; Наследственные болезни…., 2002].
Нашей задачей было изучение истории сложения русского генофонда, а не его сиюминутного состояния. Поэтому фамилии, как и генетические данные, должны отражать коренное население, сосредоточенное не в городах, а на селе. Изучение городского населения — чрезвычайно любопытная, но отдельная задача, выходящая за рамки этой книги.
Лишь данные по Кемеровской области включают и сельское, и городское население, поскольку и то, и другое является некоренным.
ФАМИЛИИ
По мере изучения всё новых популяций пополнялся общий список фамилий, встреченных в коренном русском населении. До этого было неизвестно даже приблизительно общее число русских фамилий. Теперь мы точно знаем, по крайней мере, нижнюю оценку: более шестидесяти тысяч фамилий, и располагаем их списком.
Насколько список фамилий может увеличиться? Ведь изучен только 1 млн. человек, а численность русского населения России, по данным последней переписи — в 116 раз больше. Поэтому сказать, сколько всего существует русских фамилий, пока нельзя. Однако было бы ошибкой предполагать, что их станет тоже в 116 раз больше. И не только потому, что уже изучен один миллион человек (это не так много для изменчивых фамилий), а потому, что изучено сельское население основных географических групп русского народа. Поэтому выборка, не столь большая по общей численности, достаточно обширна в географическом измерении. Для создания полного списка фамилий это намного лучше, чем выборка пусть и большая по численности, но лишь из одного региона.
Однако пока «насыщение» списка фамилий не достигнуто — так же, как и для гаплотипов митохондриальной ДНК (см. раздел 6.2) новые популяции приносят новые фамилии и выход на плато пока не виден. Из таблицы 7.2.1. и без специальных расчётов видно, что количество встреченных фамилий прямо зависит от числа изученных человек.
ИСХОДНЫЕ СПИСКИ ФАМИЛИЙ
Основной источник данных о фамилиях — списки населения для каждой популяции, в которых указана фамилия каждого жителя, достигшего «официального» репродуктивного возраста (дети до 18 лет не учитываются). Эти списки «тотальные», то есть они охватывают всё население изученной популяции — населённого пункта, сельсовета, района. Эти списки населения переводятся в компьютерный вид, и на их основе рассчитывается частота каждой фамилии в каждой популяции — в каждом населённом пункте, в сельсовете, в районе, в регионе.
РАСЧЁТ ЧАСТОТ ФАМИЛИЙ
Частоты всех фамилий сначала рассчитывались для каждой группы популяций (группа тесно связанных деревень — сельская администрация, сельсовет, волость). Её средняя численность — 1 тыс. человек (старше 18 лет). Далее усреднением данных по всем группам популяций данного района (где «весом» каждой группы популяций служила её численность) рассчитывались частоты всех фамилий в районе. Средняя численность носителей фамилий в районе — 20 тыс. человек. Далее по совокупности «районных» частот были рассчитаны невзвешенные средние частоты фамилий в регионе. Средняя численность изученного населения в регионе — 190 тыс. человек. А затем уже по совокупности региональных частот рассчитаны невзвешенные средние частоты фамилий в русском генофонде в целом. При расчёте «среднерусских» частот учитывались лишь «основные» регионы.
ОСНОВНЫЕ РЕГИОНЫ
Пять регионов — Восточный, Центральный, Западный, Северный, Южный — представляют основные географические подразделения генофонда в «исконном» ареале. Они составили основу анализа русского генофонда по фамилиям и потому называются «основными».
ЮЖНЫЙ РЕГИОН. Сразу бросается в глаза непропорционально большая численность Южного региона. Дело в том, что формированию репрезентативной выборки из него пришлось уделить особое внимание. Самый первый вариант анализа включал три региона — Восточный, Западный и Южный. Мы собрали данные о фамилиях так, что каждый регион был представлен примерно равной численностью — около 100 тысяч человек. Однако оказалось, что в Южном регионе самыми частыми оказались «местные» фамилии, а не широко распространённые в русском народе. Это было неожиданно, так как на юге миграции наиболее интенсивны, что должно было принести туда много фамилий из других регионов. Поэтому мы предположили, что наша выборка неадекватна — представленные фамилии характерны лишь для конкретных изученных популяций и не отражают регион в целом. Чтобы избежать этого, мы резко (в шесть раз!) увеличили число изученных индивидов и районов на юге русского ареала (точнее — на юго-западе, который отражает наиболее древние пласты в сложении русского народа и надёжнее представляет юг Руси, чем юго-восточные популяции). Причём, в отличие от других регионов, Южный регион включил данные не по одной, а по трём областям. Однако, как мы увидим ниже, своеобразие Южного региона при этом не исчезло: оно оказалось его реальной особенностью.
ЗАПАДНЫЙ И ВОСТОЧНЫЙ РЕГИОНЫ представлены и равным числом популяций (≈160 популяций), и равной численностью (фамилии ≈100 тысяч человек).
СЕВЕРНЫЙ РЕГИОН не случайно представлен меньшей выборкой. Она соответствует резкому снижению плотности населения. Меньшая плотность населения часто сопровождается дрейфом генов. Поэтому популяции, разбросанные по бескрайним просторам Архангельской области, могли значительно отличаться друг от друга по составу и частотам фамилий. И мы приложили специальные усилия, что бы охватить все части Архангельской области. Поэтому, хотя число изученных районов невелико, но эти пять районов представляют разные части обширного Русского Севера: это Каргопольский район (юго-запад Архангельской области), Холмогорский (её север), Пинежский (самый восток, верховья Пинеги, на границе с республикой Коми), Лешуконский (северо-восток, на Мезени), Красноборский (юго-восток, вблизи границы с Вологодской областью).
ЦЕНТРАЛЬНЫЙ РЕГИОН. Все усилия были направлены на изучение четырёх географически контрастных регионов «исконного» русского ареала. Поэтому пятый, Центральный регион пока ограничен очень небольшой выборкой. Он представлен лишь одним районом (фамилии 25 тысяч человек), но этот район мы выбирали тщательно. Кашинский район связан с древней историей тверских земель и мало затронут демографическими преобразованиями последнего времени. По частотам фамилий он оказался действительно центральным, но необходимо помнить о возможном смещении характеристик из-за небольшого объёма данных.
ОКРАИННЫЕ РЕГИОНЫ
Три группы популяций, указанных в таблице 7.2.1. как «окраинные регионы», привлекались лишь в отдельных видах анализа.
СЕВЕРО-ЗАПАДНЫЙ РЕГИОН находится на границе «исконного» ареала и в дальнейшем, наряду с другими новыми данными по «исконному» ареалу, будет включён в основной анализ русского генофонда. Однако этот регион по составу фамилий оказался столь своеобразен, что мы отказались от его объединения с данными Западного региона (представленного Смоленской областью). Несмотря на малочисленность данных, Северо-Западный регион представлен населением двух исторически различных районов Псковской области: Островский район издревле относился к псковским землям, в то время как территория Порховского района входила в новгородские земли, и только после падения Великого Новгорода отошла во владения Пскова. Северо-Западный регион представляет обширный и важнейший пласт в истории русского генофонда, обладает своеобразными чертами фонда фамилий, и мы рассматриваем его как самостоятельный регион.
КУБАНСКИЕ КАЗАКИ расселены вблизи южной границы «исконного» русского ареала, и история их формирования общеизвестна. Они были поселены здесь на исходе Кавказской войны в середине XIX века и образованы частью из донских казаков, частью из русских переселенцев из южной и из центральной России. Хотя казаки по определению являются «профессиональной» группой служилых людей[46], они обычно рассматриваются как своеобразная этнографическая группа русского этноса.
Подчеркнём, в анализ включено не просто русское население тех территорий, где когда-то обитали казаки. Поскольку в их прежнем ареале проживает масса недавних мигрантов из разных регионов России, то общие списки пришлого («русского») населения здесь непригодны. Поэтому данные были собраны Э. А. Почешховой только для потомков кубанских казаков и непосредственно по похозяйственным книгам тех казачьих станиц, где они проживают компактно. Итак, в список включались фамилии только потомков кубанских казаков, а недавнее пришлое русское население не учитывалось. Причём это та самая популяция, которую мы рассматривали при анализе ДНК маркёров (глава 6). Мы старались проводить комплексный анализ — в тех же популяциях, где собирались образцы для ДНК маркёров, проводился тотальный сбор фамилий.
СИБИРЬ. Современное население Кемеровской области представляет иной пласт поздних миграций русских — в Сибирь. Мы не отбирали старожильческое население Сибири, а включили всех нынешних жителей. Освоение русскими Сибири — и особенно на поздних «индустриальных» этапах в XX веке — включило великое множество разных миграций. Население Кемеровской области сформировалось из слияний множества потоков миграций, находится за пределами времени и пространства сложения русского народа, включает городское население. Поэтому на фамилии современного населения Кемеровской области (собранные М. Б. Лавряшиной и М. А. Ульяновой) можно взглянуть как на модель современного населения, ушедшего за пределы «исконного» русского ареала. Возможно, оно может служить и некой моделью нашего будущего.
ДОПОЛНИТЕЛЬНЫЕ ПОПУЛЯЦИИ — ТОЛЬКО ДЛЯ КАРТ
И, наконец, последняя группа — данные о частотах фамилий в отдельных малых популяциях. Они использовались только при построении карт фамилий и составили половину всех картографированных популяций.
Эти данные о 50 сельсоветах, разбросанных по всему «исконному» ареалу русского народа — в 44 районах 15 областей европейской России. Это означает, что каждый район здесь представлен лишь одной, редко двумя малыми популяциями (сельсоветами). Поэтому эффект случайности (генетически говоря, дрейф) должен был сказаться на этих данных, приводя к значительным случайным колебаниям частот фамилий. Нам пришлось включить их в карты фамилий, так как они представляют 15 областей, а основной массив наших данных — только 7 областей. Именно фамилии, встреченные в 50 малых популяциях, ограничивают картографический анализ общим числом только 75 фамилий. Но они оказали неоценимую помощь, поскольку дают хотя бы примерную информацию по тем областям, по которым у нас нет полных данных. А для картографирования необходимо располагать информацией по многим областям!
Рис. 7.2.2. Расположение изученных популяций-районов (большие кружки) и популяций-сельсоветов (малые кружки)
На рис. 7.2.2. «точками» обозначены 50 популяций-сельсоветов (их суммарная численность 25 тыс. чел.). «Кружками» обозначена вторая половина — 50 популяций-районов (943 тыс. чел.). Это два разных уровня иерархии. Каждый из районов включал данные о фамилиях в 15–25 сельсоветах — каждый кружок-район можно было бы изобразить как 20 точек-сельсоветов, расположенных близко друг к другу. Поэтому частоты фамилий в популяциях-районах намного «устойчивей», чем частоты в популяциях-сельсоветах.
Поэтому мы сравнили карты фамилий, построенные по 50 популяциям-сельсоветам, и карты по объединённым 100 популяциям. Результаты оказались неожиданными: главные закономерности, выявленные картами популяций-сельсоветов, сохранились и на объединённых картах! Все основные структурообразующие элементы верно предсказывались «сельсоветными» картами. Введение огромного массива информации во многом уточнило и «досказало» угаданные ранее закономерности, но не отринуло их.
Вот уж действительно парадоксально надёжные маркёры!
БЛАГОДАРНОСТИ
Конечно же, собрать столь большие массивы данных можно только большим дружным коллективом, которому авторы хотели бы выразить свою искреннюю признательность. Мы уже указывали, что дополнительные данные по 75 распространённым русским фамилиям в 51 сельсовете были собраны д.и.н. А. П. Бужиловой (Институт археологии РАН) почти 20 лет назад. Значительная часть информации по Костромской области также собиралась ещё в «докомпьютерное» время коллективом, которым руководил д.м.н. А. А. Ревазов (МГНЦ РАМН). Эти данные были введены в компьютерную базу данных и тем самым обрели вторую жизнь благодаря усилиям нашей сотрудницы Д. С. Соловьевой (ГУ МГНЦ РАМН).
Однако весь основной массив информации собирался нами в рамках работы по грантам РФФИ и РГНФ (см. главу 3). Данные по Архангельской области помогла нам собрать проф. И. В. Евсеева (Северный медицинский университет), а в Смоленской области — к.м.н. Н. Н. Аболмасов (Смоленская медицинская академия). Во всех областях Южного региона работа велась к.б.н. И. Н. Сорокиной под руководством проф. М. И. Чурносова (Белгородский госуниверситет). Данные по западносибирской популяции были собраны к.б.н. М. Б. Лавряшиной и М. А. Ульяновой (Кемеровский госуниверситет). Данные по кубанским казакам собирались к.м.н. Э. А Почешховой и проф. В. И. Голубцовым (Кубанская медицинская академия). Данные по десяти районам из пяти областей (Архангельской, Смоленской, Псковской, Тверской, Костромской) были собраны лично авторами этой книги. В создании компьютерной базы данных и их многостороннем анализе основная работа легла на плечи С. М. Субботы (ГУП ВИГСТАР) и Д. С. Соловьевой (ГУ МГНЦ РАМН).
И это только малая часть имён — сколько сотрудников не только научных или учебных коллективов, но и администраций районов и сельских администраций помогали нам для того, чтобы фамилии жителей их регионов могли дать новые свидетельства об истории русского народа! Низкий им поклон за это.
Мифы и легенды русских фамилий.
§ 1. Частые фамилии: «Топ-20» — По местам! — Сходство регионов средней полосы (Запад, Центр, Восток) — Своеобразие полярных регионов (Север и Юг) — Три модели окраинных регионов (Северо-Запад, казаки, Сибирь) — Частые фамилии отражают «лицо» региона
§ 2. Редкие фамилии: Геногеография или кунсткамера? — Редкий значит «пришелец» — Прополка фамилий — Остаётся четверть фамилий, но «коренных» — Отсеивается лишь четверть людей, но «пришельцев» — Работаем только с «коренными»
§ 3. «Всеобщие» фамилии: Есть ли повсеместные фамилии? — 257 «всеобщих» русских фамилий — Все они коренные — Но в каждом регионе со своей частотой — «Осмысленная» классификация фамилий — Календарные — «Звериные» — Профессиональные — «Приметные» — Иные
С фамилиями нелегко — их всегда сопровождает эскорт легенд, мифов и предрассудков.
ФАМИЛЬНЫЕ МИФЫ
Столкновение мифов — вполне реальное сотрясение.
Ежи Лец.
Ведь каждый из нас сталкивается с фамилиями на каждом шагу, и удержаться от того, чтобы придумать свой миф о закономерностях их распространения, очень трудно. Поэтому многие из нас чувствуют себя специалистом в области ономастики, со знанием дела трактуя встреченные на жизненном пути яркие факты из жизни и превращений тех или иных запавших в душу фамилий. Однако по ярким блёсткам трудно судить о геологической породе в целом. То же можно сказать и о человеческой породе. Яркие блёстки гениев Пушкина и Жуковского ещё не означают, что русский генофонд сформирован при существенном вкладе «арапов» и «турчанок». Основной массив русских заключал браки по поговорке «хоть за курицу, да на свою улицу», и именно этот массив определяет структуру генофонда. Однако как только речь заходит о фамилиях, за деревьями исчезает лес, и расхожие представления о географии той или иной фамилии не дают увидеть истинной картины.
Эти заблуждения полностью разделяли и авторы книги, пока не провели анализ распределения фамилий. Каждый шаг этого анализа вызывал, с одной стороны, изумление — перед стройностью картины и её полном несоответствии ожидаемой, а с другой стороны, грусть — сколько, оказывается, бытует неосознанных «фамильных» мифов и расхожих толкований.
Например, по умолчанию предполагается, что самые частые русские фамилии — календарные, т. е. произведённые от имён православного русского календаря («святцы»). Говоря: «Ивановы, Петровы, Сидоровы», мы считаем, что очертили образ «самых русских» фамилий. И сразу же готова цепь поверхностных объяснений и скорых выводов. Например: 1) поскольку фамилия образована от имени, она просто заменяет отчество (Иванов — «Иванов сын»); 2) поэтому фамилия не наследуется, заменяясь в следующих поколениях на производные от других имён; 3) Ивановых так много от того, что так много Иоаннов в святцах и Иванов на Руси (поскольку имя давалось по календарю в день крещения, то в некоторых семьях было по два и даже три сына Ивана); 4) оттого Ивановы и повсюду, что везде называли по одним и тем же святцам.
РАЗВЕНЧАНИЕ МИФОВ
Однако из этой цепочки представлений следует: 1) что календарные фамилии распространены повсеместно; 2) примерно с равной частотой во всех популяциях;
3) частота календарной фамилии во всех русских популяциях определяется частотой этого имени в святцах. Так ли это? Забегая вперёд, скажем, что всё оказалось совсем не так! Например, календарные фамилии преобладают лишь на западе русского ареала. Так в Псковской области они действительно оказались настолько часты, что, встретив некалендарную фамилию при генетическом обследовании, мы начинали въедливо доискиваться, а не было ли по отцовской линии «не псковских» предков? — и часто оказывались правы. Однако в других регионах календарные фамилии отходят на второй план. Более того, даже фамилии Иванов и Петров оказались распространены отнюдь не равномерно по русскому ареалу. Есть такие популяции, в которых они практически отсутствуют. И что ещё более удивительно — есть географические закономерности в распространении даже фамилии Иванов, не говоря о многих других фамилиях! Даже столь краткая информация говорит о том, что исходные представления зачастую неверны и не соответствуют реалиям.
Этим примером мы вовсе не надеемся убедить читателя. На опыте знаем, что переубедить в отношении фамилий просто невозможно! Те, кто имел в роду Ивановых или же бескорыстно интересовался реальным распространением этой фамилии, скажут, что изложенные факты общеизвестны. Те, кто не интересовался Ивановыми, скажут, что это, конечно же, любопытно, но вот другие фамилии… И перейдут к волнующим их фактам из жизни иной фамилии. Но в обоих случаях забывается, что Ивановы служили нам просто примером для проверки подсознательно ожидаемой картины, причём примером, показавшим, что эта картина неверна и строится на ошибочных суждениях.
ЗАБУДЕМ О МИФАХ?
Поэтому мы призываем читателя лишь на время забыть о наших субъективных представлениях и беспристрастно рассмотреть несколько более объективные цифры, которые несут некую информацию о реальном распространении фамилий. Причём важно помнить, что все эти цифры нужны нам для изучения фамилий не как таковых, а как маркёров генофонда. Даже в том случае, когда мы будем уделять внимание какой-то одной фамилии — она будет для нас важна лишь в той мере, в какой она отражает закономерности всего фонда фамилий. А потом уже, получив информацию о фонде фамилий в целом, каждому из нас будет намного увлекательнее возвращаться к конкретным фамилиям, уже представляя их соотношение с общей картиной, оживляя и расцвечивая общий фон причудливыми событиями биографии отдельных фамилий.
После этих вводных слов перейдём, наконец, к сухим цифрам частот фамилий в разных регионах — именно такие беспристрастные данные позволят отделить научные факты от мифов.
НАЗОВЕМ ФАМИЛИИ ПОИМЁННО
Добавим лишь ещё одно пояснение нашего подхода. Дело в том, что популяционная генетика, приблизив к себе фамилии и присвоив им почётное звание «квазигенетических», решительно забыла о сути фамилий как таковых. Они стали просто безличным аналогом генов. Достаточно взглянуть на любую работу по русским фамилиям — мы встретим лишь обычные генетико-статистические показатели и ни одного намёка на содержательную сторону фамилий. А ведь в них скрыта значительная глубина дополнительной информации о генофонде. Странно, что генетика, привлекая далёкие от неё данные лингвистики, этнографии, археологии, очень внимательна к их содержательной стороне, а самым близким к генетике данным о фамилиях, она отказывает в содержании.
Мы же надеялись, что если мы вглядимся в лицо фамилий, если мы сравним их «поимённо», если учтём смысловую нагрузку фамилий, которая вложена в них историей популяций и языка, то семантика фамилий создаст новый источник информации о генофонде. Не менее важный, чем стандартные показатели популяционной генетики. Их мы также рассмотрели максимально полно в заключительном разделе 7.6. Однако три раздела (7.3., 7.4., 7.5.) мы целиком посвятили попытке вернуть фамилиям, работающим в генетике, их лицо и извлечь новую, не безликую, а ёмкую и расцвеченную всей красотой русского языка информацию о пространственной структуре русского генофонда.
Мы попытались сравнить регионы по «индивидуальным» особенностям фамилий. Насколько эта попытка оказалась успешной — судить читателю. Для нас самих она словно раскрыла глаза и позволила увидеть не скупые статистические показатели, а образы генофонда, яркие черты его «фамильных» портретов. Мы надеемся, что простота красок, использованных для написания этих портретов, не смутит читателя. Они просты не оттого, что авторы не умеют или не любят считать, а оттого, что мы хотели бережно сохранить всё своеобразие этого необычного и парадоксально надёжного маркёра — фамилий.
Обзор русских фамилий стоит начать, конечно же, с самых частых. Именно они привлекают наше внимание, когда мы говорим о различиях между русскими землями.
Частыми мы будем называть только те фамилии, которые вошли в «топ-20» — самую верхушку списка фамилий, расположенных по убыванию частот. Мы решили ответить на вопрос — а могут ли они служить визитной карточкой каждого региона? Могут ли самые частые фамилии что-то рассказать о генофондах? Попробуем пока кратко ответить на эти вопросы. А составление полных фамильных портретов регионов отложим до раздела 7.4.
АЛГОРИТМЫ АНАЛИЗА
Для каждого из восьми регионов составлен полный список фамилий, встреченных в нём.
Для каждой фамилии рассчитана её средняя частота в данном регионе.
Во всех списках фамилии расположены по убыванию их частоты.
В результате мы получили восемь таких списков частот фамилий — по числу изученных регионов.
Первые 20 фамилий этих восьми списков («топ-20»), а также первые 20 фамилий девятого — магистрального списка — приведены в таблицах 7.3.1. и 7.3.2.
Этот девятый — главный — список содержит средние частоты фамилий, рассчитанные для русского генофонда в целом. Поэтому он условно называется «магистральным списком» фамилий. Частоты фамилий в нём рассчитаны как средние только по пяти «основным» регионам. И в этом списке фамилии также расположены в порядке убывания их частоты.
«ИНДЕКС МЕСТА» (Index place — IР). Каждой фамилии присвоен её порядковый номер в «магистральном списке». Например, самой частой фамилии присвоен № 1, десятой — порядковый номер № 10, сотой — № 100 и так далее. Теперь, когда у каждой из 67 тысяч русских фамилий есть свой собственный номер, можно для каждого региона рассчитать «индекс места». Порядковый номер будет означать «балл» редкости данной фамилии (чем больше балл, тем реже эта фамилия в русском генофонде в целом), а индекс места — представляет просто сумму таких баллов, набранных частыми фамилиями региона, деленную на число суммированных фамилий. Чем меньше сумма баллов — тем ближе регион к «общему порядку» русских фамилий, тем менее своеобразен регион по частым фамилиям. Поэтому «индекс места» позволяет количественно оценить степень сходства отдельного региона со всём русским генофондом по спектру (а не по частоте) самых частых фамилий в этом регионе. Величина этого показателя будет минимальна для тех регионов, которые по частотам самых частых фамилий больше всего приближаются к «магистральному списку» русских фамилий. Поэтому такой «индекс места» является своеобразной мерой генетических расстояний региона от общерусского генофонда.
Иными словами, показатель сходства IР — сумма «магистральных» порядковых номеров фамилий в региональном списке, деленная на число суммированных частых фамилий.
IP10 — сумма баллов десяти самых частых фамилий, деленная на 10.
Мы рассчитали три показателя для каждого региона — IР20, IР10, IР5. Но поскольку они полностью вторят друг другу, здесь мы приведём лишь один показатель — IР10.
Частые фамилии сразу же преподнесли нам сюрприз: оказалось, что они умеют классифицировать регионы. Для трёх регионов средней полосы — Восточного, Западного и Центрального — наиболее частыми оказались «магистральные» фамилии. А для полярных Северного и Южного регионов в перечень самых частых фамилий входят «местные», характерные для этих территорий. Читатель может и сам проверить это утверждение, сравнив списки самых частых фамилий каждого региона (табл. 7.3.1.) с магистральным списком (табл. 7.3.2).
Таблица 7.3.1.
Двадцать наиболее частых фамилий для каждого из пяти основных регионов (фамилии расположены по убыванию частоты их встречаемости в «своём» регионе)
Двадцать наиболее частых фамилий для каждого из трёх «окраинных» регионов и для «магистрального» списка русских фамилий (фамилии расположены по убыванию частоты их встречаемости)
СХОДСТВО РЕГИОНОВ средней полосы
Рис. 7.3.1. Показатель своеобразия фамилий регионов по «топ-10» (индекс места IР10)
Индекс места IР10 показывает, что все три региона средней полосы близки к спектру общерусских фамилий — к «магистральному списку». Значения IР10 незначительно варьируют около среднего для трёх регионов значения IР10=11.
Это свойство регионов средней полосы устойчиво — оно не зависит от того, рассматриваем ли мы «топ-5», «топ-10» или же «топ-20». В любом случае все три региона выступают «единым фронтом» против полярных регионов. Пока отметим лишь эту примечательную черту — а подробный анализ проведём для каждого региона отдельно при составлении его «фамильного портрета» (раздел 7.3).
ЧАСТОТЫ ЛИДЕРОВ
Каковы частоты пяти лидирующих фамилий?
ВОСТОЧНЫЙ регион: Смирнов (5.9 %), Лебедев (2.0 %), Кузнецов (1.9 %), Соколов (1.8 %), Виноградов (1.1 %).
ЦЕНТРАЛЬНЫЙ регион: Смирнов (2.3 %), Иванов (1.9 %), Соколов (1.5 %), Кузнецов (1.4 %) и Лебедев (1.3 %).
ЗАПАДНЫЙ регион: Иванов (2.8 %), Новиков (1.2 %), Козлов (1.0 %), Васильев (0.9 %), Петров (0.9 %).
К ним мы относим Северный и Южный регионы вовсе не потому, что они географически полярны. Нет, оказалось, что они полярны и по самым частым фамилиям: они обнаружили собственные, своеобразные спектры частых фамилий (табл. 7.3.1).
СВОЕОБРАЗИЕ ПОЛЯРНЫХ РЕГИОНОВ
Сравнение показывает, что Южный и Северный регионы обладают ярко выраженным своеобразием их спектра частых фамилий. А в каждом из трёх других регионов (средней полосы), наиболее частыми являются те фамилии, которые распространены в русском народе в целом.
Индекс места IР10 подтверждает «полярный» феномен: и Северный, и Южный регионы значительно отличаются от общерусского спектра самых частых фамилий. Спектр частых фамилий в Северном регионе (IP10=40) в 4 раза «своеобразнее», чем в регионах средней полосы (IР10=11). А спектр самых частых фамилий в Южном регионе (IР10=78) отличается ещё значительнее — в 8 раз.
Вновь подчеркнём, что своеобразие Южного региона не связано с самым большим объёмом изученного населения. Нет, Южный регион занимал своё особое место и тогда, когда в анализ были включены только 100 тысяч человек — то есть столько же, как в Восточном и Западном регионах
Примечательно, что в обоих «своеобразных» регионах на первое место вышла одна и та же фамилия — Поповы (см. карту её распространения в § 2 раздела 7.5).
«МЕСТНЫЕ» ФАМИЛИИ
Главной чертой обоих регионов являются собственные «местные» фамилии, характерные только для этого региона.
СЕВЕРНЫЙ регион — Хромцов (1.6 %), Булыгин (1.3 %), Поташев (0.8 %), Рябов (0.8 %), Черноусое (0.7 %), Бобрецов (0.8 %).
ЮЖНЫЙ регион — Гончаров (0.5 %), Шевченко (0.4 %), Колесников (0.4 %), Бондаренко (0.3 %), Ткаченко (0.3 %).
Причём встречаются эти «местные» фамилии со столь высокой частотой, что часть из них вошла даже в пятерку лидеров.
ЧАСТОТЫ ЛИДЕРОВ
СЕВЕРНЫЙ регион: Попов (1.8 %), Хромцов (1.6 %), Булыгин (1.3 %), Богданов (0.9 %), Кузнецов (0.9 %).
ЮЖНЫЙ регион: Попов (0.8 %), Гончаров (0.5 %), Шевченко (0.4 %), Ковалёв (0.4 %), Иванов (0.4 %).
Какие фамилии наиболее часты на периферии ареала? На этот вопрос нам поможет ответить табл. 7.3.2. Напомним, что каждый из трёх окраинных регионов демонстрирует особый вариант «окраинности». Северо-Западный регион — просто пограничный, находится на самом западном рубеже. Казачество — это «профессиональная» группа, ставшая с ходом истории особой этнографической группой русского народа. Сибирский региона — это уже даже не окраинный, а «запредельный» регион, ушедший далеко за рубежи исторического ареала формирования русского народа.
СЕВЕРО-ЗАПАДНЫЙ РЕГИОН
На северо-западе русского ареала резко преобладают календарные фамилии. Все двадцать наиболее частых фамилий — календарные. Более того, даже из 50 самых частых фамилий Северо-Западного региона 42 фамилии календарные (то есть произведённые от имён православного календаря). Таким обилием календарных фамилий Северо-Запад резко выделяется из всех остальных регионов.
И всё же надо решить, к какому из соседних регионов тяготеет Северо-Западный регион — к Северному или же к Западному (к которому он географически наиболее близок)? Индекс места IР10 однозначно показывает: Северо-Западный регион по степени отличий от «магистрального списка» фамилий оказывается очень близок к Северному, а вовсе не к Западному региону (рис. 7.3.1).
Это означает, что по степени своеобразия частых фамилий Северо-Западный регион никак нельзя отнести к регионам среднерусской полосы. Это действительно «окраинный» регион.
ЧАСТОТЫ ЛИДЕРОВ: Иванов (1.2 %), Васильев (0.9 %), Петров (0.5 %), Фёдоров (0.4 %), Михайлов (0.4.%).
КУБАНСКИЕ КАЗАКИ
На противоположной, южной оконечности русского ареала частые фамилии также своеобразны. Как и в Южном регионе, у казаков много фамилий с необычными для русских фамилий финалями.
ФИНАЛЬ «-ЕНКО». Среди двадцати частых фамилий Южного региона оказалось четыре фамилии, оканчивающихся на «енко»: Шевченко, Бондаренко, Ткаченко, Кравченко. У казаков из двадцати частых три таких фамилии: Остапенко и те же Кравченко и Бондаренко. Но в Южном регионе они более частые — «Шевченко» занимает третье место, а в среднем фамилии на «енко» среди двадцати самых частых занимают девятое место. Это попадание в первую десятку может указывать на мощный пласт в Южном регионе фамилий, общих с украинскими. Среди кубанских казаков фамилии на «енко» встречаются реже и среди двадцати самых частых занимают в среднем четырнадцатое место. В целом в обоих регионах из двадцати самых частых фамилий почти треть необычны для большинства русских регионов. Это говорит об особом «южном» паттерне, общем и для кубанских казаков, и для Южного региона (Белгородская, Курская, Воронежская области).
Однако казаков нельзя рассматривать только как «филиал» соседнего Южного региона. По спектру фамилий сходство кубанских казаков с Западным и Центральным регионами практически такое же, как и с Южным регионом. Это сходство с центральными регионами обнаруживается не по особым фамилиям, отличающим эти две южные группы от остальных, а по «всеобщим» русским фамилиям, широко распространённым во всех регионах (табл. 7.3.1. и 7.3.2).
СВОЕОБРАЗИЕ СПЕКТРА ФАМИЛИЙ. Но всё же самая важная черта фамильного портрета кубанских казаков — это их своеобразие. Оно отражено индексами места, которые зашкаливают, достигая максимальных значений — 170 (табл. 7.3.2)! Количественные оценки (рис. 7.3.1) показывают особость фамилий кубанских казаков (IР10=170), которые на порядок своеобразнее, чем в среднем для основных русских регионов (IР10=30), и даже в два раза выше, чем в самом своеобразном из них Южном регионе (IР10=78).
Конечно, численность изученных популяций казаков невелика — 18 тыс. человек. Но не так велика и общая численность всех кубанских казаков — во всяком случае, соотношение «изученные популяции/весь регион» явно в пользу кубанских казаков. Тем более, что численность изученных популяций в Центральном регионе также невысока — 25 тыс. человек, однако это не помешало ему оказаться в самом центре русского генофонда, а не на его периферии, как кубанские казаки. Это сравнение вселяет уверенность, что данный нами набросок портрета кубанских казаков отражает их реальное яркое своеобразие в масштабе русского генофонда.
ЧАСТОТЫ ЛИДЕРОВ: Перминов (0.7 %), Петров (0.7 %), Попов (0.7 %), Пономарёв (0.7 %), Новиков (0.7 %).
Не правда ли, все лидеры идут одним строем, отличаясь лишь в сотых долях частот. И это тоже характерная черта фамилий казаков.
СИБИРЬ
Тут видим картину прямо противоположную — нет и следа казачьего своеобразия. Если кубанские казаки удалены на 1400 км от центра «исконного» русского ареала, то Сибирская популяция ещё в два раза дальше — 3000 км от Москвы. Но важнее иное — она оторвана от «исконного» ареала не столько географически, сколько исторически. Это зона переселенческая, промежуточная, текучая, которой бесконечные потоки новых миграций не дают сформировать своё собственное лицо — этнографическое, антропологическое, генетическое. И «фамильный» портрет этого Сибирского региона, несмотря на удалённость от «исконного» ареала, полностью вторит среднерусской полосе. Мы видим знакомый перечень самых частых фамилий (табл. 7.3.2).
ЧАСТОТЫ ЛИДЕРОВ: Иванов (1.1 %), Попов (0.7 %), Кузнецов (0.4 %), Петров (0.4 %), Смирнов (0.4 %).
По индексу места (рис. 7.3.1.) сибирские фамилии (IР10=15) оказались почти так же близки к «магистральным» фамилиям, как и регионы средней полосы (IР10=11). Сибирские фамилии намного ближе к «магистральному» набору фамилий, чем фамилии «полярных» регионов — Южного и Северного — представляющих «исконный» ареал (IР10=59).
Это говорит о том, что перед нами совершенно особое явление.
Рассмотренный нами Сибирский генофонд географически находится далеко за пределами «исконной» территории и как бы за пределами истории формирования русского народа: он образовался уже после того, как сложился облик русского генофонда. Но именно по этим причинам Сибирский генофонд, в отличие от казаков, и воспроизводит в себе некий обобщённый образ генофонда. Отсутствие собственной истории генофонда, равная удалённость от всех частей «исконного» ареала (при взгляде из Сибири как бы стираются расстояния между разными областями «исконного» ареала) и мощный миграционный поток «отовсюду» создают некий обобщённый образ русских фамилий. Географически и исторически «запредельный» генофонд в таких условиях оказывается более общерусским, чем многие «исконные» территории, у которых была своя собственная история, сформировавшая их отличия, их своеобычность.
Итак, группы населения, находящиеся на периферии «исконного» ареала, позволили увидеть две разных модели формирования спектра частых фамилий. Казаки и северо-запад, находясь на ближней периферии «исконного» ареала, тесно связаны с его историей и потому резко своеобразны. Сибирский же регион, находясь далеко за пределами исторического ареала, усреднён мятущимися ветрами миграций: он максимально близок к общерусскому спектру фамилий.
ИТОГИ
В заключение параграфа можно сформулировать методический вывод: даже рассмотрение только 20 самых частых фамилий позволяет классифицировать генофонды (правда, чтобы «вычислить» какие фамилии самые частые, надо знать их все!). Все выводы, сделанные только по частым фамилиям — и близость трёх регионов средней русской полосы, и своеобразие «полярных» регионов, и характеристики окраинных регионов — далее подтверждены самыми различными видами анализа (разделы 7.4.J.5.J.6).
Этот методический вывод — о возможности адекватной характеристики генофонда только по самым частым фамилиям — оказался неожиданным, так он прост. Но он позволяет делать первые выразительные наброски «фамильных» портретов регионов, не дожидаясь завершения сложных видов анализа по полным фамильным спискам регионов.
К сожалению, геногеография — не кунсткамера. Мы не можем собирать редкости. Напротив, чтобы включить фамилии в изучение истории генофонда, нам необходимо избавиться от «информационных шумов» — то есть редких для данной популяции фамилий, которые в ней исторически случайны, эфемерны и потому мало информативны для изучения истории её генофонда. А для этого надо определить — что же такое «редкие» фамилии?
«ДЕМОГРАФИЧЕСКИЙ» КРИТЕРИЙ
Единственная информация, которой мы располагаем в нашей базе данных о каждом человеке, это его фамилия и его населенный пункт. Но мы также знаем, сколько его однофамильцев встречено во всех прочих изученных пунктах. Как же, пользуясь только этой информацией, отсеять «пришлое» население? Есть три способа, и все они основываются на том, что пришельцев не может быть слишком много — пришлые фамилии в среднем более редкие, чем коренные. Первый способ — исключить фамилии с частотой ниже заданной (частотный критерий). Второй способ — исключить фамилии, встречающиеся только в одном-двух пунктах (территориальный критерий). Третий способ — исключить фамилии, численность которых во всём районе меньше заданной (демографический критерий).
Мы предложили «демографический» критерий для исключения «залётных» фамилий: фамилия включается в анализ, если число носителей данной фамилии, достигших репродуктивного возраста, превышает четыре человека в районе.
Подчеркнём, что именно в районе, а не в локальной популяции (селе, сельсовете). Это означает, что даже в том случае, если пять носителей фамилии разбросаны по разным весям одного района и в каждой из пяти отдалённых деревень есть лишь по одному носителю фамилии, то фамилия всё равно будет включена в анализ. Средняя численность сельских жителей, достигших репродуктивного возраста, в административных районах, изученных нами, составила около 25 000 человек (от 4000 до 60000). Достаточно пяти «однофамильцев» из многих тысяч сельских жителей района — и их фамилия уже включается в анализ. Таков «демографический» критерий.
Мы назвали его «демографическим», так как он соответствует генетико-демографическим представлениям о расширенном воспроизводстве семьи: двое родителей и более 2 детей, достигших репродуктивного возраста. Именно эти его свойства позволяют предположить, что этот критерий обеспечит отбор тех исторически «неслучайных» фамилий, у которых есть шанс закрепиться в данном генофонде.
Подчеркнём, что предложенный «демографический» критерий не является чрезмерно строгим. Достаточно всего пяти человек с данной фамилией из десятков тысяч жителей района для того, чтобы фамилия была включена в разряд «распространённых», т. е. предположительно «коренных» фамилий. Но при этом «демографический» критерий всё же позволяет отсеять те редкие фамилии, которые занесены миграционными потоками, но ещё не успели укорениться в данной популяции. Конечно же, вместе с пришлыми, «залётными» фамилиями могут быть отсеяны и исчезающие коренные фамилии. Все мы знаем случаи, когда из-за стечения обстоятельств не осталось мужского потомства, и потому старые «родовитые» фамилии затухают и исчезают. Но обычно редкие коренные фамилии составляют едва приметную часть среди множества редких пришлых фамилий.
ИСКЛЮЧЕНИЕ «ПРИШЛЫХ» ФАМИЛИЙ
Но к нашему удивлению, несмотря на свою мягкость, «демографический» критерий позволил нам исключить огромный массив редких фамилий. Они составили три четверти от всех встреченных фамилий (табл. 7.3.3).
Так, в Западном регионе после применения этого критерия из 13 тысяч фамилий осталось 3 тысячи: они причислены к «коренным», а 10 тысяч редких фамилий могут рассматриваться как «залётные» (ни в одном из 8 районов ни одна из этих фамилий не соответствует демографическому критерию). В Южном регионе — из 40 тысяч фамилий в основной анализ включаются 10 тысяч (30 тысяч отсеянных редких фамилий ни в одном из 24 районов не встречаются чаще, чем у четырёх жителей района). В Центральном — из 4 тысяч фамилий к коренным отнесена 1 тысяча фамилий. А в Северном регионе после отсева редких фамилий из 6 тысяч фамилий осталось менее 2 тысяч. Большинство расчётов мы проводили по оставшейся четверти — «коренным» фамилиям (то есть по фамилиям, уже «пустившим корни» в данной популяции, уже оставившим в ней генетический след). Благодаря этому, мы можем быть уверены, что мы изучаем историю формирования народа, а не мимолётные потоки последних миграций.
Важно подчеркнуть, что такая прополка фамилий почти не сокращает численность выборки! После применения демографического критерия (табл. 7.3.3.) отсеивается три четверти фамилий (число фамилий сокращается в среднем на 75 %), но число анализируемых индивидов сокращается только на одну пятую часть: в Северном и Восточном регионах отсеивается 22 % индивидов, в Западном
— 29 %, в Южном — 20 %, в Центральном — 21 %. Иными словами, число редких «пришлых» фамилий составляет три четверти всех фамилий, а число «пришлых» индивидов (их носителей) — лишь одну пятую часть всего населения. Это и понятно — ведь эти фамилии редки, и потому, несмотря на столь значительный массив редких фамилий, число их носителей невелико. И потому, исключив редкие «залётные» фамилии, мы исключаем из анализа небольшую часть популяции.
В дальнейший анализ мы включили ту информацию, которая осталась после отсева редких фамилий — данные о распространении 14428 условно «коренных» фамилий, охватывающую более 725 тыс. человек. Избавляясь от значительного «информационного шума» редких фамилий, мы переходим к анализу основной массы «коренного» населения данного региона — и при этом без существенных потерь в численности: носители «коренных» фамилий составляют в среднем 77 % от всего населения (табл. 7.3.3).
Таблица. 7.3.3.
Число фамилий и число индивидуумов до и после исключения редких фамилий
Итак, мы дали характеристику как самых частых фамилий (§ 1) так и самых редких фамилий (§ 2) сумев разделить фамилии в каждом районе на условно «залётные» (крайне редкие) и «коренные» (достаточно распространённые). Но всё же намного любопытнее иной вопрос — вопрос о наличии «всеобщих» фамилий на всём протяжении русского ареала.
Есть ли такие «всеобщие» фамилии, которые встречаются во всех географически разобщённых регионах? Сколько таких «общерусских» фамилий? Достаточно ли их для сравнения регионов друг с другом? Не окажется ли, что в каждом регионе свой собственный спектр фамилий, совершенно отличный от других регионов? Не распадается ли русский генофонд на части, не сравнимые друг с другом по составу фамилий? Эти опасения возникли не на пустом месте.
Дело в том, что в работах других исследователей фамилий русского народа [Ельчинова и др., 1991] отмечалось, что из-за малого числа «всеобщих» фамилий использование фамилий даёт адекватные результаты только при изучении соседних районов, в самом крайнем случае — соседних областей. Это означает, что изучать весь огромный русский генофонд по фамилиям вообще нельзя. Так ли это на самом деле? Теперь, когда собраны фамилии всех основных регионов русского ареала, можно попробовать ответить на этот вопрос с цифрами в руках.
МНОГО ЛИ ВСЕОБЩИХ ФАМИЛИЙ?
Уже в § 1 можно было заметить, что некоторые частые фамилии встречаются во всех регионах — они являются всеобщими. Но частые фамилии — это даже не вершина айсберга, а лишь горстка льдинок на его вершине. Поэтому надо выяснить: а сколько же всего всеобщих фамилий? Забегая вперёд, скажем, что их оказалось на удивление много! Это даёт нам полное право анализировать не только соседние, но и географически отдалённые территории.
Всеобщие фамилии нельзя выявлять напрямую, «в лоб». Мы уже видели на примере Сибирского региона, что мигранты создают некий общий фон фамилий, которые — благодаря только поздним «индустриальным» миграциям — могут встречаться повсеместно. Мигранты, пришельцы, «перекати поле» есть повсюду, и они разносят свои фамилии, делая их общими для всех регионов. Носителей каждой такой фамилии в регионе будет совсем немного, но много будет самих фамилий, и встретить мы можем эти «пришлые» фамилии повсюду, в любых регионах. Такая амальгама, покрывающая генофонд, ничего не расскажет нам о его истории. Напротив, она лишь скроет общность истории регионов под тонкой вуалью вездесущих «залётных» фамилий. Поэтому, если мы будем выявлять всеобщие фамилии для всего изученного населения, то «пришельцы» дадут нам массу «залётных» общих фамилий и заслонят те фамилии, которые действительно исторически связывают регионы.
Поэтому количество всеобщих фамилий мы оценили после того, как отсеяли редкие «пришлые» фамилии — иначе всеобщих фамилий было бы очень много.
Выше (§ 2) рассказывалось, как мы подошли к такой непростой «прополке» фамилий. В её результате (по «демографическому» критерию) отсеялось очень много — в среднем 75 % от всех встреченных в районе фамилий. То есть три четверти фамилий оказались редкими и с большой вероятностью были «залётными», «пришлыми». Только после того, как у нас осталась только четверть фамилий, которые можно было увереннее относить к «коренным», мы стали среди этого остатка выявлять всеобщие фамилии для регионов.
Даже при столь жёстких условиях, когда за бортом оставлена значительная масса «залётных» фамилий, число всеобщих для всех регионов фамилий оказалось неожиданно велико — 257 фамилий.
Это означает, что примерно десятая часть (13 %) «коренных» фамилий каждого региона встречается не только у него, и не только ещё в некоторых соседних регионах, но одновременно во всех пяти географически отдалённых регионах.
Но самое удивительное, что добавление в анализ самого отдалённого — Сибирского — региона убавило число «всеобщих» фамилий на ничтожную величину! Из списка исчезло всего 7 фамилий, не встреченных в Сибирском регионе. Это снова означает, что Сибирский регион не привнёс новых сведений в перечень всеобщих фамилий, и что изученные нами пять регионов в «исконном» русском ареале дают достаточно устойчивое представление обо всех «общерусских» фамилиях. Возможно, это говорит о том, что мы выявили главные черты портрета «общерусских» фамилий, список которых приведён в таблице 7.3.4.
Поскольку публикация этого списка «всеобщих» русских фамилий [КоммерсантЪ Власть, 2005] вызвала большой резонанс и большие недоразумения, просим читателя обратить внимание, что всеобщие фамилии — это вовсе не «топ-250», то есть вовсе не 250 самых частых русских фамилий! Это не вершина айсберга русских фамилий. Нет, перед Вами (табл. 7.3.4.) список, который намного важнее, чем «топ-250» — перед Вами полный список «всеобщих» русских фамилий. Он включает все фамилии, которые встречаются одновременно во всех пяти основных регионах «исконного» русского ареала, то есть исторического ареала формирования русского народа. Причём этот список содержит только «коренные» фамилии каждого из регионов — он получен после того, как в каждом из 50 изученных районов с помощью демографического критерия были отсеяны три четверти фамилий, отнесённых к редким, «залётным». А из оставшейся четверти «коренных» фамилий были отобраны только те фамилии, которые встречаются во всех пяти основных регионах. И потому полученный список «всеобщих» фамилий наиболее объективен — он включает фамилии, распространённые во всех основных русских регионах и отражающие наиболее общие черты «фамильного портрета» русского народа.
ГДЕ СКОЛЬКО?
Мы теперь знаем, что в среднем 13 % фамилий региона встречаются повсеместно в «исконном» русском ареале. Это действительно очень много! Но расскажут ли всеобщие фамилии об истории регионов? Не окажется ли так, что всеобщие фамилии отражают не общность происхождения населения, а просто общие для всех святцы (по которым даются имена, а от них календарные фамилии), общие для всех профессии (везде были и кузнецы, и священный сан), распространение одних и тех же зверей и птиц? Если это так, то всеобщие фамилии нам попросту неинтересны для восстановления истории народа. Ведь в таком случае они возникли в разных регионах независимо и ничего не говорят о родстве популяций. Более того, в таком случае они являются информационным шумом, мешающим разглядеть историю русского генофонда.
Но так ли это? Проверить гипотезу просто. Для этого надо лишь узнать, с какой частотой встречаются всеобщие фамилии в разных регионах. Нулевая гипотеза предполагает, что все фамилии возникали независимо в разных местах и определялись лишь частотой того или иного имени, профессии или зверя. Например, Ивановы-Петровы-Сидоровы везде возникали с той частотой, с какой они присутствуют в церковном календаре (святцах). А поскольку святцы всюду те же, то, согласно нулевой гипотезе, и всеобщие фамилии Ивановы-Петровы-Сидоровы должны встречаться в любом регионе с равной частотой. Но если же нулевая гипотеза неверна, то в разных регионах мы обнаружим разную частоту Ивановых-Петровых-Сидоровых.
Проверим, действительно ли всеобщие календарные фамилии имеют примерно одинаковую частоту во всех регионах? Охватить взглядом всё множество 250 «всеобщих» фамилий нелегко. Поэтому выберем из них первые пятьдесят (самые частые из всеобщих фамилий) и сравним по ним регионы (рис. 7.3.2.).
На рис. 7.3.2. представлена гистограмма всеобщих для пяти регионов фамилий.
График показывает ярче, чем любая таблица, что частоты фамилий быстро выходят на плато — лишь 10–20 из всеобщих фамилий можно отнести к самым частым. А остальные фамилии уже мало отличаются друг от друга по частоте. Это подтверждает справедливость сравнения регионов по «топ-5», «топ-10» и «топ-20» фамилий, проведенном в начале этого раздела (§ 1).
Укажем и на другую важнейшую черту гистограммы: общерусские фамилии не покрывают регионы неким аморфным равномерным покровом. Напротив, в каждом регионе общерусские фамилии встречаются со своей собственной, характерной частотой.
Например, обратим внимание на календарные фамилии. Именно для них мы могли ожидать равномерного распределения по всем регионам, поскольку везде имена давались по одним и тем же святцам. Набор таких фамилий на графике достаточно велик — 22 календарные фамилии. Но и для них мы не обнаруживаем единообразного распределения по регионам, не видим равномерного растекания по поверхности русского ареала.
Рис. 7.3.2. Частота встречаемости «топ-50» всеобщих фамилий в пяти регионах (Восточном, Центральном, Западном, Северном, Южном).
Примечания: Высота столбца отражает сумму частот данной фамилии в пяти регионах. Части столбца, выполненные той или иной штриховкой, соответствуют «вкладу» каждого из регионов в «общерусскую» частоту фамилии: белый цвет — Центр, косая штриховка — Восток, черный цвет — Юг, серый цвет — Запад, горизонтальная штриховка — Север.
Таблица 7.3.4.
Полный список и частоты 250 «всеобщих» фамилий, встречающихся во пяти регионах исторического ареала русского народа и в Сибири (расположены по убыванию средней русской частоты)
Итак, нулевая гипотеза не подтвердилась: оказалось, что всеобщие фамилии распространены в каждом регионе со своей собственной частотой. Это даёт твердое основание считать, что сравнение регионов по всеобщим фамилиям будет информативно для изучения истории генофонда.
КАКИЕ ФАМИЛИИ?
Чтобы ответить на этот вопрос, фамилии надо классифицировать.
В науке об именах указываются классы фамилий — и календарные, и «птичьи», и профессиональные. Но отнесение фамилии к тому или иному классу по плечу только специалисту в области науки об именах — ономастике. Во всех остальных областях (антропологии, дерматоглифики, археологии) мы работали рука об руку с известными специалистами. Но среди лингвистов мы так и не нашли таких, которые подключились бы к работе с нашим уникальным банком данных о фамилиях. Для обычного геногеографического анализа, когда фамилии используются как аналог генов, знания семантики, т. е. смыслового содержания фамилий, не нужны. Но чтобы обрисовать «фамильный портрет» генофонда, без такого знания уже не обойтись. Поэтому нам оставалось самим, чисто дилетантски набросать классификацию и разнести фамилии по классам.
Мы сознаём, что могли совершить при этом немало ошибок. Фамилия — непростое слово. Возможна, например, различная «звуковая запись», когда чужую речь укладываешь в слова, близкие родному языку. Примеров такой «народной этимологии» превеликое множество.
Так, остров Сахалин в русском быту прозывался «Соколиным» (В. Короленко. Соколинец). Ведь и вправду так ближе и понятнее? А сложная по звучанию коренная адыгейская фамилия (ведь в адыгейском языке в два раза больше звуков, чем букв в русском языке!) записывалась в паспорта как «Нехай», подражая украинскому языку. И вообще дилетант может придумать сколько угодно своих «переводов» фамилий. Авторы тоже имеют свою гипотезу из области «народной этимологии» — что самая частая восточная фамилия «Смирнов» происходит не от смирного характера, а от названия реки Унжа, переводимой с местного дославянско-го языка как «Смирная». Популяции по реке Унжа, где обнаружен максимум «Смирновых», были восточным рубежом славянского расселения. На запад от него, где и расселялись славяне, жили «смирные» славянизированные племена мери. А на восток от рубежа — воинственные племена мари. Примеры такой «народной этимологии» можно множить до бесконечности.
Сознавая неизбежность ошибок, мы всё же решились от безвыходности сами классифицировать фамилии, в уверенности, что статистический подход нивелирует случайные ошибки, и в надежде, что со временем найдётся профессионал, который нас исправит.
КАЛЕНДАРНЫЕ ФАМИЛИИ
Это фамилии, произведённые от имени из «святцев» — православного календаря.
Вопреки распространенному мнению, что самыми русскими фамилиями являются «Ивановы-Петровы-Сидоровы», в действительности оказалось, что в первой десятке («топ-10») общих фамилий есть лишь одна календарная (Иванов)! Календарные фамилии оттеснены в конец списка: если каждой дать балл, равный её порядковому номеру (фамилии расставлены по убыванию частоты), то средняя позиция календарных фамилий среди «топ-50» всеобщих фамилий окажется равной 31 — то есть они сосредоточены в «нижней» половине списка.
Но хотя и располагаясь в конце списка, календарные фамилии довольно многочисленны — 22 фамилии (44 % из «топ-50» всеобщих фамилий).
«ЗВЕРИНЫЕ» ФАМИЛИИ
К ним мы отнесли все фамилии, имеющие связь с живым на Земле — не только зверей, но и птиц, и рыб, и насекомых, и растения, и даже части растений (например, Листьев, Цветков). Велик соблазн объяснить их наличие «тотемной» памятью, но такие смелые интерпретации непозволительны дилетантам — здесь должны сказать своё слово профессионалы в области ономастики.
Больше всех — девять в списке «топ-50» общерусских фамилий — оказалось «птичьих» фамилий (по порядку убывания частоты: Соколов, Лебедев, Соловьёв, Голубев, Воробьёв, Орлов, Гусев, Куликов, Сорокин). Причём Лебедевы встречаются намного чаще в Восточном регионе (с частотой 1.94 %), а в Южных краях Лебедевых совсем мало (0.09 %). За ними следуют «истинно звериные» фамилии. Их в «топ-50» общерусских фамилий всего четыре: это Козлов, Волков, Зайцев, Баранов. А ещё есть Виноградовы, которые чаще всего встречаются в Восточном регионе (1.13 %), а вовсе не в Южном, где их частота минимальна (0.02 %). А также Комаровы, которых в Северном краю (0.24 %) в два раза меньше, чем в Восточном (0.59 %). И ещё Ершовы, обитающие в Восточном (0.49 %) и Северном (0.38 %) регионах.
Всего «звериных» фамилий несколько меньше, чем календарных — их 16 в «топ-50» общерусских фамилий (32 %). Но ранг их выше — средний балл, средняя позиция их равна 22, а не 31, как для календарных. Это означает, что «звериные» фамилии в среднем более частые, чем календарные, они сосредоточены в «верхней» половине списка. И действительно, как мы видим в первой десятке «топ-50» оказалось целых четыре «звериных» фамилии — Соколов, Лебедев, Козлов, Соловьёв.
ПРОФЕССИОНАЛЬНЫЕ ФАМИЛИИ
Профессиональных фамилий оказалось четыре в «топ-50» общерусских фамилий (8 %): это Кузнецов, Попов, Ковалёв и Пономарёв[47]. Две из них входят в первую десятку, и в целом они занимают «высокое» положение — их средняя позиция равна 21 (в списке из «топ-50» всеобщих фамилий). Наибольшая частота Кузнецовых, как мы видим из таблицы 7.3.4., в Восточном и Центральном регионах, Ковалёвых — в Западном и Южном. Эти два названия одной «кузнечной» профессии обычно связывают с диалектными различиями (см. сравнение карт их распространения в разделе 7.5. § 2). Но, например, и у казаков, и в Южном, и в Западном регионах распространены обе эти фамилии (входят в «топ-20» этих регионов). Наибольшая частота Поповых и Пономарёвых — в Северном регионе.
«ПРИМЕТНЫЕ» ФАМИЛИИ
Среди остальных фамилий можно выделить «приметные» — они как бы отмечают особенности внешнего или социального облика человека, его «приметы». «Приметных» фамилий оказалось лишь пять из 50 (10 %): Смирнов, Новиков, Беляев, Белов и Кудрявцев. Зато занимают «приметные» фамилии самое высокое место из всех классов фамилий — их средняя позиция равна 17 (в списке из 50 фамилий).
Конечно же, самая необычная из «приметных» фамилий — Смирновы. Фамилия «Смирнов» вообще лидирует в списке общерусских фамилий (средняя частота в пяти регионах 1.9 %), значительно опережая Ивановых (1.3 %). Необычайно высока частота Смирновых в Восточном регионе (5.9 %!), но и в Центральном они также являются самой распространённой фамилией (2.3 %). Причём не только по нашим (пока ещё ограниченным) данным, но и по тотальным спискам русского населения (устное сообщение) Смирновы являются самой частой русской фамилией. Более того, средняя частота Смирновых в русских популяциях выше, чем Ивановых, Петровых и Сидоровых вместе взятых!
Примечательно, что у казаков Смирновых очень мало — они занимают отдалённое 128 место. Видимо, не прижились
ИНЫЕ ФАМИЛИИ
Это те фамилии, которые нельзя однозначно отнести к одной из четырёх выделенных групп фамилий. Несомненно, что дальше «иные» фамилии могут быть подразделены, но пока лучше их объединить в своеобразный класс «неклассифицируемых» фамилий. Так будет осторожнее.
Они включают три (6 %) из «топ-50» общерусских фамилий: Морозовы, Киселёвы и Королёвы.
ПОДВЕДЁМ ИТОГИ
1. Итак, среди основных регионов «исконного» ареала мы обнаружили большой массив (257) фамилий, которые одновременно встречаются во всех пяти регионах. Всеобщие фамилии составляют в среднем 13 % от всех «коренных» фамилий региона.
2. Этот массив «общерусских» фамилий включает только «коренные» фамилии. Мы предварительно отсеяли «пришлые», «залётные» и поэтому очень редкие фамилии.
3. Общерусские фамилии не распределены однообразным слоем по всем регионам — нет, каждая фамилия имеет свою географию. Это ярко иллюстрируют и карты раздела 7.5, где представлено географическое распространение ряда общерусских фамилий.
4. Полученные нами результаты позволяют считать, что всеобщие фамилии отражают не только географию, но и историю сложения русского генофонда.
5. Подразделив всеобщие фамилии на пять семантических классов, мы определили их долю в списке из «топ-50» — пятидесяти самых частых всеобщих фамилий.
Больше всего оказалось КАЛЕНДАРНЫХ (44 %) и «ЗВЕРИНЫХ» фамилий (32 %). В три-четыре раза меньше ПРОФЕССИОНАЛЬНЫХ (8 %) и «ПРИМЕТНЫХ» фамилий (10 %). Замыкают ряд ИНЫЕ фамилии (6 %) — те фамилии, которые нельзя однозначно отнести к остальным четырем классам.
6. Однако если оценить, какое место эти классы фамилий занимают по их средней частоте в русском генофонде (а не по числу фамилий в «топ-50»), то картина оказывается совсем иной.
По частоте на первые места выходят «приметные», профессиональные и вновь «звериные» фамилии, а календарные фамилии отодвигаются на последнее место. Это вновь указывает, что хотя календарных фамилий и много в фонде фамилий, но не они создают его лицо.
Эти пять классов фамилий в следующем разделе использованы для описания особенностей каждого региона (раздел 7.4). Мы увидим, что этих пяти ярких красок достаточно, чтобы набросать выразительные и неповторимые «фамильные портреты» каждого региона.
§ 1. Основные регионы; ЮГ: необычайное обилие «профессиональных» фамилий — Яркое своеобразие — Но нет «лидеров»; СЕВЕР: самый оригинальный — Засилье «иных» фамилий — диалектных; ВОСТОК: Смирный русский лидер — Обилие «приметных» фамилий; ЗАПАД: типичен — Но календарных фамилий больше половины; ЦЕНТР: и по фамилиям центральный — Но половина фамилий «звериные»
§ 2. Что на окраинах? СЕВЕРО-ЗАПАД: Ивановы, Петровы, Сидоровы — Почти все фамилии календарные; КАЗАКИ: тяготеют к Югу — Но не Южный «филиал» — Особые приметы — Хорошие связи с центром; СИБИРЬ: усреднённый портрет русского генофонда — Ближе всего к самому дальнему Западу
§ 3. Яркие краски «фамильных портретов»: Пять красок — Пять классов фамилий — Личный портрет региона — Вызываем фамилии поимённо
Есть ли примечательные особенности в фамильном составе каждого из регионов? Какие черты «фамильного портрета» делают регион отличным от других? Или же напротив, выявляют его сходство с другими регионами? На эти вопросы мы попробуем ответить в этом разделе. Мы начнём изучение пространственной структуры русского генофонда с того, что рассмотрим «фамильные портреты» каждой из пяти основных его частей, особенности каждого из его регионов. А затем рассмотрим, как они выглядят на фоне «фамильных портретов» окраинных регионов.
Чтобы не терялось обаяние отдельных фамилий, чтобы региональные портреты были обозримы и сравнимы друг с другом, мы рассмотрим их не по всему множеству их фамилий, а пока только по спектру 50 наиболее частых — «топ-50» каждого региона. Этого достаточно, чтобы разглядеть основные черты региональных генофондов.
«ТОП-50» РЕГИОНА — ЭТО НЕ «ТОП-50» ВСЕОБЩИХ ФАМИЛИИ!
Ещё раз напоминаем во избежание недоразумений: в предыдущем разделе (7.3. § 3) рассматривался «топ-50» всеобщих, общерусских фамилий, то есть 50 самых частых фамилий из 257 фамилий, встреченных одновременно во всех пяти регионах.
Теперь мы рассматриваем совсем иные списки. Сначала анализируем весь список фамилий, встреченных в конкретном регионе. Расставляем их по убыванию частоты. А затем отбираем 50 наиболее распространённых фамилий в этом регионе. Они и составляют «топ-50» для данного региона. Для каждого региона такая процедура проводится отдельно, поэтому для каждого региона этот список свой — 50 фамилий, самых распространённых в данном регионе.
АЛГОРИТМЫ АНАЛИЗА
«ТОП-50» РЕГИОНА. Для каждого региона составлен полный список фамилий, встреченных в нём. Для каждой фамилии рассчитана её средняя частота в данном регионе. Фамилии расположены по убыванию их частоты. Отобраны 50 самых частых фамилий, для которых и проводится анализ — «топ-50» региона. Такая процедура проведена с каждым регионом отдельно. Отобранные фамилии мы условно называем «распространёнными», чтобы отличить от двадцати «частых» («топ-20»), рассмотренных в разделе 7.1. Итак, у нас получилось восемь списков «топ-50» — для восьми изученных регионов: пяти основных (Восточный, Центральный, Западный, Северный, Южный) и трёх окраинных (Северо-Запад, казаки, Сибирь).
«ТОП-50» ВСЕОБЩИХ ФАМИЛИЙ. Это список «коренных» фамилий, которые встречены одновременно во всех пяти основных регионах. Всего в этом списке 257 фамилий, и из него также ранее были отобраны 50 самых частых — именно этот список мы детально анализировали в предыдущем разделе (7.3. § 3). Эти «топ-50» всеобщих фамилий в данном разделе мы называем просто «общерусскими» или «всеобщими». Их мы используем для оценки своеобразия регионов — проверяем, какие из «топ-50» всеобщих фамилий вошли в списки «топ-50» региональных фамилий.
ОЦЕНКА НАЛИЧИЯ «ОБЩЕРУССКИХ» ФАМИЛИЙ В «ТОП-50» РЕГИОНА. Сравнение «топ-50» региона с «топ-50» всеобщих фамилий проведено с помощью обычного показателя связи — коэффициента контингенции к. Он оценивает сходство регионов не по частоте фамилии, а поимённо — есть ли такая «общерусская» фамилия в данном регионе или её нет.
ДИАПАЗОН РАЗЛИЧИЙ Δ50 количественно оценивает разницу между частотами первой фамилии и последней фамилии в «топ-50» региона. Оказывается, что регионы могут значительно различаться по этому показателю скорости падения частот. Порой для полноты описания приводятся и диапазоны различий между другими блоками фамилий в регионе, например между 49 фамилиями (Δ49) или же двадцатью (Δ20). Между какими именно фамилиями рассчитана разница частот, указано в тексте.
КЛАССЫ ФАМИЛИЙ. Рассмотрено, какая доля фамилий из «топ-50» фамилий приходится на каждый из пяти выделенных нами классов фамилий: календарные, «звериные», профессиональные, «приметные», иные.
Не умея вместить в график все 40 тысяч фамилий, встреченных в Южном регионе, мы привели реестр наиболее распространённых 50 фамилий «топ-50», расположив их по убыванию частоты (табл. 7.4.1). Здесь же для остальных регионов приведены значения в них частот этих «южных» фамилий. Это позволяет, взяв за точку отсчёта только «южные» фамилии, увидеть, где они также распространены, а где отсутствуют. Иными словами, мы смотрим на весь мир русских фамилий глазами Южного региона.
СПЕКТР «ЮЖНЫХ» ФАМИЛИЙ
Список 50 распространённых фамилий в Южном регионе отличается ярким своеобразием. На первый план в «топ-50» Юга вышли «свои» фамилии, не характерные для других регионов: Шевченко, Колесников, Бондаренко, Ткаченко, Шаповалов, Литвинов, Черных, Капустин, Коваленко, Калашников, Шевцов, Ткачёв…
При этом в «топ-50» южных фамилий нет многих общерусских фамилий: отсутствуют Смирнов, Васильев, Павлов, Голубев, Воробьёв, Соловьёв и даже столь «южные» фамилии как Виноградов, Лебедев, Орлов (можно сравнить таблицы 7.4.1. и 7.3.4). Зато Медведевых в Южном регионе оказалось в три раза больше, чем в Северном. Поэтому расхожее мнение, что где больше водится каких «зверей», там и больше производных от них «звериных» фамилий, не подтверждается. Хотя специальный количественный анализ ещё впереди — для этого надо искать сведения о флоре и фауне не современности, а ушедших веков. Надо заглянуть в «звериный» мир тех поколений, когда формировался фонд «звериных» фамилий.
ЧАСТОТЫ «ЮЖНЫХ» ФАМИЛИЙ
Спектр «топ-50» сразу указывает на своеобразие «фамильного портрета» Южного региона. Например, в списке общерусских фамилий (табл. 7.3.4) первое место занимают Смирновы. Они являются лидерами в Восточном (5.9 %) и Центральном (2.3 %) регионах. Однако в Южном регионе Смирновы встречаются с частотой лишь 0.08 %! Самая распространённая фамилия Западного региона — Иванов (2.8 %) — в Южном регионе встречается с частотой в семь раз меньшей! А самая распространённая фамилия Северного региона — Попов (1.8 %) — в Южном регионе также является лидером, однако её частота в два раза ниже — лишь 0.8 %. Причём даже такая невысокая частота (0.82 %) для «южных» фамилий является уже огромной: следующие за Поповыми фамилии встречаются уже в два раза реже: Гончаровы (0.45 %), Шевченко (0.44 %) и Ковалёвы (0.41 %), Ивановы (0.40 %).
ДИАПАЗОН РАЗЛИЧИЙ Δ50
Кривая частот «южных» фамилий практически сразу — за исключением первой точки с лидирующей фамилией Попов — выходит на плато. Поэтому диапазон (Δ50) между наиболее частой фамилией и пятидесятой по счёту составил очень низкую величину Δ50=0.7 %, резко отличающую Южный регион от всех других регионов. Если мы не будем учитывать лидера (Поповых), то диапазон различий снизится до вообще неощутимой величины Δ49=0.3 %. В других регионах диапазон различий Δ50 на порядок выше. В среднем он составляет Δ50=2.5 %, варьируя в других регионах в пределах 1.5 %<Δ50<5.6 %.
Особо отметим, что столь низкая величина Δ50=0.7 % в Южном регионе не связана с большим объёмом информации (655 тыс. чел.) в Южном регионе. В первоначальном варианте анализа, когда Южный регион был представлен такой же выборкой, как и остальные регионы (≈100 тыс. чел.), показатель Юга был всё тем же: Δ50=0.62 %. Такая устойчивость Δ50 (0.66 % и 0.62 % при шестикратном увеличении выборки) указывает на важность этого показателя для выявления специфических черт «фамильного портрета». Независимость Δ50 от набора и объёма изученных популяций говорит нам о том, что невысокие частоты даже самых распространённых фамилий — исторически сложившаяся особенность фамилий Юга.
Примечание: фамилии расположены по убыванию средней частоты в Южном регионе.
ФАМИЛИИ НА «-ЕНКО»
Напомним, что когда мы рассматривали «топ-20» (раздел 7.3), то среди 20 самых частых фамилий обнаружили четыре с финалем «-енко» (Шевченко, Бондаренко, Ткаченко, Кравченко). Не случайность ли это? Проверим их градиент. В «топ-10» — 30 % фамилий на «-енко».» В «топ-20» — 20 %. В «топ-50» — 16 %. Среди 10 тысяч «коренных южных» фамилий — их 13 %. Среди всех 40 тысяч фамилий, встреченных в Южном регионе, — их 8 %. Такой градиент падения частоты (от 30 % до 8 %) по мере увеличения списка фамилий (то есть включения все более редких фамилий) может означать, что хотя доля фамилий, оканчивающихся на «-енко», невелика, но она далеко не случайна. Эти фамилии не занесены случайными потоками миграций, а присутствуют с высокой частотой и являются устойчивой, яркой и своеобразной чертой «фамильного портрета» Южного региона.
КЛАССЫ ЮЖНЫХ ФАМИЛИЙ
Таблица 7.4.1.
Взгляд с юга: сравнение регионов по фамилиям «топ-50» Южного региона
ПРОФЕССИОНАЛЬНЫЕ. Очень ярко выражено своеобразие Южного региона и по смысловой нагрузке фамилий — в «топ-50» огромное число профессиональных фамилий: 34 %.
Они охватывают широчайший круг профессий — это и ткачи, и кузнецы, и гончары, и бондари, и портные, и шапошники (Шаповалов), и пекари (Калашников), и колесных дел мастера. Причём один и тот же род деятельности представлен несколькими частыми фамилиями, отражая не только диалектные различия, но зачастую и разделение труда в данной профессии. Бондари — Бондарев и Бондаренко. Ткачи — Ткачёв и Ткаченко. Кузнецы — Кузнецов, Ковалёв и Коваленко. Портные — Кравцов и Кравченко, Шевцов и Шевченко.
В «топ-50» остальных регионов (и основных, и окраинных) профессиональных фамилий совсем мало: их доля колеблется в узких пределах от 2 % до 8 %. Исключением, подтверждающим правило, служат кубанские казаки — у них процент профессиональных фамилий подскакивает до 22 %, отражая интенсивность связей с Южным регионом. Такие резкие различия (2 %-8% для большинства регионов, и 34 % для Южного) трудно посчитать случайными. Можно предположить, что они указывают на устоявшуюся традицию образования фамилий, характерную именно для Южного региона. Эта традиция — образование фамилии от профессии её носителя.
КАЛЕНДАРНЫЕ. На втором месте стоят календарные фамилии — их 32 % среди 50 «южных» фамилий. Именно календарные фамилии во многом связывают Южный регион с Западным, который лидирует по числу календарных фамилий среди основных регионов — 60 %. А в окраинном Северо-Западном регионе — почти сплошь календарные фамилии: 82 %. В Северном регионе их тоже много, даже больше, чем на юге, но спектр их иной, своеобразный.
«ЗВЕРИНЫЕ». Зато «звериных» фамилий в Южном регионе совсем немного — лишь 12 % (Козлов, Капустин и Волков идут на юге единым блоком с одинаковой частотой 0.2 %). Это один из самых низких показателей — ни в одном из регионов доля «звериных» фамилий не опускается ниже 10 %. В то время как максимальная доля «зверйных» фамилий достигает 50 %.
«ПРИМЕТНЫЕ». «Приметных» фамилий тоже мало — 14 %, но они очень выразительно говорят о наличии миграции и, возможно, об облике пришельцев: Новиков, Литвинов («Литвинами» русские называли и белорусов, которые до воссоединения с Россией жили в составе Литовского, а затем Польско-Литовского государства), Черкашин («черкашами» называли население правобережной Украины и казаков Поднепровья), Черных, Лысенко, Головин (большеголовый, умный).
ИНЫЕ. Оставшиеся неклассифицированными нами 8 % фамилий включены в класс «иные» (мы не сомневаемся, что специалисту-филологу удастся подразделить этот класс с большим успехом).
Но в целом оказывается, что даже такая простая и дилетантская классификация, подразделяющая всего лишь пятьдесят распространённых фамилий на пять классов (календарные, профессиональные, «звериные», «приметные», иные), помогает составить образ региона и сформулировать некоторые гипотезы. Эти гипотезы, конечно же, требуют проверки на других, более обширных данных.
ИТОГ
Самая яркая черта «фамильного портрета» Юга — это необычайное обилие «профессиональных» фамилий. В целом «фамильный портрет» Южного региона запечатлевает его ярко выраженное своеобразие: и в спектре фамилий, и в отсутствии ярко выраженных «лидеров» — все распространённые фамилии представлены примерно равными невысокими частотами.
СРАВНЕНИЕ РЕГИОНОВ ПО «СЕВЕРНЫМ» ФАМИЛИЯМ
В табл. 7.4.2. приведён реестр 50 наиболее распространённых фамилий Северного региона, расположенных по убыванию их частоты. Там же приведены частоты этих «северных» фамилий в остальных четырёх регионах «исконного» русского ареала.
ДИАПАЗОН РАЗЛИЧИЙ Δ50
Размах различий между самой частой «северной» фамилией и пятидесятой по частоте (Δ50=1.5) в два раза больше, чем в Южном регионе (Δ50=0.7). Однако при этом «северный» Δ50=1.5 меньше как средней величины (Δ50=2.5), так и Δ50 регионов средней полосы (2.0<Δ50<5.6). Падение частот продолжается до середины «топ-50», и лишь с двадцать четвертой фамилии график выходит на плато.
СПЕКТР «СЕВЕРНЫХ» ФАМИЛИЙ
Так же как и в Южном, в Северном регионе преобладают «свои» фамилии, которые нигде более не встречаются со сколько-нибудь заметной частотой. Они рисуют своеобразный «фамильный портрет» Русского Севера: Хромцов, Булыгин, Рябов, Бобрецов, Черноусое, Мёрзлый, Лешуков, Кувалдин, Филин… При этом в «топ-50» Северного региона (табл. 7.4.2) нет почти половины (23) из «топ-50» «общерусских» фамилий (табл. 7.3.4), что также указывает на своеобразие «фамильного портрета» Русского Севера.
КЛАССЫ ФАМИЛИЙ
Какие же там фамилии есть?
В отличие от юга на севере почти нет ПРОФЕССИОНАЛЬНЫХ фамилий — только 6 % из «топ-50» (это Попов, Кузнецов и Пономарёв).
Но и «ЗВЕРИНЫХ» фамилий тоже очень мало — ещё меньше, чем на юге: всего лишь 10 % из 50 фамилий (Бобрецов, Ершов, Листов, Соколов, Филин).
«ПРИМЕТНЫХ» фамилий также немного -12 %, и они довольно своеобразны: Хромцов, Рябов, Черноусое, Суханов, Ширяев (широкоплечий), а также вездесущий Новиков.
КАЛЕНДАРНЫХ довольно много — 38 % от списка, но их состав необычен. Например, Ивановы на Русском Севере оказались на 21 месте по частоте, уступив первенство таким редким в других регионах фамилиям, как Дорофеев (8 место) и Лазарев (11 место).
Таблица 7.4.2.
Взгляд с севера: сравнение регионов по фамилиям «топ-50» Северного региона
ИНЫЕ ФАМИЛИИ
Но главное отличие «северных» фамилий — огромное количество «иных» фамилий — 34 %!
Во всех остальных регионах, включая окраинные, доля «иных» фамилий колеблется от 0 до 14 %. И вновь такие резкие различия (0 %-14 % с одной стороны, и 34 % с другой стороны) трудно посчитать случайными. Можно думать, что они прямо указывают на особость северных диалектов или же на устоявшуюся традицию образования фамилий, характерную именно для Северного региона.
Таблица. 7.4.3.
Взгляд с востока: сравнение регионов по фамилиям «топ-50» Восточного региона
Среди них две очень северные фамилии — Мёрзлый и Морозов (обычно Морозом называли детей, родившихся в морозные дни). Но основная часть — это диалектные фамилии: Лешуков (считается, что так называли детей в качестве их «оберега» от леших), Порохин (что связывается с зимней порошей), Ошуков (диалектное производное от православного имени Осип, т. е. Иосиф), Сауков (диалектное производное от православного имени Савва), Галашев (диалектное имя от «Галактион»), Фофанов (диалектное имя от Феофан, но также и прозвищное имя, «простофиля»), Чурсанов («Чур» — славянское языческое божество домашнего очага), а также Третьяков и Шестаков (третий и шестой ребенок в семье), Булыгин, Кувалдин, Когин, Дверин и Карманов. Но мы не стали распределять эти «иные» фамилии по соответствующим классам: Ошукова, Саукова, Галашева и Галактионова не причислили к календарным, а оставили в «иных», точно так же не причислили к «приметным» Третьякова и Шестакова. Мы решили проявить осторожность — ведь мы не можем гарантировать справедливость такой этимологии. Мы предпочли оставить эти фамилии в классе «иных», пока не найдётся специалист, способный классифицировать их более грамотно, чем мы.
Столько «иных» фамилий нет даже среди казаков — у них лишь 14 % «иных» фамилий. В общем, фамилии Русского Севера — поле работы сперва для профессиональных лингвистов, а лишь потом — для генетиков.
ИТОГ
«Фамильный портрет» Северного региона демонстрирует максимальное своеобразие, которое выражено ещё ярче, чем в Южном регионе. Это своеобразие наиболее выпукло отражено в огромном числе «иных» фамилий, главным образом, диалектных.
Впрочем, у Восточного региона тоже необычный характер (табл. 7.4.3).
СМИРНОВЫ
Главная русская фамилия — Смирнов, как мы уже видели. И потому, прежде всего, бросается в глаза необычайно высокая частота Смирновых в Восточном регионе — 5.9 %!
Эта частота в 2–7 раз выше, чем частоты лидеров в других регионах. Например, в Западном регионе самая частая фамилия — Иванов, но её частота только 2.8 %. В остальных регионах частоты фамилий, занявших первое место, ещё ниже. Лидером в Центральном регионе оказались те же Смирновы, но их частота — 2.3 %. Лидирующие частоты Поповых мы уже приводили — 1.8 % на Русском Севере и 0.8 % в Южном регионе. При таких частотах лидеров в других регионах видно, сколь удивительно высока частота Смирновых в Восточном регионе — она достигает почти 6 %! Этот феномен не имеет аналогов среди почти 70 тысяч изученных нами русских фамилий.
Мы уже говорили о том, что Смирновы выходят на первое место среди русских фамилий. Но мы видим, что они выходят не ровным шагом (во всех регионах поровну), а резким рывком в Восточном и Центральном регионах. Особость Смирновых ждёт своих исследователей. Тем более, что Тихомировы распространены в Восточном регионе тоже с высокой частотой (0.8 %).
Примечание: фамилии расположены по убыванию средней частоты в Восточном регионе
КЛАССЫ ФАМИЛИЙ
Вторая особенность — среди «топ-50» Восточного региона встречено намного меньше, чем в других регионах, КАЛЕНДАРНЫХ фамилий — всего лишь 14 %! В остальных регионах, за исключением Центрального, они варьируют в диапазоне от 32 % до 82 %.
В-третьих, почти нет (лишь 8 %) ПРОФЕССИОНАЛЬНЫХ фамилий — это Попов, Кузнецов, Дудин (как изготавливающий дудки, так и играющий на них)
и… Дворецкий!
В-четвертых, восточные фамилии изобилуют «ЗВЕРИНЫМИ» — их 36 %. Среди них лидируют Лебедевы, которые занимают второе место в списке фамилий, а на четвёртом и пятом местах находятся Соколовы и Виноградовы. Во второй половине списка есть и Орловы, и Гусевы. Таков неожиданно южный колорит фамильного портрета Восточного региона. Там есть, конечно, и Бобровы, и Соболевы, но они замыкают список 50 самых распространённых «восточных» фамилий. Сразу укажем: по числу «звериных» фамилий Восточный регион намного отстает от Центрального, где их доля достигает 50 %!
В-пятых, и это главная особенность Восточного региона — это необычайно высокая частота «ПРИМЕТНЫХ» фамилий — 36 %.
Столько нет ни в одном регионе — там их от 6 % до 16 %. И вновь отметим, что такие резкие различия (6 %-16 % с одной стороны, и 36 % с другой стороны) нельзя счесть случайными. Они указывают на устоявшуюся традицию образования фамилий для Восточного региона. Эта традиция — образование фамилий по «приметам», характерным чертам носителя фамилии.
И фамилии какие славные — Смирнов и Тихомиров, Беляев и Белов, Серов и Рыжов, Сизов и Румянцев, Шорохов (со следами оспинок) и Крутиков, Большаков и Громов (сильный голос, часто певчие), Чистяков и Скрябин (т. е. «чистюля», от «скрябать»), Кудрявцев и Кудряшов, Разумов и Веселов… Все вместе они рисуют очень радостный портрет Восточного региона. Всё же удивительно, насколько различается палитра красок фамильных портретов! Вспомним, что в Северном регионе «приметными» фамилиями были Хромцов, Рябов, Черноусое, Лешуков, Суханов. А в Южном — Новиков, Литвинов, Черных, Головин, Лысенко. Налицо три совершенно разных портрета!
ДИАПАЗОН РАЗЛИЧИЙ
Разрыв Δ50 между наиболее частой «восточной» фамилией и пятидесятой по частоте (Δ50=5.6) оказался самым большим из всех регионов. Но достигается он за счёт экстремально высокой частоты Смирновых — без них диапазон различий Δ49=1.7 снижается до «среднерусской» величины. Хотя на плато график выходит только к двадцатой фамилии, в целом он, в отличие от предыдущих, характеризуется отсутствием резких всплесков.
СРАВНЕНИЕ РЕГИОНОВ ПО «ВОСТОЧНЫМ» ФАМИЛИЯМ
Это отражается и в очень высоких коэффициентах корреляции: по «восточным» фамилиям мы наблюдаем согласованное изменение между Северным и Западным (r=0.76), Северным и Центральным (r=0.75) и даже Северным и Южным (r=0.81) регионами.
ИТОГ
Самая яркая черта «фамильного портрета» Востока — необычайное обилие «приметных» фамилий.
В целом, «фамильный портрет» Восточного региона сочетает в себе как черты выраженного своеобразия (экстремальная частота Смирновых, редкость календарных фамилий, преобладание «звериных» и «приметных» фамилий), так и близость то к одним, то к другим регионам, а в целом — к чертам общерусского генофонда.
СРАВНЕНИЕ РЕГИОНОВ ПО «ЗАПАДНЫМ» ФАМИЛИЯМ
Частоты 50 наиболее распространённых фамилий в Западном регионе (табл. 7.4.4) показывают хорошую согласованность «западных» фамилий со значениями частот в других регионах. Они свидетельствуют о ещё большем приближении к неким общерусским характеристикам, чем в Восточном регионе. Что отражает в необычайно высоких коэффициентах корреляции. По «западным» фамилиям мы наблюдаем полностью согласованное изменение между Северным и Восточным (r=0.97), Восточным и Южным (r=0.92) регионами.
ДИАПАЗОН РАЗЛИЧИЙ
Диапазон частот Δ50 между наиболее частой и пятидесятой «западной» фамилией точно соответствует среднему значению по пяти русским регионам (Δ50=2.5). Однако это достигается за счёт резкого повышения частоты Ивановых — без них Δ49=1.0, приближаясь к показателям Южного региона.
СПЕКТР «ЗАПАДНЫХ» ФАМИЛИЙ
«Фамильный портрет» Запада очень беден «своими» неповторимыми фамилиями (Поляков, Журавлев, Зуев). В целом Западный регион можно считать довольно типичным русским регионом. Это единственный регион, все 50 распространённых фамилий которого встречаются и во всех остальных четырёх регионах, причём в Восточном и Центральном регионах их частота сравнима с Западным.
КЛАССЫ ФАМИЛИЙ
КАЛЕНДАРНЫЕ. У Западного региона есть одно, но очень яркое отличие — преобладание календарных фамилий — 60 %. Если в других основных регионах календарные фамилии колеблются от 14 % до 38 %, то в Западном регионе их в два-четыре раза больше!
Мы уже упоминали о том, что в Северо-Западном регионе эта черта выражена ещё ярче (82 % календарных фамилий). Вновь подчеркнём: такие резкие различия между регионами (14 %-38 % в одних регионах, и 60 %-82 % — в других) нельзя счесть случайными.
Они указывают на устоявшуюся традицию образования фамилий, характерную именно для Западного региона. Эта традиция — образование фамилий от имён православного календаря — отличает западные и северо-западные русские популяции от всех остальных.
Похоже, общественное мнение, что русские фамилии — это календарные фамилии, сформировано резким смещением акцентов на западные регионы. Видимо, это мнение сформировано нашими западными соседями по тем областям русского ареала, которые им были географически близки и исторически знакомы.
«ЗВЕРИНЫХ» фамилий тоже немало — 26 %. Это, конечно, не так много, как в других регионах средней полосы — в Восточном (где их 36 %) и в Центральном (где их 50 %). Но зато в два-три раза больше, чем в «полярных» регионах — на юге (12 %) и на севере (10 %). Кроме «звериных» фамилий, вошедших в фамильные портреты и других регионов (Козлов, Зайцев, Волков, Медведев, Соколов, Соловьёв, Лебедев, Орлов, Воробьёв, Сорокин, Комаров), в Западном регионе появляются и две новые «птичьи» фамилии — Журавлёв и Зуев.
Таблица 7.4.4.
Взгляд с запада: соавнение регионов по фамилиям «топ-50» Западного региона
ПРОФЕССИОНАЛЬНЫХ фамилий на западе почти нет (4 %) — только Кузнецовы и Поповы вошли в «топ-50» Западного региона.
«ПРИМЕТНЫХ» фамилий также мало (6 %), и
они свидетельствуют о связях с другими регионами: Поляковы говорят о географической близости Польши; Новиковы сближают Запад с другими регионами (они занимают 2 место на западе, 6 место — на юге, 13 место — на севере, 19 место — в центре); Смирновы (занимая 6 место в списке региона) объединяют Запад с другими регионами средней полосы (Центральным и Восточным), в которых Смирновы занимают первое место.
ИНЫЕ фамилии (4 %) представлены лишь Морозовыми и Киселевыми.
ИТОГ
Таким образом, главная черта «фамильного портрета» Западного региона — его типичность, сходство со всеми другими регионами.
Однако при этом он отличается от всех иных регионов необычайно яркой особенностью: резким преобладанием календарных фамилий.
Перейдём к последнему изученному нами региону «исконного» ареала — Центральному (табл. 7.4.5). Напомним, что центр русского ареала пока представлен самой маленькой популяцией — всего одним районом численностью в 25 тыс. человек. И, тем не менее, этот регион можно назвать действительно центральным, среднестатистическим регионом.
СРАВНЕНИЕ РЕГИОНОВ ПО «ЦЕНТРАЛЬНЫМ» ФАМИЛИЯМ
Наиболее частая фамилия в Центральном регионе та же, что и для всех русских фамилий в целом — Смирнов. Но встречается она в центре реже (2.3 %), чем в Восточном регионе (5.9 %), демонстрируя умеренность.
ДИАПАЗОН РАЗЛИЧИЙ
Диапазон частот Δ50 между наиболее частой «центральной» фамилией и пятидесятой (Δ50!=2.0) также близок к среднему русскому значению (Δ50!=2.5).
КЛАССЫ ФАМИЛИЙ
Из общерусских фамилий в «центральные» не попали такие профессиональные фамилии, как Поповы, Пономарёвы, Ковалёвы, а также ряд календарных фамилий.
КАЛЕНДАРНЫХ фамилий среди «центральных» вообще немного — всего 18 %, и встречаются они не так часто.
«ЗВЕРИНЫХ» фамилий необычайно много -50 %! Обилие «звериных» фамилий — отличительная черта Центрального региона.
Столько не было даже в Восточном регионе (где их 36 %). А в остальных регионах их в два-пять раз меньше, чем в Центральном — в диапазоне от 10 % до 26 %. Причём «звериные» фамилии лидируют среди «центральных» не только по числу, но и по положению — среди первых семнадцати фамилий «звериных» оказалось одиннадцать. Из двадцати пяти «центральных» «звериных» фамилий пятнадцать (Баранов, Виноградов, Волков, Воробьёв, Голубев, Гусев, Зайцев, Козлов, Комаров, Куликов, Лебедев, Орлов, Соколов, Соловьёв, Сорокин) вошли в общерусский перечень благодаря регионам средней полосы (на севере и юге их мало). Однако среди «центральных» «звериных» фамилий есть ещё и «свои», особые, которые рисуют особый облик Центрального региона — Бобров, Воронин, Жуков, Журавлев, Калинин, Корольков, Крылов, Скворцов, Соболев, Цветков.
Примечание: фамилии расположены по убыванию средней частоты в Центральном регионе.
ПРОФЕССИОНАЛЬНЫХ фамилий почти нет
(4 %) — это Кузнецов, Рыбаков (эта фамилия появляется впервые). А Королёвых в этот класс мы включить не можем — за неимением королей на Руси, филологи относят Королёвых к прозвищным фамилиям, а не к профессиональным.
«ПРИМЕТНЫХ» фамилий много — 16 %, но они во многом вторят Восточному региону — Смирнов, Белов, Беляев, Белоусов, Румянцев, Кудрявцев, Чистяков, Новиков.
ИНЫХ фамилий — 12 %. Среди них ярко выделяются свои собственные, «хозяйственные» — Блинов, Горшков, и примкнувший к ним общерусский Киселёв. В этот класс вошли не только вездесущие Новиков и Морозов, но и неожиданный Королёв.
Таблица 7.4.5.
Взгляд из центра: сравнение регионов по фамилиям «топ-50» Центрального региона
ИТОГ
Это означает, что Центральный регион оказался действительно центральным в пространстве русских фамилий практически по всем показателям. Однако, несмотря на «усреднённость» Центрального региона, связанного с его географически срединным положением, у него есть и свои яркие собственные черты.
Это, прежде всего, необычайно большой и пестрый массив «звериных» фамилий — они составляют половину «топ-50» Центрального региона.
Окраинные регионы привлекаются нами лишь как фон при изучении русского генофонда. С их помощью мы хотим разглядеть, как выглядит фамильный фонд при выходе на периферию «исконного» ареала. Продолжаются ли выявленные закономерности? Можно ли их уточнить? Не ошиблись ли мы, ограничив себя только «исконным» ареалом? Мы уже дали набросок «окраинных фамильных портретов» по спектру частых фамилий (раздел 7.3). Здесь же мы рассмотрим окраинные регионы с помощью иного инструмента — семантических классов, смысловой нагрузки фамилий. Не проводя целиком все виды анализа, взглянем лишь повнимательнее, как распределяются фамилии «топ-50» по пяти семантическим классам (табл. 7.4.6).
СЕВЕРО-ЗАПАДНЫЙ РЕГИОН
КАЛЕНДАРНЫЕ. Этот удивительный регион представлен почти исключительно календарными фамилиями — их 82 %. Это, пожалуй, самый необычный феномен среди всех рассмотренных нами «фамильных портретов». Обилие календарных фамилий, конечно же, сближает Северо-Западный регион с Западным (где их 60 %). Однако и на Русском Севере календарных фамилий немало. Если учесть диалектные производные от православных имён, их число может возрасти до 46–50 %. Можно предположить, что традиция образования фамилий от имён православного календаря происходит именно от Северо-Западного региона, но эта гипотеза нуждается в проверке совсем иными методами ономастики.
Календарных фамилий в псковских землях вообще настолько много, что когда встречаешь не календарную фамилию, она выглядит «чужой». При экспедиционном сборе образцов для анализа ДНК полиморфизма, мы составляли родословные для каждого обследуемого. И действительно, когда в Псковской области нам попадалась не календарная фамилия, очень часто оказывалось, что её носитель нам не подходит — его предки уводили нас за пределы Северо-Западного региона.
«ЗВЕРИНЫЕ» фамилии занимают второе место (10 %) — Волков, Жуков, Орлов, Козлов, Лебедев, но их так мало, и отодвинуты они календарными фамилиями в конец списка 50 «северо-западных» фамилий. По спектру «звериных» фамилий Северо-Западный регион тяготеет к средней русской полосе в целом: по обилию «звериных» фамилий все три региона средней русской полосы (26–50 %) ярко выделяются среди остальных регионов (10–18 %).
ПРОФЕССИОНАЛЬНАЯ фамилия в «топ-50» лишь одна (2 %) — Кузнецовы.
«ПРИМЕТНЫХ» фамилий лишь три (6 %) — общерусские Смирновы, Богдановы (от нецерковного имени Богдан, «Богом данный» — так называли внебрачных детей, приёмных или долгожданных) и собственные Быстровы.
ИНЫМ фамилиям вообще не осталось места (0 %).
На все фамилии, кроме календарных, остаётся так мало мест в «топ-50», что нам в порядке исключения приходится рассмотреть не только 50, но и 100 наиболее распространённых фамилий. В «топ-100» Северо-Запада характерными фамилиями оказались: Быстров, Бойков, Веселов, Малышев, Большаков, Белов, Вихров, Кудрявцев, Казаков, Громов. Эти фамилии создают эмоционально окрашенный портрет русского Северо-Запада — светлый и радостный.
КУБАНСКИЕ КАЗАКИ
Мы уже говорили о ярко выраженном своеобразии фамилий кубанских казаков по частым фамилиям. Эти закономерности сохранились и при переходе к «фамильному портрету» казаков по семантическим классам «топ-50».
ПРОФЕССИОНАЛЬНЫЕ. Самой яркой чертой «фамильного портрета» кубанских казаков является резкое возрастание числа профессиональных фамилий (22 %). В этом кубанские казаки вторят Южному региону, где мы видим традицию образования фамилий от профессии (34 %). У кубанских казаков профессиональных фамилий, правда, меньше, чем среди «южных» фамилий, но зато в пять раз больше, чем в остальных регионах! Среди «кубанских» профессиональных фамилий есть и те, которые вошли в список 50 общерусских фамилий (Пономарёв и Попов, Кузнецов и Ковалёв). Есть и т е, которые были только в Южном регионе, насыщенном «профессиональными» фамилиями (Гончаров и Гончаренко, Бондаренко, Шевченко, Кравченко, Ткаченко). Но есть и одна новая, «своя» фамилия — Рыбалко.
КАЛЕНДАРНЫЕ. И по числу календарных фамилий кубанские казаки (34 %) также вторят Южному региону (32 %). Из них больше половины присутствует в списке 50 общерусских фамилий (Петров, Иванов, Яковлев, Романов, Борисов, Семенов, Андреев, Захаров). Но зато остальные фамилии — свои собственные, неповторимые: Самойлов (от имени Самуил), Остапенко (от имени Евстафий), Федошов (от Феодора), Онищенко (от уменьшительного Оня, производимого от многих имён — Семён, Онисий, Иона, Леонтий и другие), Пешков (от имени Петр), Кононов (от имён Конон, Кондратий, Никон), Василевич, Фоминов и Фоменко.
ИНЫЕ фамилии (14 %) включили много диалектных производных, которые без участия специалистов мы не можем ни разбить на уже выделенные классы, ни выделить новые классы фамилий.
«ЗВЕРИНЫХ» фамилий (16 %) несколько больше, чем на юге (12 %). Большая часть их также присутствует в списке 50 общерусских фамилий (вездесущие Воробьёв, Волков, Зайцев, Козлов, Соколов и Лебедев), но две кубанских фамилии в этот список не вошли — Медведев и Клещенко.
«ПРИМЕТНЫХ» фамилий (14 %) столько же, как и на юге (14 %). Они во многом вторят «южным приметным» фамилиям — Новиков, Литвинов, Лысенко, а вместо «южного» Черных среди кубанских есть сразу два аналога — и Черновы, и Чернышовы. Косян и Белоусов дополняют этот портрет.
В целом, «фамильный портрет» кубанских казаков по 50 распространённым фамилиям тяготеет более всего к географически близкому Южному региону. Но фамильный фонд кубанских казаков никак нельзя рассматривать как «филиал» Южного региона. У него богатый спектр неповторимых черт и устойчивые связи с общерусским ядром фамилий.
СИБИРСКИЙ РЕГИОН
Сибирский регион также уже подробно рассматривался по спектру самых частых фамилий (раздел 7.3. § 1). Мы видели, что Сибирь не отличается своеобразием и воспроизводит как бы «усреднённый» фамильный портрет русского народа. На этом общем фоне он оказался несколько ближе к регионам средней русской полосы и непохож на «полярные» регионы. Меняет ли эту картину увеличение числа рассматриваемых фамилий и проведение иного вида анализа — семантических классов фамилий? Нельзя ли обнаружить, к каким именно регионам фамилии Сибири обнаруживают большее тяготение?
Множество потоков миграций в разные времена поставляли население из «исконного» русского ареала в Сибирь. Поход Ермака был из первых, открывших эти миграции. Но ныне население Сибири столь велико, что старожильческий пласт перекрыт куда более мощными миграциями. Миграционный поток «отовсюду» создал некий обобщённый облик русских фамилий. Смешение привело к тому, что «запредельный» сибирский генофонд стал более общерусским, чем «исконные» территории. Но не позволит ли наш новый инструмент обнаружить, откуда шли главные потоки миграций?
СРАВНЕНИЕ РЕГИОНОВ ПО «СИБИРСКИМ» ФАМИЛИЯМ
Распределив «топ-50» сибирских фамилий по семантическим классам, мы обнаруживаем их неожиданное сходство с Западным регионом.
КАЛЕНДАРНЫЕ. Прежде всего, конечно, бросается в глаза сходство Сибирского и Западного регионов по преобладанию календарных фамилий (58 %). Среди «сибирских» фамилий их необычайно много — и точно такая же доля календарных фамилий характерна для Западного региона (60 %). В остальных регионах «исконного» ареала число календарных фамилий в среднем в два раза меньше! Причём близкими Запад и Сибирь оказались не только по количеству, но и по спектру календарных фамилий: две трети «сибирских» фамилий присутствуют среди «западных» календарных фамилий. Совпадение по 19 фамилиям из 30 календарных трудно счесть случайностью. Тем более что из них четырёх фамилий (Григорьев, Дмитриев, Егоров, Фролов) в общерусском списке нет, однако они есть и в Сибирском, и в Западном регионах.
ПРОФЕССИОНАЛЬНЫХ фамилий мало (6 %), что также свойственно обоим регионам. В Сибирском регионе среди 50 распространённых фамилий есть только Поповы, Кузнецовы и Овчинниковы (скорняки — возможно, здесь проявляется сибирский колорит), а в Западном — есть только Кузнецовы и Ковалёвы.
«ЗВЕРИНЫХ» фамилий среди сибирских несколько меньше (18 %), чем среди западных (26 %).
Все «сибирские звериные» фамилии (кроме одной) вошли в список распространённых фамилий и Западного региона. Казалось бы, это может указывать на их сходство. Но дело в том, что в «сибирском» списке присутствуют самые распространённые «звериные» фамилии. По убыванию частоты это: Зайцев, Козлов, Волков, Орлов, Лебедев, Баранов, Воробьёв, Медведев, Соловьёв. В «западном» списке есть все, кроме Баранова. В «восточном» и «центральном» — есть все, кроме Медведева. С «южным» списком «сибирский» роднят уже не восемь фамилий, а только четыре — Зайцев, Козлов, Волков и Медведев. С «северным» вообще нет общих «звериных» фамилий. Итак, сравнение спектра фамилий вновь обнаруживает очень большое сходство Сибирского региона со средней русской полосой (во всех трёх регионах — по восемь совпадающих фамилий из девяти «сибирских») и отличия «сибирского» от «полярных» регионов.
«ПРИМЕТНЫЕ» фамилии отличают Сибирский регион (12 %) от Западного (6 %). В Сибирском портрете, кроме общерусских «красок» (Смирнов, Белов, Беляев, Чернов), есть и особые черты — Казаков, Горбунов.
Таким образом, анализ семантических классов «топ-50» фамилий подтвердил выводы, полученные по общему спектру частых фамилий («топ-5», «топ-10», «топ-20»). Вновь Сибирский регион проявил себя как некий обобщённый портрет русского генофонда. При этом он ближе всего к регионам средней русской полосы, а не к «полярным» — Северному и Южному. Но анализ с помощью нового инструмента — классов фамилий — позволяет предположить, что из всех регионов средней полосы Сибирский регион более всего тяготеет к Западному, который географически наиболее от него удалён.
Можно выдвинуть гипотезу, что в бесчисленных потоках миграций была наиболее мощная волна мигрантов из Западного региона. Могут быть и более любопытные гипотезы — о происхождении фонда фамилий самого Западного региона. Но выдвижение и проверка гипотез происхождения — задача отдельная. Сейчас важно лишь подчеркнуть, что новый инструмент — семантические классы фамилий — позволяет формулировать и проверять гипотезы о путях формирования генофонда.
Теперь у нас есть «фамильный портрет» для каждого региона «исконного» русского ареала. В чём особенность этих портретов?
ОТ БЕЗЛИКИХ ЦИФР — К КРАСКАМ
Прежде всего — в нашем подходе к самим фамилиям. Мы позволили им говорить — и они рассказали нам нечто совсем новое о русском генофонде, его структуре. Они поведали о столь ярких чертах каждого портрета, что мы теперь можем легко различать регионы. Мы получили новый инструмент для анализа сходства и различий разных регионов.
Напомним, что в популяционной генетике фамилии давно стали безликим аналогом генов. Взгляните на любую работу. Там от феерического многообразия фамилий обычно остаётся одна цифра — показатель инбридинга. В разделе 7.6. мы тоже приводим созданную нами по данным о русских фамилиях карту инбридинга. Такая карта полезна для многих задач — например, для прогноза груза наследственной патологии в русском населении. Но на этой карте сведения о 14 тысячах русских фамилий свернулись в один безликий показатель инбридинга.
Популяционная генетика, следуя законам своей науки, решала проблемы генофонда в рамках и в терминах привычных моделей — подразделенные популяции, инбридинг, генетическое разнообразие, структура генофонда… И среди этих моделей и высоких целей как-то забыла о сути фамилий. Забыла о том, что фамилии не безликий маркёр, а яркий феномен языка. За века фамилии накопили сгусток информации о традиции словообразования. И эти традиции различны в разных регионах. Поэтому сама семантика фамилий несет новую информацию о пространственной структуре генофонда.
ПЯТЬ КРАСОК — ПЯТЬ КЛАССОВ ФАМИЛИЙ
Поэтому мы решили вглядеться «в лицо фамилий», сравнить их «поимённо», учесть их семантику, то есть смысловую нагрузку фамилий. Мы попытались извлечь не безликую информацию, а расцвеченные всей красотой русского языка сведения о генофонде.
По пяти семантическим классам — профессиональные, календарные, «звериные», «приметные», иные фамилии — мы разнесли 50 самых распространённых фамилий каждого региона. Вроде бы немудрёное занятие, но результат получился удивительный: мы обнаружили личный фамильный портрет каждого региона. Мы видим, что у каждого региона есть свой неповторимый профиль фамилий, который не перепутаешь с другим. Эти результаты сведены в таблице 7.4.6.
Такая таблица, ни в коем в случае не претендуя на точность и научную строгость, всё же позволяет качественно оценить, в каком из географических регионов каких фамилий больше. Мы обнаруживаем, что каждый регион имеет своё лицо, свой особый, «индивидуальный» фамильный портрет, созданный с помощью лишь пяти красок — пяти классов фамилий.
Западный регион: лидирует с огромным отрывом по КАЛЕНДАРНЫМ фамилиям.
Южный регион: его принадлежность — это
ПРОФЕССИОНАЛЬНЫЕ фамилии.
Центральный регион: лидирует по «ЗВЕРИНЫМ» фамилиям.
Восточный регион: резко отличается большим массивом «ПРИМЕТНЫХ» фамилий.
Русский Север: главная черта — это ИНЫЕ, не сводимые к остальным классам, фамилии.
Итак, даже такая простая классификация фамилий позволяет увидеть своеобразные черты каждого географического региона в пределах «исконного» русского ареала. Видимо, мы обнаружили своеобразную традицию образования фамилий в каждом регионе.
СЕМАНТИКА ФАМИЛИЙ — НОВЫЙ ОБРАЗ ГЕНОФОНДА
Таблица 7.4.6.
Доля разных классов фамилий (в %) среди «ТОП-50» каждого региона
Самое главное, что фамильные портреты могут стать новым инструментом анализа генофонда. Этот инструмент основан на семантике фамилий, их смысловой нагрузке: он извлекает новый пласт информации, позволяя сравнить регионы друг с другом. Он отслеживает потоки миграций, их след в фамилиях региона. Используя «фамильные портреты» основных регионов как эталоны, можно изучать с помощью этого инструмента другие генофонды.
Как работает этот инструмент? Мы сравнили фамильные портреты окраин (Северо-Запад, казаки, Сибирь) с эталонами, то есть с фамильными портретами «исконного» ареала. Проверка нового инструмента показала, что он хорошо работает даже в окраинных регионах, как мы видели в предыдущем параграфе.
ЧТО ПОКАЗАЛ ЭКСПЕРИМЕНТ?
Подведём краткий итог проверки нового инструмента. Мы видим, что, называя фамилии «поимённо», вернув им лицо, обратившись к семантике фамилий, мы обрели новую информацию. Это позволяет нам утверждать, что «фамильные портреты» оказались новым инструментом познания генофонда — его структуры и истории. Применение этого инструмента даёт новые сведения о генофонде, об источниках миграций.
Конечно, это пока лишь хорошие рабочие гипотезы. Основываясь на анализе только «топ-50» говорить о сходстве и различиях регионов ещё рано. Необходимо провести сравнительный анализ всего многотысячного фонда фамилий. Эта большая работа ещё впереди — она станет отдельной темой книги о русских фамилиях (а пока кратко приведена в разделе 7.6).
И всё же наш опыт работы свидетельствует, что наиболее яркие и своеобразные, наиболее «свои» черты генофонда проявляются в его наиболее частых фамилиях. Это вселяет в нас надежду, что выявленные нами закономерности «фамильных портретов» не просто реальны, но и отражают самые главные особенности изученных генофондов.
§ 1. Карты русских фамилий: От Абрамова до Яковлева — Карты 75 фамилий — Невероятная устойчивость
§ 2. Кто где? Восточные Смирновы и западные Ивановы — Ты Кузнец или Коваль? — Два полюса Поповых — Недружные Дружинины — Неразлучные Козловы и Волковы — «Лоскутное одеяло» для Морозовых — Соловьёвы средней полосы — Близнецы Петровы и Васильевы — Путешествующие Никитины и прозападные Григорьевы — Центральный хребет и полярные пустыни Беловых сами по себе
§ 3. Что показали карты? Характер карты независим… от частоты фамилии — Каждой фамилии по ареалу — В запредельных землях различия стираются — 75 граней одного кристалла — Южные оазисы Черновых — Котовы, которые гуляютИтак, мы рассмотрели, как соотносятся друг с другом регионы по распространённым фамилиям. «Лица» отдельных фамилий порой исчезали в толпе, но все вместе они помогли каждому региону занять его истинное место в русском генофонде.
Теперь мы рассмотрим эту картину как бы наоборот: не как выглядит отдельный регион по совокупности фамилий, а как выглядят сразу все регионы только по одной фамилии. В этом нам помогут «простые» карты — карты встречаемости отдельной фамилии, но во всех русских популяциях. Объём книги допускает привести карты лишь нескольких фамилий. Но и они позволяют охватить взглядом сразу весь генофонд, увидев его так, как он виден глазами одной из многих тысяч фамилий. И увидеть с помощью не сухих цифр, а картографических образов.
Всё же, как ни важен статистический анализ, главным инструментом геногеографии остаётся карта. Она
даёт наиболее живой и объективный образ пространственной изменчивости, позволяет одним взглядом охватить огромное количество цифр, мелькающих в таблицах.
КАК ЧИТАТЬ КАРТЫ
Карта каждой фамилии построена по данным о частотах этой фамилии в 100 русских популяциях (50 районов, 50 сельсоветов). Напомним, что частоты в районах рассчитаны по данным обо всём населении района старше 18 лет. И вновь повторим (для читателя, не заглядывавшего в другие главы книги), что высокие частоты встречаемости фамилии окрашены в тёмные тона, низкие частоты — в светлые тона. Все карты даны в единой шкале частот, поэтому их легко сравнить: на всех картах фамилий один и тот же оттенок шкалы означает одну и ту же частоту. Исключение составляет лишь последний «открытый» интервал — он включает любые частоты больше 2 %. Шкала частот приведена в верхнем окне легенды карты, а высота столбца и число над ним указывают долю картографируемой территории, занятую данным интервалом частоты фамилии. В статистическом окне легенды указаны: число изученных популяций, число узлов картографической сети, минимальная, максимальная и средняя частоты фамилии в популяциях. Все эти показатели рассчитаны по карте. Все данные приведены только для ареала с высокой надёжностью картографического прогноза.
Таблица 7.5.1.
75 распространённых русских фамилий, включённых в картографический анализ (с указанием их места в «магистральном» списке русских фамилий)
ФАМИЛИИ
Основой Атласа русских фамилий являются карты 75 распространённых русских фамилий. К сожалению, введение данных о сельсоветах не только нарушает правило проведения картографирования на едином уровне популяционной организации, но и ограничивает картографирование лишь 75 фамилиями. Дело в том, что для отбора фамилий А. П. Бужиловой был применен «качественный» критерий: из всей совокупности выявленных ею фамилий выбраны те, которые встретились более чем в двух популяциях. Именно эти фамилии, числом семьдесят пять, в этом разделе мы будем называть «распространёнными» русскими фамилиями. Их перечень приведён в таблице 7.5.1.
ВЕРНЫ ЛИ КАРТЫ?
Мы не ставим перед собой задачу изучить географию каждой фамилии. Конечно же, каждая из многих тысяч фамилий уникальна и заслуживает специального историко-географического и филологического исследования. Но для популяционного генетика любая фамилия — как и любой признак генетики или антропологии — лишь одно из отражений генофонда. Поэтому для нас важен ответ на общий вопрос: информативны ли карты отдельных фамилий в отношении структуры генофонда? Сумеет ли карта фамилии выявить закономерности в её изменчивости? Или же карты отдельных фамилий столь мозаичны и хаотичны, что только обобщённый анализ (то есть анализ всех фамилий вместе) сможет различить сквозь пелену этого хаоса архитектонику, каркас русского генофонда?
Эти опасения не случайны. Они вызваны «гипервариабельностью» фамилий. В терминах генетики фамилии предстают как один ген с чрезвычайно большим числом аллелей (сколько фамилий — столько и «аллелей» в этом «гене») и высокой скоростью их мутаций. Средняя частота каждого фамильного «аллеля» редко достигает даже 1 % уровня полиморфизма. Например, в выборке 200 тысяч жителей Санкт-Петербурга (на 1910 год) даже самая распространённая фамилия Иванов наблюдалась с частотой р=0.0095; а список из ста наиболее распространённых в Питере фамилий замыкал Наумов с частотой р=0.0006 [Суперанская и др., 1984].
При такой вариабельности фамилий для их достоверной оценки необходимо изучать большие популяции численностью в несколько тысяч, а не в несколько сотен человек. Половина популяций — 50 районов — соответствуют этим требованиям. Но когда мы используем в качестве опорных популяций 50 сельсоветов, то мы ожидаем встретить резкие флуктуации в частотах фамилий: даже соседние сельсоветы могут резко различаться по частоте одной и той же фамилии. Дрейф генов («дрейф фамилий») вызывает случайные изменения частот фамилий в малых популяциях. Например, в одном сельсовете будет множество Смирновых, а в соседнем — множество Поповых, в то время как в исходной для них «прапопуляции» Смирновых и Поповых было поровну. Поэтому надо охватить много таких малых популяций в районе, чтобы правильно оценить среднюю частоту встречаемости и той, и другой фамилии в изучаемой части русского ареала.
Первый вариант анализа мы провели по данным только о сельсоветах [Балановский и др., 2001]. Честно говоря, мы собирались анализировать по ним лишь обобщённые карты. Мы были уверены, что на картах отдельных фамилий увидим лишь «лоскутное одеяло» — слишком малые размеры сельсоветов дадут слишком хаотичную картину изменчивости отдельной фамилии. Это не препятствовало бы эффективности обобщённого анализа. Так, для генов наследственной патологии характерна чрезвычайно низкая частота (и «простые» карты строить для нет смысла), но их обобщённый картографический анализ оказался высоко эффективным [Наследственные болезни в популяциях человека, 2002; Зинченко и др., 2000].
Каково же было наше изумление, когда не только на обобщённых картах, но и на большинстве карт отдельных фамилий вместо «лоскутного одеяла» мы увидели ярко выраженные тренды (см. карты в [Балановский и др., 2001]). Насколько эти тренды должны быть сильны, что они сумели пробиться сквозь все случайности «дрейфа фамилий»! Видимо, благодаря тому, что ареал русского народа велик, мы можем охватить взглядом эти тренды вопреки случайным биениям (случайным всплескам или падениям) частоты отдельной фамилии. Такие тренды можно увидеть с высоты птичьего полёта, а не из мышиной норки (JT. Н. Гумилев). Такую высоту и даёт нам охват всего «исконного» русского ареала. Так, вопреки эффектам «дрейфа фамилий», карты отдельных фамилий оказались способными выявлять пространственные закономерности в масштабе «исконного» русского ареала. Это прямо свидетельствует в пользу пригодности русских фамилий для анализа генофонда.
Поэтому в том виде анализа, который мы приводим здесь, мы включили оба типа популяций — сельсоветы и районы. И получили редкую возможность сравнить их с картами, построенными нами ранее — только по данным о сельсоветах. Это даёт возможность ответить на вопрос — насколько верны закономерности, выявленные на «сельсоветных» картах? Не исчезнут ли они, если мы введём ещё столько же популяций, полученных по много более надёжным популяциям — районам? Эти новые карты охватывают в два раза больше популяций и в тридцать раз больше обследованных (почти 1 млн. человек). И вновь — вопреки нашим опасениям — оказалось, что новые карты нигде не нарушают обнаруженные ранее на «сельсоветном» уровне [Балановский и др., 2001] основные закономерности, но уточняют и детализируют их.
Этот вывод — один из важнейших методических выводов проведённой работы. Он свидетельствует о парадоксальной надёжности фамилий в качестве квазигенетического маркёра.
КАРТЫ РАЗНЫХ ФАМИЛИЙ
В таблице 7.5.2. указаны: 17 фамилий, карты которых приводятся в этом разделе; порядковый номер их места в «магистральном» списке всех встреченных русских фамилий (67 000 фамилий); их среднерусская частота (по данным о почти 1 миллионе изученных индивидов); число встреченных индивидов в каждом из регионов (перейти к региональной частоте фамилии можно с помощью общей численности обследованных в регионе, которая приведена внизу столбцов).
Мы дадим очень сжатое и краткое описание карт отдельных фамилий. Этому три причины. Во-первых, интерпретация таких карт — дело специалистов в области ономастики и лингвистической географии. Во-вторых, читатель сам с таким же правом, как и мы, может рассмотреть и описать эти карты. А в-третьих, и в основном, эта книга посвящена вовсе не фамилиям. И наша задача — отметить в картах лишь то, что имеет отношение к главной задаче книги: к выявлению архитектоники русского генофонда в целом.
Таблица 7.5.2.
Семнадцать фамилий, представленные на картах в разделе 7.5., и их положение в общем фонде русских фамилий
Смирновы и Ивановы,
Кузнецовы и Ковалёвы,
Поповы и Дружинины,
Козловы и Волковы,
Морозовы и Соловьёвы,
Петровы и Васильевы,
Никитины и Григорьевы,
Беловы, Черновы и Котов
ФАМИЛИЯ «СМИРНОВ» (рис. 7.5.7.) по нашим данным лидирует среди всех русских фамилий (средняя частота — 1.9 %). Есть у нас и косвенные сведения из иных источников о том, что Смирновы выходят на первое место среди фамилий не только сельского, но и в целом современного русского населения. Но даже для самой распространённой фамилии мы вовсе не видим равномерного распределения по русскому ареалу!
Напротив, распределение её чётко очерчено склонностью к востоку. Напомним, что в Восточном регионе частота Смирновых достигает уникальной отметки — 5.9 % (табл. 7.3.4). Причём в некоторых восточных районах частота Смирновых доходит до 13 %! Также Смирновы занимают первое место в Центральном регионе (в среднем 2.3 %). В Западном регионе (0.8 %) они опускаются на 6 место (и также в Сибирском регионе занимают 5 место). А в Северном регионе (0.2 %) и в Южном (0.08 %) их частоты столь малы, что Смирновы не попали даже в «топ-50» (см. раздел 7.4). Это табличные данные.
Те же особенности ярко видны на карте — максимум на востоке и постепенное снижение вплоть до самых западных границ. Конечно, мы видим где-то всплески, где-то падения частоты за счёт «дрейфа фамилий» в сельсоветах. Но то, что Смирновы — фамилия среднерусской полосы, даже столь несовершенная карта показывает удивительно ясно.
Рис. 7.5.1. Карта распространённости фамилии «СМИРНОВ».
Рис. 7.5.2. Карта распространённости фамилии «ИВАНОВ».
Рис. 7.5.3. Карта распространённости фамилии «КУЗНЕЦОВ».
Рис. 7.5.4. Карта распространённости фамилии «КОВАЛЁВ».
Очень чётко очерчены и оба «полярных» региона. На Русском Севере Смирновы встречаются с невысокой частотой, но повсюду. На юге Смирновых нет. Три широтных зоны — северная, среднерусская, южная — столь явно очертились на карте «главной» русской фамилии! Напомним, что эти зоны мы выявляли по табличным данным, но наши пять регионов в них были представлены лишь семью областями. Теперь, охватив данные по 22 областям, эти зоны на картах обретают свои истинные ареалы.
ФАМИЛИЯ «ИВАНОВ» (рис. 7.5.2.), занимает следующее, второе место в списке русских фамилий (средняя частота — 1.3 %). Она имеет особое значение из-за своей высокой распространённости — она обычно считается «лицом» русского этноса (русские Иваны). Имя «Иоанн» встречается в церковном календаре 79 раз и является самым распространённым мужским именем. В середине XX века оно встречалось с частотой около 15 %, а с XVII до середины XX века — в два раза чаще, чем следующее за ним по частотности имя «Василий» (расчёты проведены нами по данным [Суслова, Супе-ранская, 1991]).
Для столь распространённой и, надо полагать, поли-филетичной фамилии (т. е. многократно возникавшей по всему ареалу от самого распространённого имени святцев) естественно было ожидать отсутствие каких-либо географических закономерностей. Тем удивительнее, что карта демонстрирует территории, на которых Ивановы практически отсутствуют. Зона повышенных частот расположена на западе и северо-западе, и тянется она почти сплошным «горным» массивом до северо-востока.
На севере и на юге, за исключением отдельных «островков», Ивановы очень редки.
ФАМИЛИЯ «КУЗНЕЦОВ» (рис. 7.5.3.) занимает почётное третье место в «магистральном» списке русских фамилий (средняя частота — 1.0 %) (табл. 7.5.2.). Мы видели, что почти во всех регионах она вошла в число наиболее распространённых. Однако в распределении Кузнецовых не удаётся выявить столь же чёткую географическую закономерность, как для предыдущих фамилий: острова накопления этой
фамилии чередуются с зонами её отсутствия. В целом массив Кузнецовых занимает почти весь русский ареал — земли и северные, и восточные, и центральные, снижая частоты лишь на западной и южной границе ареала и исчезая на юго-востоке.
Сопоставление карт распространения Кузнецовых (рис. 7.5.3.) и Ковалёвых (рис. 7.5.4.) может быть интересным с точки зрения происхождения русских фамилий. Предполагается, что если уж обе кузнечные фамилии («Ковалёв» и «Кузнецов») происходят из разных диалектов, то и ареалы должны быть альтернативны. Однако картографирование показало, что ареалы этих фамилий частично перекрываются. Поэтому корреляция между картами не отрицательна — она просто близка к нулю. Возможно, это связано с тем, что в зоне контакта двух диалектов ковали и кузнецы могли дружно сосуществовать, занимая разное профессиональные ниши.
Рис. 7.5.5. Карта распространённости фамилии «ПОПОВ».
ФАМИЛИЯ «КОВАЛЁВ» (рис. 7.5.4.) занимает 32 место по частоте в списке русских фамилий (средняя частота — 0,3 %) и третье место среди «профессиональных» фамилий (после Кузнецовых и Поповых). Территория распространения Ковалёвых удивительно компактна — это самый запад и юго-запад России, вдоль по границе с Белоруссией и Украиной, что наводит на мысль о возникновении фамилии «Ковалёв» (именно с финалем «-ев») на этой территории. Это, конечно, поле работы для лингвистов, но отметим, что эта компактность территории встречаемости выявилась только благодаря компьютерному картографированию.
ФАМИЛИЯ «ПОПОВ» (рис. 7.5.5.) занимает пятое место в списке русских фамилий (средняя частота — 0.8 %), а среди «профессиональных» (связанных с деятельностью на благо людей) занимает второе место. Но, как мы не раз говорили выше, она является самой распространённой в обоих «полярных» регионах. При этом в Северном регионе средняя частота фамилии Попов 1.8 %, а в Южном регионе составляет 0.8 %. В Восточном регионе Поповы занимают седьмое место, составляя в среднем 1.0 %, в отдельных районах Костромской области повышаясь до 3–4%. В Центральном и Западном регионах частота Поповых мала.
На карте такая «полярная» ориентация проявилась ещё ярче, подтверждая выявленные ранее закономерности. Мы видим, как весь север (за исключением одной точки) демонстрирует единое «нагорье» частот Поповых. Его восточные отроги спускаются до Костромской области, а в целом «горный» массив северного ареала
Поповых тянется от реки Унжи на востоке до Чудского озера на западе. На южной границе ареала возвышается второй полюс — второе «нагорье» частот Поповых, отроги которого тянутся на запад до Смоленской области. Причём южное «нагорье» с его западными отрогами является почти зеркальным отражением северного «нагорья» с его восточными отрогами. Эти два «нагорья» разделяет пустыня с отсутствием Поповых, которая тянется обширной полосой с северо-запада на юго-восток — от Псковских земель до Саратовских.
Рис. 7.5.6. Карта распространённости фамилии «ДРУЖИНИН».
Рис. 7.5.7. Карта распространённости фамилии «КОЗЛОВ».
Такой необычный ландшафт одной из самых распространённых фамилий вновь убедительно говорит в пользу исторической неслучайности географического распределения фамилий.
ФАМИЛИЯ «ДРУЖИНИН» (рис. 7.5.6.) — последняя из четырёх «профессиональных» фамилий, включённых в Атлас. Однако к профессиональным фамилиям она относится довольно условно. Эта фамилия могла происходить не только от воинской «дружины», то есть не только от профессии дружинника, но и от другого значения слова «дружина» — друг, спутник, в том числе и спутник жизни. Это самая редкая из 75 картографированных фамилий (табл. 7.5.2), а в общем списке русских фамилий она занимает 337 место (средняя частота 0.05 %).
Из популяций районного уровня она с заметной частотой встречена в двух северных районах Архангельской области (по 16–26 человек в районе) и в четырёх восточных популяциях Костромской области. С невысокой частотой она также распространена в трёх южных популяциях Белгородской области (но присутствует ещё в восьми южных районах) и в одной западной — Смоленской (но обнаруживается ещё в четырёх западных районах). Районные популяции репрезентативны. Наличие фамилии пусть с невысокой частотой, но в нескольких географически близких популяциях районного уровня позволяет уверенно говорить о накоплении фамилии в этих регионах. Повышение же частоты Дружининых в одном из сельсоветов Пензенской области (всего несколько носителей этой фамилии дали всплеск частоты до 1.4 %) можно рассматривать на этом фоне как случайное событие.
Поэтому мы можем уверенно говорить, что основные ареалы Дружининых расположены в северных и восточных регионах, а в остальных регионах они встречаются редко, но повсюду. Для нас важно, что карты позволяют проследить распространение даже столь редкой фамилии. Но, конечно же, при выделении ареала редких фамилий надо опираться на выборки большого объёма.
ФАМИЛИЯ «КОЗЛОВ» (7.5.7.) и ФАМИЛИЯ «ВОЛКОВ» (рис. 7.5.8.) не только расположены рядом, занимая седьмое (средняя частота — 0,6 %) и одиннадцатое (средняя частота — 0,5 %) места в списке русских фамилий, а в списке «звериных» фамилий — третье и пятое места.
Они и на карте неразрывно следуют друг за другом, образуя обширное «нагорье» высоких частот на западе и юго-западе русского ареала, а затем двигаясь сплошной полосой в северо-восточном направлении и далее на север. Этот коридор Козловых-Волковых следует от смоленских земель через Волго-Окское междуречье в земли тверские и костромские. А затем, ослабевая по частоте, но возрастая по обширности ареала, уходит в земли вологодские и архангельские. Причём, как и положено в пищевой цепи, почти везде Козловых больше, чем Волковых. Конечно, на этом пути встречаются и исключения — где-то есть Волковы, но Козловых нет. Но такие исключения связаны, в основном, с «дрейфом фамилий» в малых популяциях сельсоветов. Когда данных будет намного больше, можно будет проверить эти закономерности.
Рис. 7.5.8. Карта распространённости фамилии «ВОЛКОВ».
Рис. 7.5.9. Карта распространённости фамилии «МОРОЗОВ».
Даже несовершенные карты демонстрируют не только чётко выраженную закономерность, но и высокую корреляцию друг с другом фамильных ландшафтов Козловых и Волковых. Причём, если в предыдущей паре фамилий Кузнецовы-Ковалёвы ожидалась корреляция отрицательная (там, где много одних, мало других), то в паре Козловы-Волковы корреляция положительная (они идут след в след).
ФАМИЛИЯ «МОРОЗОВ» (рис. 7.5.9.) особая по семантике. Рассмотрев все профессиональные фамилии подряд, мы нарушили порядок следования фамилий по частоте. Вслед за Козловыми по убыванию частоты в таблице 7.5.2. идут Морозовы, занимающие девятое место в общерусском списке фамилий (средняя частота — 0.6 %). Это единственная рассматриваемая нами карта «иных» фамилий, то есть не отнесённых ни к одному из четырёх главных классов фамилий.
Но, несмотря на её достаточно высокое положение в списке русских фамилий (в первой десятке), в её пространственной изменчивости трудно разглядеть явные закономерности. Несколько чаще Морозовы встречаются в широкой центральной зоне русского ареала. Но полоса повышенных значений частоты Морозовых следует вдоль западных и юго-западных границ, а также на севере русского ареала. Как тенденцию можно отметить снижение частоты Морозовых на юго-востоке ареала. Однако в целом карта приближается к мозаичному типу («лоскутное одеяло»).
ФАМИЛИЯ «СОЛОВЬЁВ» (рис. 7.5.10.) занимает следующее — десятое — место в списке фамилий и четвертое место среди «звериных» фамилий (средняя частота — 0,5 %). Впереди неё идут две других «птичьих» фамилии — Соколовы (4 место) и Лебедевы (6 место). «Птичья» фамилия Соловьёв имеет своеобразное распространение. Она отсутствует на севере и на юго-востоке, однако встречается по окраинам русского ареала от юга до севера (Онежское озеро). Максимальные частоты Соловьёвых обнаруживаются в средней полосе России — в Тверской и Костромской областях.
ФАМИЛИЯ «ПЕТРОВ» 7.5.11.) и ФАМИЛИЯ «ВАСИЛЬЕВ» (рис. 7.5.12.) занимают в списке русских фамилий соседние двенадцатое (средняя частота — 0.5 %) и тринадцатое места (средняя частота — 0.4 %), а в списке календарных фамилий — почетные второе и третье места. Их фамильные ландшафты так похожи, что карты легко перепутать.
Обширная зона распространения Петровых и Васильевых локализована на северо-западе России. Локальные максимумы обеих фамилий обнаруживаются в новгородских землях, смоленских и верховьях Онеги. Далее на восток (захватывая часть костромских популяций) и на север (охватывая его почти целиком) простирается зона, где Петровы и Васильевы встречаются реже, но повсеместно. Такая же зона простирается и на юго-западе. Очень редки обе фамилии на юго-востоке центральных земель, включая восточную часть Волго-Окского междуречья. В целом, в фамильных ландшафтах Петровых и Васильевых намечается единая обширная зона, простирающаяся по западной половине русского ареала от севера до юга.
Рис. 7.5.10. Карта распространённости фамилии «СОЛОВЬЁВ».
Рис. 7.5.11. Карта распространённости фамилии «ПЕТРОВ».
ФАМИЛИЯ «НИКИТИН» (рис. 7.5.13) и ФАМИЛИЯ «ГРИГОРЬЕВ» (рис. 7.5.14.) также относятся к календарным, но встречаются в два раза реже предыдущих (0.2 %): они занимают по частоте, соответственно, 62 и 70 места, а среди календарных фамилий — 25 и 29 места. В целом, они укладываются в тот же ареал, который очерчен предыдущими двумя календарными фамилиями. Но из-за более низкой частоты фамилии «Никитины» и «Григорьевы» чаще под действием «дрейфа фамилий» исчезают, образуя большие, но случайно разбросанные зоны с отсутствием этих фамилий.
Но всё же Никитины и Григорьевы не близнецы — есть и различия в их распространении.
НИКИТИНЫ образуют компактное ядро на западе в новгородско-смоленских землях. Обширная область менее высоких частот Никитиных находится на севере, охватывая Онегу, Сухону и часть Костромской области.
ГРИГОРЬЕВЫ занимают ареал, охватывающий западные российские области. Он практически непрерывен, лишь часть Тверской области характеризуется низкой частотой этой фамилии. Локальные максимумы находятся в новгородских, тверских, московских землях, а также у Белоозера, образуя основную северо-западную, а также меньшую нижегородскую зоны.
Несмотря на случайные колебания частот фамилий, и Никитины, и Григорьевы входят в ту единую обширную зону, охватывающую западную половину русского ареала, которая была очерчена предыдущими двумя календарными фамилиями. На картах фамилий вновь видим, что календарные фамилии — принадлежность лишь западного «полушария» русского ареала, а вовсе не неотъемлемое свойство любых русских популяций.
ФАМИЛИЯ «БЕЛОВ» 7.5.15.) занимает 27 место в списке фамилий (встречаясь со средней частотой 0.3 %) и шестое место среди «приметных» фамилий — после Смирновых, Новиковых, Румянцевых, Хромцовых и Беляевых. Отметим, что и Беловы, и Беляевы чаще всего встречаются в Центральном и Восточном регионах.
Карта распространения Беловых, несмотря на их невысокую частоту, выявляет на удивление чёткий «фамильный ландшафт». Весь русский ареал пересечен непрерывным хребтом относительно высокой частоты Беловых — от Смоленска на западе до Костромы и Нижнего Новгорода на востоке. К северу и к югу от такого среднерусского хребта простираются пустыни с редкими оазисами Беловых.
Беловы и Черновы наряду со Смирновыми отнесены к своеобразному классу «приметных» фамилий, закрепляющих в фамилии приметные черты внешнего или психологического облика.
ФАМИЛИЯ «ЧЕРНОВ» (рис. 7.5.16.) оказалась намного более редкой — она занимает 211 место в списке фамилий, а средняя частота (0.07 %) в четыре раза ниже, чем у Беловых. Распространение Черновых не является альтернативой Беловым — есть зоны, где встречаются и те, и другие, но есть и локальные максимумы, где представлена лишь одна из этой пары фамилий. Карту Черновых можно отнести к разряду мозаичных.
Рис. 7.5.12. Карта распространённости фамилии «ВАСИЛЬЕВ».
Рис. 7.5.13. Карта распространённости фамилии «НИКИТИН».
Рис. 7.5.14. Карта распространённости фамилии «ГРИГОРЬЕВ».
Рис. 7.5.15. Карта распространённости фамилии «БЕЛОВ».
Рис. 7.5.16. Карта распространённости фамилии «ЧЕРНОВ».
Рис. 7.5.17. Карта распространённости фамилии «КОТОВ».
Впрочем, проглядывает и некая закономерность. Среди всего множества популяций севернее линии, соединяющей Смоленск, Москву и Нижний Новгород, встречен лишь один сельсовет в Вологодской области с носителями фамилии Чернов. Южнее этого меридиана мы видим целый ряд популяций с заметной частотой Черновых. Поскольку часть этих популяций районного уровня, дающего надёжные оценки встречаемости, то на эту закономерность можно положиться. Тогда «фамильный ландшафт» Черновых можно описать как пустынный в северной половине ареала русского народа, и насыщенный оазисами Черновых в южной его половине.
ФАМИЛИЯ «КОТОВ» (рис. 7.5.17.) замыкает демонстрацию карт. Она занимает 129 место в списке русских фамилий, встречаясь со средней частотой 0.1 %. Хотя их частота выше, чем Черновых и Дружининых (табл. 7.5.2), однако увидеть какую-либо закономерность на карте нельзя. Все — и северные, и южные, и западные, и центральные, и восточные всплески встречаемости Котовых опираются на достоверные данные «районного» уровня. Карта представляет яркий пример мозаичного типа карт, довольно редкого для изученных 75 фамилий. Котовы гуляют сами по себе и встречаются разбросанными «островами» среди моря популяций, в которых Котовых нет.
Однако такие мозаичные карты пока не позволяют сделать заключение о «самозарождении» Котовых в нескольких разных частях ареала. Именно для таких признаков — с мозаичным распределением и низкими частотами — необходимо дальнейшее значительное расширение объёма выборок из всех частей ареала. Только тогда можно будет сделать обоснованный выбор между гипотезами миграций, случайного дрейфа и «мутационных» событий (полифилетического происхождения — независимого зарождения фамилии в разных частях ареала).
Мы рассмотрели семнадцать карт распространения фамилий (их, как и прочие карты Атласа фамилий можно увидеть на нашем сайте www.genofond.ru). Не так много, но некоторые черты моря проявляются и в его каплях. Вглядимся в эти черты.
ЧАСТОТА ФАМИЛИИ НЕ ОПРЕДЕЛЯЕТ ТИП «ФАМИЛЬНОГО ЛАНДШАФТА» Например, сопоставляя «фамильные ландшафты» (рис. 7.5.1.-7.5.17.) и средние частоты этих фамилий (табл. 7.5.2.), можно прийти к выводу, что компактность, мозаичность или же площадь ареала распространения фамилии вовсе не определяются её частотой, как можно было предполагать. Мозаичный тип карты можно встретить не только среди редких, но и среди самых частых фамилий, точно так же и чёткие географические закономерности встречаются среди фамилий, резко различных по частоте.
Это положение требует специальной проверки кар-тографо-статистическими методами, которое мы не имеем возможности привести здесь. Нет спора, 17 карт фамилий из многих тысяч фамилий не составляют сколь нибудь значимую выборку. Но они создают некое общее представление о свойствах их распространения.
КАЖДАЯ ФАМИЛИЯ ИМЕЕТ СВОЙ АРЕАЛ
Основной вывод, который можно сделать по рассмотрении карт случайно выбранных фамилий — это вывод о географической приуроченности русских фамилий. Причём эта приуроченность в ряде случаев проявилась очень ярко и чётко. Она являет собой правило. Тогда как «повсеместные» фамилии, мозаично или же равномерно распределённые по всему ареалу, являются исключением.
Чтобы точно очертить истинные ареалы распространения каждой из русских фамилий, надо существенно расширить источниковую базу: полноценно представить не избранные, а все географические районы русского ареала. Но то, что географические закономерности в распределении отдельных фамилий проявились вопреки несовершенству наших сведений, указывает на много большую, чем ранее считалось, пригодность русских фамилий для исследования русского генофонда. Подчеркнём принципиальный момент: именно картографирование частот фамилий позволяет объективно выявлять их пространственную изменчивость. Для фамилий карта является незаменимым и главным инструментом в арсенале исследователя.
«ЗАПРЕДЕЛЬНЫЕ» ЗЕМЛИ
Рассматривая классические маркёры (глава 5), мы уже видели, что, как только мы выходим за пределы «исконного» ареала, сразу же встречаем нарушения основных черт генетического ландшафта, и, как правило, его сглаживание, усреднение. Так при старении гор исчезают снежные вершины и глубокие ущелья — стираются крайности и различия, всё превращается в некий выровненный «средний» ландшафт местности. Так и наши — генетические или же фамильные — ландшафты за пределами своего «месторождения» приобретают выровненный, усреднённый облик.
Например, на карте Поповых (рис. 7.5.5.) примечателен «обрыв» северного «нагорья» — к востоку от него, за пределами «исконного» ареала, тянется длинный язык «пустынных» значений частоты фамилии. Он представлен популяциями Кировской и Пермской областей, не входящими уже в «исконный» русский ареал. Их значения не продолжают ландшафт «исконного» ареала, а нарушают его: «запредельные» популяции точно воспроизводят среднерусские частоты, а вовсе не частоты соседних с ними северо-восточных популяций «исконного» ареала. Эту же закономерность мы видели и на картах Смирновых, Ивановых, Кузнецовых, Козловых, Волковых. Это означает, что на всех картах, где «исконные» восточные земли отличаются от среднерусских значений, мы обнаруживаем в «запредельных» землях (Кировской и Пермской областей, ещё дальше на восток) не продолжение оригинальных восточных ландшафтов, а некие усреднённые значения.
Именно этот эффект мы отмечали и для карт «классических» маркёров (глава 5, раздел 5.2). Территории, находящиеся за пределами «исконного» ареала и заселённые после того, как сформировался облик русского народа, усредняют в себе потоки многоликих миграций. Если этих потоков было много, и шли они из разных регионов, то велика вероятность того, что за пределами «исконного» ареала мы будем встречать «усреднённые» русские популяции. Конечно же, если миграция шла из одного из регионов — то «запредельные» территории будут воспроизводить черты конкретного источника миграций.
Отсюда следует два вывода.
Во-первых, изучив географию фамилий в «исконном» ареале и имея демографические сведения об источниках и силе миграционных потоков, мы можем прогнозировать фамильный портрет данного окраинного региона. Это неплохо уже и само по себе. Но если у нас есть возможность сравнить прогнозируемый фамильный портрет с реальным, то можно сделать и следующий важный шаг. Если фамильные портреты совпали, значит, мы на верном пути, и источники миграций установлены. И теперь можно, используя банки данных о классических и ДНК маркёрах определить уже не фамильный, а генетический портрет окраинного региона (прогнозировать частоты генов). Для этого не потребуется экспедиций, забора венозной крови, дорогостоящих лабораторных анализов — достаточно лишь достоверного знания о фамильных ландшафтах и о демографии региона.
Во-вторых, это означает, что в пределах «исконного» ареала по-прежнему сохраняется «исконная» структура русского генофонда. Если бы поздние миграции выровняли ландшафт — то мы и на «исконных» территориях видели бы то же, что и на «запредельных» землях. Мы бы увидели всюду некие усреднённые русские характеристики, а не индивидуальные особенности отдельных регионов. Наличие пространственной структуры русского генофонда — важное свидетельство его сохранения, а не его «гибели». Но эту тему мы оставим для последней главы книги, а сейчас вернёмся к русским фамилиям.
ОБЩИЕ ЧЕРТЫ ГЕНОФОНДА
Итак, карты отдельных фамилий выявляют географические закономерности в их изменчивости. Это позволяет задаться вопросом: если даже карты отдельных фамилий позволяют проводить районирование ареала, нельзя ли выделить основные черты генофонда по совокупности всех фамилий?
Мы видели «хребты» высоких значений, пересекающие весь «исконный» русский ареал и делящие его на три широтные зоны — северную, южную и среднерусскую. Видели разделение ареала на две половины — в одних случаях на северную и южную, в других — на восточную и западную. Видели и более сложные «фамильные ландшафты». Каждый из них — одна грань единого целого. В каждой фамилии преломляется единая история русского народа и его генофонда. Конечно же, у нас в руках слишком мало карт — пока лишь карты 75 фамилий — чтобы восстановить «фамильный портрет» русского народа во всей его полноте. Но мы видели, что даже десяток самых частых фамилий давал представление о соотношениях между регионами (раздел 7.3). Поэтому всё же можно попробовать увидеть структуру генофонда через призму обобщённого анализа имеющейся у нас панели 75 фамилий.
§ 1. Различия и сходство регионов: В анализе 14 000 коренных фамилий — Сходство фамилий средней полосы — Своеобразие «полярных» регионов — Подтвердился анализ «топ-20» и «осмысленных» классов «топ-50»!
§ 2. Фамилии и маркёры Y хромосомы: Индивиды: похожи ли Y хромосомы у однофамильцев? — Популяции: фамилии и генофонд — На Русской равнине география фамилий и Y хромосомы сходна — Высокая корреляция между матрицами расстояний для «настоящих» генов и для фамилий
§ 3. «Главные сценарии» изменчивости: Среднерусская полоса — Постепенное изменение фамилий к югу — Своеобразие Русского Севера — Корреляции «главных сценариев» фамилий, антропологии и генетики
§ 4. География инбридинга: Как узнать инбридинг по фамилиям? — Прогноз груза наследственных болезней — Русский генофонд — Неуклонный рост инбридинга с юго-запада на восток
§ 5. Основные черты «фамильного портрета»: «Осмысленная» классификация фамилий и регионов — Парадоксально надёжные маркёры — Фамилии не ради фамилий — Лицо генофонда — Разведка боем
Как и в предыдущих главах второй части книги, заключительный раздел вбирает те виды анализа, которые абстрагируются от отдельных признаков и выявляют общие черты генофонда. Это позволяет нам забыть на время о том, какими именно признаками мы пользовались, и вглядеться, наконец, в тот общий план строения русского генофонда, который проявляется в рассматриваемом типе признаков.
В. этой главе есть и уже привычные карты главных компонент — «главных сценариев» изменчивости генофонда (£?). Однако для фамилий этот параграф не центральный. Дело в том, что карты «главных сценариев» пока предварительные — они опираются на небольшой набор фамилий (75) и лишь половина популяций надёжна («районного масштаба»).
Поэтому основной акцент мы сделаем на другом виде анализа — на выявлении соотношений между основными частями генофонда по всем 14 тысячам коренных фамилий сразу. Такую оценку различия и сходства регионов (§ 1) мы получим с помощью обобщённых расстояний между регионами и диаграмм многомерного шкалирования — то есть так же, как в предыдущей главе для маркёров митохондриальной ДНК и Y хромосомы.
Это позволит нам сравнить обобщённые расстояния, рассчитанные по фамилиям, с генетическими расстояниями между теми же регионами, рассчитанными по маркёрам Y хромосомы (§ 2). Такое сравнение, во-первых, интригующе интересно — ведь оба типа признаков передаются по отцовской линии. А во-вторых, мы имеем редкую возможность сравнить их без карт — и фамилии, и Y хромосома изучены нами в одних и тех же русских популяциях.
А вот последний вид анализа можно провести только по фамилиям. Это — прогноз инбридинга и связанного с ним груза наследственной патологии (§ 4).
Все виды анализа вместе помогут составить обобщённый «фамильный портрет» русского генофонда.
ВЕСЬ ФОНД ФАМИЛИЙ
Каков портрет русского генофонда, рисуемый не оттенками двух-пяти десятков самых частых фамилий, а разноцветьем всего многотысячного спектра русских фамилий? Как по всему спектру фамилий русский генофонд подразделяется на региональные части? Каковы соотношения между региональными «фамильными фондами»? Отвечая на эти вопросы, мы можем располагать данными лишь о пяти регионах «исконного» ареала, поэтому структура генофонда выявится лишь в общих чертах. Но именно эти общие черты для нас сейчас и важны. В последующих разделах (§ 2 и § 3) картографирование по данным о 100 популяциях поможет взглянуть на детали структуры генофонда.
Чтобы оценить истинные «взаимоотношения» регионов, мы включили в анализ весь фонд «коренных» фамилий. Использованы данные по всем фамилиям — и всеобщим, и уникальным. Единственное условие — анализируемые фамилии должны быть «коренными», чтобы мятущиеся ветры миграций не создавали эфемерную видимость близости или удалённости популяций.
АЛГОРИТМЫ АНАЛИЗА
МЕРА СХОДСТВА. Напомним, что в предыдущих разделах этой главы для выявления сходства и различий регионов по частым фамилиям («топ-10» или «топ-50»,) мы использовали самые разные показатели, чтобы максимально сохранить «лицо» фамилий, сравнить их «поимённо». Но теперь, при обобщённом анализе всего фонда фамилий, мы воспользуемся общепринятой в популяционной генетике мерой сравнения популяций — генетических расстояний М. Nei (1975).
АЛГОРИТМ РАСЧЕТА. Напомним, что в анализ включена информация о распространении 14 тысяч «коренных» фамилий. Носители этих фамилий — 725 тысяч человек из пяти основных регионов «исконного» ареала. «Пришлые», случайные и потому редкие для данного района фамилии отсеяны согласно «демографическому» критерию (раздел 7.3., § 2).
Частоты фамилий (см. разделы 3.2. и 7.2.) были сначала рассчитаны для каждого района. По совокупности «районных» частот рассчитаны невзвешенные частоты фамилий в регионе. По региональным частотам рассчитаны генетические расстояния между регионами. По этой матрице расстояний построен график многомерного шкалирования.
КТО НА КОГО ПОХОЖ?
Степень сходства пяти основных регионов друг с другом показана на рис. 7.6.1.
Рис. 7.6.1. Сходство и различия пяти основных регионов по всем «коренным» фамилиям (14 428 фамилий).
Диаграмма многомерного шкалирования построена по обобщённым генетическим расстояниям [Nei, 1975].
СЕВЕРНЫЙ РЕГИОН (среднее расстояние от остальных регионов dN=1.1)[48] оказался наиболее своеобразным. Примечательно, что он удалён от всех регионов без исключения (1.0
ЮЖНЫЙ РЕГИОН (ds=1.0) занимает второе место по своеобразию фамилий. Он также расположен на периферии «фамильного пространства» (рис. 7.6.7.). «Южные» фамилии ближе всех к «западным», но расстояние и между ними немалое (dS-W=0.7).
ВОСТОЧНЫЙ РЕГИОН (dE=0.9) оказывается на третьем месте по своеобразию фамилий. Он максимально удалён от обоих «полярных регионов» (в среднем dE-POLE=1.3). Но при этом близок к другим двум регионам среднерусской полосы (в среднем dE-MIDDLE ZONE=0.5). Из этих двух регионов он особенно близок к соседнему Центральному региону (dE-C=0.3). Так что в пределах среднерусской полосы Восточный регион не обнаруживает рассогласования с географическими расстояниями, а напротив, строго следует им. Видимо, здесь география и история были согласны друг с другом.
ЗАПАДНЫЙ РЕГИОН (dw=0.7) регион оказывается равноудален от Южного (dW-C=0.7) и Восточного (dW-E=0.8) регионов, и близок к Центральному (dW-C=0.3).
ЦЕНТРАЛЬНЫЙ РЕГИОН (dc=0.7) занял действительно центральное место в русском генофонде. Он почти в равной степени удалён от «полярных регионов» (dC-N=1.1; (dC-S=0.9) и одинаково близок к регионам средней полосы (dC-W=0.3; dC-W=0.3). Однако, хотя кажется, что здесь географические и генетические расстояния полностью ладят друг с другом, но история вмешивается и здесь. Генетические расстояния до регионов средней полосы оказались в три-четыре раза меньше, чем до «полярных». А разница в географических расстояниях невелика — лишь в полтора раза (Центр/3апад=400 км, Центр/Востоk=450 км, Центр/ Юr=600 км, Центр/Север=700 км). Таким образом, по частотам фамилий Центральный регион куда более удалён от полярных регионов, чем ожидалось из географии.
ПОДВЕДЁМ ИТОГИ
Итак, генетические расстояния, рассчитанные по всему фонду фамилий (14 тыс. фамилий), выделя-ют среднюю полосу европейской России (Западный,
Центральный, Восточный регионы) как наиболее полно воспроизводящую средние характеристики русского генофонда. «Полярные» Южный и Северный регионы демонстрируют выраженное своеобразие состава фамилий. При этом Восточный регион резко отличен от «полярных» регионов; Южный тяготеет к Западному; а Северный регион занимает совершенно особое место. График на рис. 7.6.1. иллюстрирует эти взаимоотношения регионов.
Не правда ли, знакомая картина? Мы её видели и тогда, когда рассматривали самые частые фамилии — «топ-20» (раздел 7.J.); и тогда, когда создавали «фамильные портреты» регионов по «топ-50» (раздел 7.4.). Такое взаимное подтверждение трёх независимых видов анализа — по частым фамилиям «топ-20», по «осмысленным» классам «топ-50» и по частотам всего массива «коренных» фамилий — радует, а уверенность в том, что мы на верном пути, растёт.
Из этого следуют и методические выводы.
Во-первых, это значит, что наше выделение классов фамилий (календарные, профессиональные, «звериные», «приметные») работает неплохо.
Во-вторых, если даже анализ «топ-50», то есть только полусотни самых частых фамилий (и отсев всех остальных фамилий), сохраняет основные тенденции, то значит и наш отсев лишь самых редких «пришлых» фамилий вряд ли эти тенденции исказил.
Но тогда возникает здравый вопрос. Может быть, и нет необходимости анализировать всю громаду всех фамилий, а заниматься только частыми? К сожалению, это не так. Прежде всего, не изучив все фамилии, не определишь, какие из них частые. Но главное, мы никогда не знаем, где та граница, после которой начинаются искажения тенденций. Ведь для разных регионов число «репрезентативных фамилий» может оказаться различным в зависимости от структурированности генофонда. Кроме того, разные группы фамилий — общие, частые, уникальные — могут описывать особые закономерности, не свойственные генофонду в целом, и сообщить много любопытных сведений об истории сложения генофонда.
Итак, мы определили взаимное положение пяти основных регионов по данным о фамилиях. Но можно ли утверждать, что таково взаимное положение не только «фамильных портретов» регионов, а самих генофондов? Можно ли считать, что, изучая фамилии, мы видим генофонд? Чтобы ответить на этот вопрос, надо привлечь свидетельства ещё одного очевидца — данные самой генетики. Те же самые популяции, которые мы изучили по фамилиям, уже генотипированы нами по одной системе генетических маркёров — по маркёрам Y хромосомы. Причём именно эти маркёры наиболее интересны для сравнения с фамилиями: и те, и другие передаются по мужской линии. Так что совместное изучение русских фамилий и Y хромосомы полезно им обоим.
Как известно, Y хромосома передаётся от отца к сыну, так же как и фамилия у народов с патронимической традицией. Однако связь между фамилией и гаплотипом Y хромосомы далека от абсолютной — она нарушается как «мутацией» фамилии (изменения в написании, возникновения у потомков новой фамилии), так и в случаях внебрачных детей и усыновлений, или же при передаче фамилии от матери [Sykes, Irven, 2000; Jobling, 2001]. Кроме того, в отличие от гаплотипов, фамилии возникли исторически совсем «недавно» — считается, что самые древние фамилии возникли в Китае около 5000 лет назад [Jobling, 2001]. Однако основная масса современных фамилий народов мира возникла в пределах последней тысячи лет. В результате одинаковые гаплотипы встречаются у людей с разными фамилиями, и наоборот — у людей с одинаковой фамилией встречаются разные неродственные гаплотипы.
Можно выделить два основных направления, в которых ведутся работы в данной области.
РАЗНООБРАЗИЕ Y ХРОМОСОМЫ У ОДНОФАМИЛЬЦЕВ
Это направление рассматривает связь конкретной фамилии и конкретной Y хромосомы. В рамках этого направления в настоящий момент проводится большая часть работ по изучению связи фамилии и генотипа: фамилия выступает как квазигенетический маркёр конкретной Y хромосомы.
В 2000 году Sykes и Irven исследовали гаплотипы Y хромосомы носителей фамилии первого из авторов [Sykes, Irven, 2000]. Авторы ожидали, что фамилия Sykes возникала многократно, поскольку происходит от диалектного Йоркширского «ручей», «канава». К своему удивлению, они обнаружили, что у 43,8 % исследованных однофамильцев — один и тот же гаплотип Y хромосомы, причём следующий по частоте гаплотип встречается в 4 раза реже. Это позволило авторам оценить время жизни основателя гаплотипа и, что важнее для других исследователей — долю «не-отцовства» (от англ. non-paternity — частоты получения фамилии не от биологического отца, а точнее — Y хромосомы не от формального отца). Доля «не-отцовства» составила 1,3 % за поколение. Оценки этой же величины у других авторов колеблются в основном от 2 до 5 % [MacIntyre, Sooman, 1991].
Довольно смелые выводы делает другой автор [King et al., 2006]. С большим количеством оговорок и в предположении создания в будущем (но пока лишь «умозрительной») базы данных о соответствующих друг другу гаплотипах Y хромосомы и фамилиях, он предлагает ДНК тестирование для определения возможной фамилии преступника, «оставившего ДНК» на месте преступления. Автор предлагает использовать такой подход в качестве дополнительных (хотя и не веских самих по себе) улик и сужения круга подозреваемых. Для того чтобы предлагать такой метод, автор исследует корреляцию гаплотипов в парах однофамильцев в Англии и показывает, что эта корреляция наличествует, хотя и не очень высока. Он показывает на конкретных данных, что лица с редкими фамилиями чаще оказываются родственниками по отцовской линии, чем лица с частыми фамилиями.
Иногда мотивом для исследования однофамильцев является «проверка мифа» — попытка найти следы древнего героического предка у потомков фамилий, по легендам происходящих из его колена. Такова, например, работа Мооге с соавторами [Moore et al., 2006], в которой исследуются ирландцы — народ, видимо, начавший использовать фамилии раньше других современных европейских народов. Хотя работа в целом носит популяционный характер (сперва исследуются случайные выборки из разных частей Ирландии), в ней исследуются представители фамилий, по легендам происходящих от династии Uí Néill (буквально потомки Найала). Оказалось, что 52.5 % изученной выборки принадлежат одному гаплотипу, который произошёл около 1730 (±670) лет назад. Неизвестно, как звали человека, основавшего эту линию, но он имеет непосредственное отношение к происхождению потомков Найала. Потомки этого колена, видимо, обладали социально определяемой повышенной приспособленностью (способностью оставлять большее количество потомков), а именно — родовитостью (которая определяется фамилией), и их прирост в каждом поколении с 500 года н. э. составил -21 % за поколение.
В аналогичной по задачам работе, «когда мы понимаем мифы о населении буквально» [Jobling, 2001], авторы проверяли легенду о происхождении всего корейского народа от одного относительно недавнего легендарного предка по имени Tangoon и, как можно было ожидать, получили отрицательный результат.
К этому же разделу «пофамильных исследований» относятся и другие работы — например, McEvoy и Bradley [2006]. Авторы исследуют различия разнообразия гаплотипов у однофамильцев в зависимости от того, как часто фамилии «мутировали» — возникали новые фамилии из старых. В Ирландии одной из причин параллельного возникновения фамилий была англицизация ирландских фамилий. Например, фамилии Mac Fhíodhbhuidhe и Mac an Bheatha, которые не перепутал бы ни один ирландец, англичане записали одинаково — McEvoy, и у носителей этой фамилии чётко выделяется два основателя, время жизни которых отличается более чем на 500 лет.
Подводя итог этого направления исследований, можно сказать, что они показали, каков приток «в фамилию» генов из других фамилий (первая работа такого рода осуществлена в 1973 году [Genest, 1973], но основной ряд работ выполнен только в последние пять лет) и какова непосредственная связь между фамилией и гаплотипом Y хромосомы.
«Пофамильное» направление представляет большой интерес и для частных лиц, интересующихся своей родословной. Можно только порадоваться за знаменитого профессора Bryan Sykes и за Brian McEvoy, которые смогли совместить интереснейшую для науки работу с удовлетворением собственного любопытства по поводу происхождения своей фамилии.
ПОПУЛЯЦИОННАЯ СВЯЗЬ ФАМИЛИИ И ГЕНОТИПА
Это второе направление исследований, изучающих сопряженность фамилии и Y хромосомы. Оно нацелено на анализ генетических различий между популяциями, различающихся по происхождению фамилий.
Здесь фамилия выступает не как квазигенетический маркёр конкретной Y хромосомы, а как квазигенетический маркёр популяции. В этом случае оказывается не важно, насколько велика связь конкретной фамилии с конкретной Y хромосомой: фамилия как признак культуры становится в один ряд с другими квазигенетическими маркёрами или характеристиками популяции — лингвистическими, этнографическими и прочими. Также как, например, наличие определённого узора на традиционной одежде или же наличие сходных мотивов в мифах, так и сходство популяций по большому числу фамилий может указывать на возможную близость популяций. При популяционном подходе отдельные случаи «не-отцовства» не отражаются на популяционных частотах фамилий, поскольку эти случаи редки и в целом компенсируют друг друга.
Во всех работах подчёркивается, что огромным преимуществом фамилий по сравнению с другими квазигенетическими маркёрами является возможность тотального исследования населения.
В работе Zei и соавторов [Zei et al., 2003] исследуется население Сардинии. Выборка подразделяется по месту происхождения коренных сардинских фамилий, которое определяется по области Сардинии с максимальными частотами данной фамилии, а также по историческим источникам. Фамилии отнесены к трём историко-географическим зонам Сардинии. Показаны генетические различия между популяциями, фамилии которых принадлежат разным регионам.
В работе Immel и соавторов [Immel et al., 2006] две сравниваемые группы формируются из одной выборки — жителей г. Галле (Германия). Выборка разделена по происхождению фамилий обследуемых: у 195 мужчин фамилии немецкого (группа G); у 185 — фамилии славянского происхождения (группа S); у 39 человек фамилии смешанного происхождения (группа М). В качестве сравниваемых групп использовались данные о 29 сорбах (коренное славянское этническое меньшинство, проживающее на границе с Польшей) и о 1313 поляках из [Roewer et al., 2005]. Была показана генетическая близость группы (S) с поляками и сорбами и значительно большее генетическое расстояние от этих трёх групп до смешанной группы, включающей генетически не различающиеся выборки (G) и (М).
Наиболее любопытной нам кажется работа Bedoya с соавторами [Bedoya et al., 2006], поскольку она сочетает в себе подходы популяционных и «пофамильных» исследований. В работе привлекаются данные о динамике частот фамилий за несколько последних веков, чтобы определить характер изменения популяционной структуры в этот период. Работа посвящена горному изо-ляту в Колумбии, основным фактором популяционной динамики которого была иммиграция испанцев, действовавшая с той или иной интенсивностью после их первого появления на территории Колумбии. Сходство распределений фамилий в конце XVIII века и в наше время при возрастании с тех пор численности населения в 107 раз позволяет авторам утверждать, что, по крайней мере, с конца XVIII века основным фактором динамики популяций был её рост, а не иммиграция из Европы. Этот вывод чрезвычайно важен для интерпретации результатов молекулярно-генетического анализа, проводимого авторами, и уточнения времени формирования наблюдаемых особенностей популяционного генофонда.
Аналогичная работа была проведена ранее нами [Почешхова, 1998; Балановская и др., 1999; Балановская и др., 2000] по изучению фамилий древнейшего коренного населения Западного Кавказа — адыгейцев и шапсугов. В работе, охватывающей тотально всех шапсугов, прослежена динамика их фамилий (населявших ранее побережье Черного моря от Туапсе до Сочи) на протяжении шести поколений. Такое глубокое знание генеалогии позволило сделать шесть «временных срезов» фамильного состава популяций, то есть реконструировать генофонд населения на одно, два, три, четыре, пять и шесть поколений назад. В результате такой реконструкции показана высочайшая устойчивость популяции: благодаря сохранению брачных традиций, она сохранила популяционную структуру вопреки переселениям и катастрофическому сокращению численности популяции в результате Кавказской войны (середина XIX века). Удивительное сходство всех шести карт главных компонент фамилий, построенных по данным о шести поколениях, и даёт нам право говорить о преемственности генофонда во времени, о сохранении его структуры даже после такой демографической катастрофы, которую претерпели шапсуги. Это означает, что с помощью фамилий мы можем проникать вглубь поколений, реконструировать генофонды прошедших времен.
КОРРЕЛЯЦИЯ РУССКИХ ФАМИЛИЙ И ГАПЛОГРУПП Y ХРОМОСОМЫ
Рассмотрев вкратце, каковы мировые данные о связи фамилий и Y хромосомы, обратимся к изучению этой связи в русском генофонде.
Конечно, мы понимаем, что даже если мы проведём (как в случае наших русских регионов) полностью параллельный анализ одних и тех же популяций и по фамилиям, и по Y хромосоме, то всё равно полного совпадения результатов быть не может. Маркёры Y хромосомы — это «настоящие» гены, но у них есть свой изъян: по ним изучено много меньшее число популяций и человек. По Y хромосоме 1257 человек представляют 14 районов. По фамилиям изучен миллион человек из 50 районов. Разница существенная. Но у фамилий, к сожалению, есть свой и куда более важный недостаток — они только «квазигены», столь переменчивые и столь юные по сравнению с настоящими генами.
Поэтому нельзя ожидать полного сходства. Но есть ли оно вообще?
Те, кто заглядывал в 6 главу, уже знают, что сходство налицо. Напомним, что на карте главного сценария всех гаплогрупп Y хромосомы, мы видели чётко выраженный широтный градиент (рис. 6.3.11.). Это означает, что, двигаясь с севера на юг, мы обнаруживаем намного большие различия между русскими популяциями, чем двигаясь с запада на восток. Мы видим на этой «главной» карте Y хромосомы и резкие различия Северного и Южного регионов, и сходство регионов средней полосы. Это значит, что по маркёрам Y хромосомы в главе 6 мы видели ту же картину структуры русского генофонда, которую только что прогнозировали по фамилиям. Гены и фамилии в этой общей картине русского генофонда согласны друг с другом.
Но можно возразить, что это сходство отражает лишь самые общие черты генофонда, и получено оно с помощью качественных, а не количественных сравнений. Хотя мы считаем, что совпадение общих черт генофонда намного важнее количественного анализа, но проведём и его. Причём максимально строго. Выше мы рассчитали матрицу неевских генетических расстояний между пятью русскими регионами по данным о фамилиях. Проведём полностью аналогичный расчёт расстояний и для маркёров Y хромосомы. И построим матрицу тех же неевских генетических расстояний между теми же пятью основными регионами, но теперь уже по данным об изменчивости Y хромосомы.
Чтобы анализ был полностью количественным, мы будем сравнивать друг с другом не диаграммы многомерного шкалирования, являющиеся «картинками», иллюстрациями этих расстояний, а сами матрицы расстояний.
Коэффициент связи оценивает, насколько фамилии и гены дают похожие оценки близости между регионами, то есть оценки структуры русского генофонда. Если сходство велико, то коэффициент корреляции будет большим (при полной идентичности равен 1). Если сходства нет, то коэффициент корреляции будет равен 0.
Оказалось, что коэффициент корреляции между матрицей расстояний по фамилиям и матрицей расстояний по генам очень высок и достигает 0.6.
Напомним, что при введении фамилий в популяционно-генетические исследования, был проведён аналогичный анализ связи между распределением фамилий и классических маркёров. Этот анализ был проведён А. А. Ревазовым для северных русских популяций. Коэффициент корреляции оказался равным r=0.32 [Ревазов и др., 1986]. Этого уровня связи оказалось достаточным, чтобы фамилиям присвоить почетное звание «квазигенетических маркёров» и рекомендовать использовать фамилии, как аналоги генов при изучении генофондов [Ревазов и др., 1986].
Итак, корреляция между настоящими генами и фамилиями оказалась очень велика — 0.6. Это означает сходство между структурой русского генофонда, выявляемой через фамилии и через «настоящие» гены. Оба очевидца — фамилии и генетика — дают сходные показания. Такое прямое сравнение фамилий с генетикой ещё раз показывает, какими парадоксально надежными маркёрами являются фамилии.
Рассмотренные нами «простые» карты отдельных фамилий отмечают отдельные события. Чтобы увидеть цепь этих событий, сплетающихся в единую историю русского генофонда, надо «сплавить» воедино изменчивость множества популяций и фамилий. Такое обобщение могут дать синтетические карты, созданные на основе множества карт отдельных фамилий. Для этой цели, как и по всем другим признакам — антропологии и генетики (главы 4, 5, 6) — мы провели анализ главных компонент. Геногеографические карты главных компонент являются картами новых обобщённых признаков. Они описывают основную часть разнообразия всех фамилий и выявляют основные «сценарии» их изменчивости.
Однако специально проведённые разные виды анализа показали, что в составе 75 фамилий Атласа в большей степени представлены фамилии Западного и Центрального регионов и в целом — регионов среднерусской полосы, а Южный и Северный регионы отодвинуты на задний план. Это, конечно же, снижает возможности картографического Атласа фамилий в реконструкции структуры всего русского генофонда — его ландшафт мы видим с точки зрения Запада и Центра.
Поэтому из-за ограниченности объёма книги мы не приводим карты главных компонент (они будут приведены на сайте). Когда же мы соберём данные, настолько полно покрывающие «исконный» ареал русского народа, что мы сможем отказаться от заданного нам списка 75 фамилий и перейти к анализу сотен и тысяч фамилий, тогда будет проведён картографический анализ «фамильного генофонда», где смещение в сторону любого из регионов будет исключено.
Здесь укажем лишь, что в целом оба главных сценария фамильного ландшафта выделяют, прежде всего, среднерусскую полосу — она служит основным структурообразующим элементом обеих карт. Обе карты главных компонент имеют ещё две общие черты: постепенное изменение значений к югу ареала, и выраженное своеобразие северных русских популяций.
Таблица 7.6.1.
Коэффициенты корреляции между главными компонентами изменчивости фамилий и других признаков — соматологии, дерматоглифики, классических и ДНК маркёров
Подчеркнём, что этот результат, полученный при картографическом анализе 100 популяций (по 75 фамилиям), подтверждает результат, полученный статистическими методами при анализе 5 регионов (но по всему фонду фамилий — более 14 тыс.).
Сравним также показания фамилий и других очевидцев структуры генофонда. Такой «мультиокулярный» подход позволяет оценить, насколько карты «главных сценариев» по фамилиям сходны с теми, что обнаружила антропология и генетика.
КОРРЕЛЯЦИИ МЕЖДУ «ГЛАВНЫМИ СЦЕНАРИЯМИ» ВСЕХ ПРИЗНАКОВ
В нашем случае мы имеем редкую возможность сравнить показания фамилий с показаниями ещё четырёх свидетелей — соматологии, дерматоглифики, классических и ДНК маркёров. Корреляции между картами всех трёх главных компонент фамилий и остальных четырёх очевидцев приведены в таблице 7.6.1.
Мы видим, что карта первой главной компоненты изменчивости фамилий (1PCF) обнаруживает хорошее сходство с картой первой компоненты по признакам антропологии — коэффициент корреляции выше 0.6 (р=0.66). Несколько слабее связь с классическими маркёрами (р=0.44). Невысокая связь наблюдается с главным сценарием Y хромосомы (р=0.29). Однако с ландшафтом третьей компоненты Y хромосомы связь выражена чётко (р=0.49).
Зато вторая компонента по фамилиям (2PCF) высоко коррелирует с обеими вторыми компонентами маркёров генетики: и по ДНК маркёрам Y хромосомы (р=0.63), и по классическим маркёрам (р=0.65) коэффициенты связи выше отметки 0.6. Также явно выражена (р=0.47) и связь карты второй компоненты изменчивости фамилий (2РСр) со второй компонентой признаков антропологии (2РСд). Важно подчеркнуть, что фамильный ландшафт второй компоненты (2PCF) обнаруживает ровный ряд корреляций с первыми компонентами всех четырёх типов признаков (связь с 2РСА, 1PCD, 1PCG, 1PCY лежит в интервале 0.23<р<0.40), указывая на связь с широтно бегущими волнами русского генофонда.
В целом мы видим, что фамильный ландшафт обнаруживает связь то с одним, то с другим из иных типов признаков. Можно надеяться, что когда у нас появится возможность включить в Атлас фамилий карты не 75, а сотен и тысяч русских фамилий, то эти распавшиеся куски единой картины воссоединятся.
СРАВНЕНИЕ КАРТ «ГЛАВНЫХ СЦЕНАРИЕВ» ВСЕХ ПРИЗНАКОВ
Напомним читателю, что корреляции, которые мы только что рассмотрели, рассчитывались вовсе не по всему «исконному» русскому ареалу, представленному на картах «главных сценариев» фамилий. К сожалению, для расчёта корреляций по всем пяти типам признаков надо использовать средний по всем признакам «надёжный» ареал, а его размер и контуры задаются теми признаками, которые наименее подробно изучены. Поэтому и «надёжный» ареал карты, по которому рассчитывались корреляции, сократился, как шагреневая кожа, до ареала наименее изученных классических маркёров (глава 5).
По этой причине, может быть, важнее сравнить сами образы карт, которые позволяют составить более полное представление о сходстве и различиях «главных сценариев», чем скупые цифры корреляций. Такое сравнение обобщённых карт показывает, что первые компоненты всех четырёх типов признаков антропологии и генетики характеризуются одним и тем же — широтным — направлением изменчивости. Все четыре ландшафта различаются лишь двумя элементами: 1) положением южных «возвышенностей»; 2) степенью выраженности северного «поморского» ядра, которое фамилии выявляют особенно ярко.
К этой серии карт в определённой степени близки оба фамильных ландшафта — первой и второй главных компонент изменчивости фамилий. Они как бы поделили единый ландшафт на две карты: карта первой компоненты «прозападная», а второй компоненты — «провосточная». Но обе компоненты изменчивости фамилий вместе образуют «нагорье» в области среднерусских регионов и широкие «долины» на юге и на севере. Такое деление ландшафта на две части может быть связано с несовершенством набора 75 фамилий. Возможно, что фамилии, кроме общих трендов, могут выявлять и иные закономерности, к которым менее чувствительны признаки антропологии и генетики (подобное явление для признаков дерматоглифики в Восточной Европе будет рассмотрено в следующей главе).
Итак, мы рассмотрели основные ландшафты в географии русских фамилий — карты главных компонент. Однако в геногеографии есть и другие типы обобщённых карт, которые позволяют выявить особые аспекты структуры генофонда. И среди них — карты случайного инбридинга (подразделённости популяций, степень изолированности — и, следовательно, инбредности локальных подразделений). Эти карты показывают нам структуру генофонда с новой стороны. Мы можем увидеть, какова степень подразделённости популяций в разных частях «исконного» русского ареала. Одновременно эта карта позволяет оценить вероятный груз наследственной патологии. Актуальность карт прогноза распространённости наследственных заболеваний, как и социальное значение такого прогноза, не требуют доказательств.
ЧТО ТАКОЕ СЛУЧАЙНЫЙ ИНБРИДИНГ?
Карта случайного инбридинга является частным случаем карт разнообразия. Она показывает, как в разных частях ареала меняется уровень случайного инбридинга. Инбридинг, и в особенности его случайная составляющая — это одно из центральных понятий в популяционной генетике, у него много разных сторон (см. Приложение). Сейчас для нас важно, что этот показатель измеряет степень подразделённости популяции. Он как бы показывает степень изолированности популяций на тех или иных территориях. Одновременно он показывает уровень изогаметации — вероятность увеличения доли гомозиготности (и, соответственно, уменьшения гетерозиготности) за счёт эффекта подразделённости популяции. Эта вероятность означает переход рецессивных генов в гомозиготное состояние и потому имеет решающее значение в формировании груза наследственной патологии — только встречаясь в гомозиготе, эти гены проявляют себя в виде тяжелейших наследственных болезней. Поэтому именно от уровня случайного инбридинга и зависит, много ли в популяции будет больных наследственной патологией. Случайный инбридинг можно рассчитать разными методами. Расчёт по данным о частотах фамилий является одним из наиболее распространённых и надёжных методов.
Мы не будем подробно здесь излагать анализ инбридинга по фамилиям — он описан во множестве специальных публикаций в генетической литературе, и мы также посвятили разработке его методологии специальную работу [Балановская и др., 2000]. Инбридинг рассчитывается при анализе всей совокупности частот фамилий методом изонимии — через вероятность заключения браков между носителями одинаковых фамилий. Для одной фамилии (i), встреченной с частотой р4, коэффициент изонимии составит fr=(рi2)/4. Но для популяции инбридинг оценивается по всем фамилиям сразу fr=∑(рi2)/4. Если популяция подразделенная и насчитывает несколько уровней иерархии, то для оценки fr на каждом более высоком уровне (например, региона) из её оценки надо вычесть инбридинг нижестоящих уровней (например, области, района, локальной популяции).
Укажем лишь, что использование фамилий — наряду с прогнозом по классическим и молекулярным генным маркёрам — является в медицинской генетике испытанным методом прогнозирования инбридинга и связанного с ним груза наследственных болезней. Целым рядом работ двух школ — акад. РАМН Е. К. Гинтера и проф. Ю. Г. Рычкова — показано, что этот широко используемый в мировой практике метод и в населении России даёт хорошее согласие с оценками инбридинга, полученными прямым путем (см. Приложение). В частности, была составлена уникальная сводка данных по распространению наследственной патологии в населении Архангельской, Костромской, Кировской, Ростовской, Тверской областей, Краснодарского края и ряда других регионов Урала, Кавказа и Средней Азии. Анализ этих данных, собранных в ходе многолетних исследований отечественной школы медицинской генетики (возглавляемой акад. РАМН Е. К. Гинтером), сопровождался сбором демографической информации о миграциях и данных о распространении фамилий. Результаты сравнительного анализа таких данных (подробно изложенные, например, в монографии «Наследственные болезни в популяциях человека», 2002), убедительно свидетельствуют о хорошем согласии между прогнозом инбридинга по данным о фамилиях и реально наблюдаемым грузом наследственной патологии.
ОЦЕНКИ ИНБРИДИНГА ДЛЯ РУССКОГО ГЕНОФОНДА
Для оценок инбридинга мы использовали только информацию о популяциях пяти основных регионов «исконного» русского ареала (Восточный, Центральный, Западный, Северный, Южный). Коэффициент случайного инбридинга был рассчитан нами для каждой популяции на каждом уровне популяционной иерархии: 1) для 883 локальных популяций (fPOP); 2) для 50 районов (fDIS); 3) для 5 регионов (fREG); 4) для русского народа в целом (fETN). Коэффициент инбридинга fr·102, полученный по данным обо всех встреченных фамилиях в пределах русского народа, составил fPOP-ETN=0.71. Выявлено, что уровень инбридинга fr значительно варьирует среди популяций каждого уровня. Различия в уровне инбридинга отдельных районов достигают размаха двух порядков величины: 0.01
Карты инбридинга построены для каждого уровня популяционной системы русского генофонда — локальных популяций, районов, регионов. Их анализ, как и анализ большой совокупности статистических показателей, являются предметом специального анализа прогнозируемого груза наследственной патологии русского генофонда, что выходит далеко за пределы данной книги. Поэтому приведём лишь одну, но наиболее надёжную карту (рис. 7.6.2.) — инбридинга на уровне районов fDIS.
Карта выявляет очень ярко и чётко выраженную закономерность — неуклонное возрастание с юго-запада на восток прогнозируемого уровня случайного инбридинга и, соответственно, груза наследственной патологии. Эта карта (в совокупности с картами других показателей инбридинга fPOP, fPOP-DIS, fDIS-REG, fPOP-REG) позволяет прогнозировать в пределах «исконного» русского ареала отягощённость русского генофонда наследственной патологией. Таким образом, данные о парадоксально надёжном маркёре — русских фамилиях — служат не только изучению истории русского генофонда, но и прогнозу груза наследственных болезней.
Рис. 7.6.2. Карта прогноза груза наследственной патологии русского генофонда.
По данным об изменчивости фамилий в 50 районах «исконного» русского ареала дана оценка случайного инбридинга (fDIS·100).
Главой о русских фамилиях мы завершаем наше описание русского генофонда. В трёх предыдущих главах этой части книги мы анализировали данные антропологии, классические генетические и ДНК маркёры, и, наконец, в этой главе рассмотрели фамилии. Этот тип данных самый своеобразный, и его применение к изучению генофонда меньше всего разработано. Поэтому «фамильная» глава ещё больше, чем все предшествующие главы, похожа на самостоятельную книгу: в ней описываются общие принципы и подходы такого исследования, его методология, методы, история аналогичных исследований, большое внимание уделено материалам. И, разумеется, подробно описаны результаты — а их много. И получены эти результаты разными методами, несколько из которых разработаны впервые. Не удивительно, что глава о фамилиях получилась столь объемной, что её нелегко прочесть за один присест.
Авторы особенно беспокоятся за ясность для читателя самой структуры исследования. Ведь применены разные методы, которые нередко давали одинаковые результаты. Не вызовет ли это путаницы, не покажутся ли разные методы повтором одного и того же из-за сходства результатов? И наоборот, не будут ли одни и те же положения выглядеть разными оттого, что к ним мы возвращаемся в разных местах главы? Структуру исследования мы постарались чётко прописать в названиях разделов — обоснование подходов и методов (7.7.), описание материалов (7.2.), общий обзор фамилий (7.3.), сравнение регионов по спектру фамилий (7.4.), карты отдельных фамилий (7.5.), обобщённый анализ по всем фамилиям (7.6.). Но достаточно ли этого, чтобы поделиться с читателем той чёткостью и логикой исследования, а вместе и важнейшими результатами, которые сами авторы видят столь ясно?
Чтобы приблизиться к этому, повторим некоторые положения и итоги этой главы. Это не заключение в строгом смысле — читатель не найдет здесь таких обобщений или новых мыслей, которые отсутствовали бы в предшествующих разделах. Это скорее очень краткое повторение отдельных фрагментов, которые выделяют главные линии исследования.
Итак, что мы изучили и что это даёт?
ФАМИЛИИ — ГЕНЫ
Фамилии — привычный инструмент для популяционной генетики. Как зарубежные, так и отечественные генетики охотно использовали их для изучения структуры генофонда, в том числе для прогноза инбридинга. Недавно интерес к фамилиям усилился — благодаря сопряженности фамилий и Y хромосомы, которые должны наследоваться параллельно по отцовской линии и, действительно, нередко ведут себя согласованно. Фамилии широко изучались и у нас в стране. Научная школа Ю. Г. Рычкова преимущественно сравнивала дифференциацию генофонда, рассчитанную по фамилиям и по генам, и всегда обнаруживала совпадения. А научная школа Е. К. Гинтера применяла фамилии чаще всего для оценки инбридинга, и в том числе А. А. Ревазову мы обязаны термином «квазигенетические» маркёры — фамилии как «почти гены». Если считать, что фамилия наследуется от отца к сыну и далее в поколениях (что в большинстве случаев совершенно справедливо!), и если знать частоты фамилий в популяциях (а собрать такие сведения вполне реально), то частоты фамилий можно рассматривать как частоты аллелей, и применить к фамилиям все обычные методы популяционной генетики.
МАТЕРИАЛЫ
Именно таким образом было изучено много народов, в том числе и русские популяции. Наше исследование продолжает ту же традицию, но — если позволено так сказать — на огромном материале, организованном по-новому и проанализированном целым арсеналом новых методов. Мы теперь знаем о русских фамилиях столько, сколько раньше и не надеялись узнать. Материал представляет собой частоты фамилий, которые основываются на тотально изученном населении (практически каждый житель!) пяти основных регионов.
Для хранения и обработки этого огромного массива данных разработана специальная база данных о русских фамилиях, программа «ONOMA» и ряд других программ. А в сборе информации о фамилиях авторам по их просьбе помогали их коллеги Н. Н. Аболмасов, И. В. Евсеева, М. Б. Лавряшина, Э. А. Почешхо-ва, И. Н. Сорокина, М. И. Чурносов и многие другие.
Преувеличивая, можно было бы сказать, что учтена фамилия каждого русского человека — если бы не два ограничения. Во-первых, мы изучаем коренное население — это общий принцип изучения генофонда. Применительно к фамилиям это значит, что изучаем только сельское население и только в пределах «исконного» русского ареала. Центральная Россия и Русский Север изучаются, а Урал, Сибирь, Аляска и прочие «не исконные» русские территории — нет. Второе ограничение в том, что даже «исконный» ареал мы пока не изучили полностью, а выбрали семь областей из двух десятков областей исторического ареала. Эти семь областей группируются в пять регионов: Северный (Архангельская область), Восточный (Костромская область), Центральный (Кашинский район Тверской области), Западный (Смоленская область) и Южный (Белгородская, Курская и Воронежская области). В областях, как правило, изучено по несколько районов, а эти районы уже изучены тотально — собраны данные обо всём сельском населении этих районов. В дополнение к этим пяти основным регионам мы изучили три «окраинных» региона — Северо-Западный (Псковская область), кубанские казаки (Адыгея) и «Сибирь», представленную Кемеровской областью.
Эти два ограничения делают наше исследование не «тотальным» (чтобы так сказать, нужно изучить фамилии каждого из 116 миллионов русских), а субтоталь-ным — изучен «всего лишь» один миллион человек. Но этот миллион дорогого стоит — он представляет сельское население географически отдалённых друг от друга в среднем на 1000 км важнейших регионов «исконного» исторического ареала русского народа. Поэтому мы считаем, что эти данные весьма хорошо представляют русский генофонд.
Для выявления основных, базовых закономерностей русских фамилий этих данных оказалось достаточно. Но по мере углубления в специальные вопросы, особенно в географию фамилий и в подробное изучение географической структуры генофонда, растёт нужда в пополнении исходной информации — необходимо собрать данные о частотах фамилий в остальных областях «исконного» русского ареала, а возможно, и за его пределами. Авторы надеются, что эти данные будут со временем собраны, а пока предлагают ознакомиться с общими, базовыми результатами, извлечёнными из уже собранного огромного массива материалов.
БАЗОВЫЕ РЕЗУЛЬТАТЫ
1) Составлен список всех встретившихся фамилий, которых оказалось 67 тысяч. По мере сбора новых данных этот список будет расти, но уже сейчас, изучив восемь контрастных регионов, мы знаем основное разнообразие русских фамилий.
2) Бросается в глаза, насколько эти фамилии различаются по частоте. Одни настолько часты, что в среднем каждый сотый житель русского ареала — Кузнецов, каждый семьдесят пятый — Иванов, а почти каждый пятидесятый — Смирнов. Другие фамилии столь редки, что в том районе, где обнаружена фамилия, а порой и во всём русском ареале есть лишь считанные её носители.
3) Для многих фамилий мы построили карты их распространения. На картах видно, что почти каждой русской фамилии свойственно иметь свою географическую зону распространения, а не покрывать причудливой мозаикой русский ареал. Например, Петровы чаще всего встречаются на севере и западе, а для прочих территорий эта фамилия редкая. Такие зоны распространения могут быть удивительно компактны, а могут занимать обширные области. Для многих фамилий зоны очерчены чётко. Но для некоторых зоны прерывистые, неясные, и встречены даже фамилии распространённые то здесь, то там без всякой видимой закономерности. Правда, как раз они являются исключением, подтверждающим общее обнаруженное правило: русским фамилиям свойственно иметь определённые зоны распространения.
4) И спектр встреченных фамилий, и их частоты различаются от региона к региону. Оказалось, что все регионы средней полосы (Западный, Центральный и Восточный) похожи друг на друга. Южный регион заметно от них отличается. Но особенно своеобразен Северный регион. А вот Сибирский регион, хотя географически он самый отдалённый, по частотам фамилий очень близок к регионам средней полосы. Более того, Сибирский регион ближе всех к усреднённым русским показателям. Этот парадокс объясняется просто — Сибирь не является частью «исконного» ареала, её население — это переселенцы из «исконного» ареала, причём из самых разных его частей. Именно «плавильный котел», в котором смешались выходцы из самых разных частей «исконного» ареала, и произвёл «среднерусский» сплав: присутствие в Сибири самых разных фамилий с частотами, близкими к среднерусским частотам этих фамилий.
5) «Осмысленные классы» создают «осмысленный» портрет региона. Результаты сравнения регионов по частотам фамилий совпали с независимым сравнением регионов по семантическим классам фамилий.
«ОСМЫСЛЕННАЯ» КЛАССИФИКАЦИЯ ФАМИЛИЙ
Классифицирование фамилий — совсем новый подход в генетике. Обычно популяционно-генетические работы рассматривают все фамилии как равноправные признаки, неразличимые, одинаковые, безликие. И мы, сравнивая регионы по частотам фамилий, поступили точно так же. Такой статистический подход позволяет рассчитать все показатели, которые мы рассчитываем по генам. Но мы предложили дополнить его иным, новым подходом, который назвали семантическим.
Его суть очень проста: надо вглядеться в лицо каждой фамилии, и отнести её к одному из классов. Например, при статистическом подходе фамилии Иванов, Петров, Никитин, Волков, Зайцев и Курочкин для нас совершенно равноправны. А при семантическом подходе Ивановых, Петровых и Никитиных мы отнесем к фамилиям, производным от имён, а Волковых, Зайцевых и Курочкиных — к фамилиям, образованным от зверей. И будем анализировать их раздельно.
Важным показателем тогда станет соотношение разных классов в спектре фамилий. В нашем примере оказалось три фамилии от имён и три «от зверей». Но в другой популяции это соотношение может быть инное. Например, на северо-западе почти все фамилии окажутся производными от имён. Это означает, что мы получаем в руки совершенно новую характеристику популяций, обогащаем свои знания и открываем новый метод. Такой семантический подход не имеет аналогий в анализе генов. Это характерная черта, особое богатство, свойственное анализу фамилий, благодаря тому, что они расцвечены красками языка и несут смысловую нагрузку.
СЕМАНТИЧЕСКИЕ КЛАССЫ
Фамилию можно отнести к одному из пяти классов.
1. «Календарные» — образованные от имён церковного календаря (например, Иванов, Феофанов).
2. «Профессиональные» — от названий профессий (Кузнецов, Колесников).
3. «Звериные» — от слов, описывающих животный и растительный мир (Волков, Жуков, Дубов, Листьев).
4. «Приметные» — от примет внешнего или психологического облика (Румянцев, Быстров).
5. Фамилии, которые нельзя отнести ни к одному из этих классов (Морозов, Булыгин) выделяются в пятый класс «иные».
Распределить фамилии даже по таким примитивным классам непросто. Не зная устаревших, диалектных или просто редких слов («бондарь» — делающий бочки, «саук» — Савва, «третьяк» — третий ребенок в семье) можно неправильно классифицировать Бондаренко, Саукова, Третьякова. А для многих фамилий этимология неоднозначна, запутанна и спорна. Так что классифицировать фамилии должен бы специалист по русской ономастике, но из-за неудач в поисках такового авторы решились классифицировать пока сами.
Результаты, как часто бывает с анализом фамилий, превзошли ожидания.
ФАМИЛЬНЫЕ ПРОФИЛИ РЕГИОНОВ
Рассмотрев пятьдесят фамилий, самых частых в Центральном регионе «топ-50», мы обнаружили, что из них 25 — «звериные». То есть 50 % фамилий приходится именно на один этот класс. В Западном регионе на один класс приходится ещё больше — 60 % фамилий, но этот лидирующий класс включил вовсе не «звериные», а календарные фамилии. На Северо-Западе календарные фамилии совсем вытесняют остальные — там их 82 %. А в Восточном регионе календарных только 14 %, но зато как нигде часты приметные фамилии, которые делят первое место со «звериными» фамилиями. Так получилось, что каждый из остальных двух классов фамилий тоже имеет «свой» регион: профессиональные фамилии лидируют на юге (там их 34 %), а «иные» — на севере (тоже 34 %).
Так что мнение о том, что самые русские фамилии — это Иванов, Петров и Сидоров (то есть календарные), справедливо только в западной части «исконного» ареала, и совсем неверно для востока и центра. Создаётся впечатление, что регионы различаются по способам образования фамилий — на юге чаще всего от профессий, в центре — «от зверей» и так далее. И каждый регион имеет свой характерный «фамильный профиль» — сколько фамилий приходится на долю каждого класса.
Это не просто любопытное открытие, но и инструмент изучения генофонда. Посмотрим, например, на кубанских казаков. Их предки пришли из России и Украины, но откуда именно из России? Это вопрос о генофонде, и семантические классы фамилий могут дать предварительный ответ. Профиль фамилий кубанских казаков таков:
Календарные — 34%
Профессиональные — 22%
Звериные — 16%
Приметные — 14%
Иные — 14 %.
Этот профиль больше всего похож на профиль соседнего с казаками Южного региона. Но фамилии показывают, что предки казаков переселялись не только оттуда. Отличия «казачьего» профиля от «южного» свидетельствуют, во-первых, о значительном потоке фамилий из среднерусских регионов, и, во-вторых, о последующей самостоятельной жизни казачьей популяции и о возникновении собственных неповторимых фамилий. Конечно, не стоит думать, что беглый анализ всего лишь по пяти классам фамилий явится откровением о происхождении кубанских казаков. Но это иллюстрация тех реальных возможностей, которые даёт семантический анализ фамилий.
Ещё пример: как мы помним, статистический анализ показал, что фамильный фонд Сибири близок к среднерусскому — вероятно, по причине миграций из разных русских регионов. Семантический анализ добавляет, что особенно мощными могли быть миграции из самого географически отдалённого региона — с Запада: именно с «западным» профилем особенно схож «сибирский».
ПЕРЕЧИСЛИМ МЕТОДЫ
Для анализа фамилий мы применили не один-два, а веер практически независимых методов. Упорядочим их.
1) «ТОПЫ»: АНАЛИЗ САМЫХ ЧАСТЫХ ФАМИЛИЙ. В самых разных видах анализа нужно «перебрать» все фамилии — то сравнить их, то классифицировать, а сделать это вручную для многотысячных списков невозможно. Поэтому мы часто брали в анализ лишь несколько самых частых фамилий. Например, только что описанный анализ семантических классов выполнен по «топ-50»: в каждом регионе взяты 50 фамилий, самых частых в этом регионе, и только они классифицированы по семантике. Кроме «топ-50», использованы «топ-20», и даже «топ-10» и «топ-5» (только 5 самых частых фамилий). Несколько проверок показали что результаты, полученные по топ-50 и топ-20, обычно хорошо согласуются с анализом всего массива фамилий. Это значит, что использование только «топов» для многих видов анализа правомочно… Хотя, конечно, никогда заранее неизвестно, насколько большим должен быть «топ» чтобы дать правильный результат.
2) ПОИСК «ВСЕОБЩИХ» ФАМИЛИЙ. Раз мы имеем полные списки фамилий, встреченных в каждом регионе, мы можем посмотреть, насколько они перекрываются. Точнее: есть ли такие фамилии, которые встречаются в каждом регионе, существуют ли общерусские, повсеместные, «всеобщие» фамилии? При сравнении пяти регионов нашлось 257 таких фамилий. И есть основания думать, что после изучения других регионов этот список не сильно изменится — к нашему изумлению, при включении в анализ Сибирского региона этот список сократился только на 7 фамилий — а 250 фамилий (мы их привели в табл. 7.3.4.) оказались общими для всех шести регионов! В среднем, 13 % из «коренных» фамилий, встреченных в каком-либо регионе, оказываются всеобщими, присутствуют и в других регионах. Это очень большая величина — раньше считалось, что таких фамилий почти нет, и поэтому сравнение удалённых регионов не имеет смысла, но к счастью, это оказалось не так.
3) ИНДЕКС МЕСТА. В общерусском списке все 67 тысяч фамилий мы расставили по убыванию их средней частоты. Значит, у каждой фамилии есть свой номер, её «ранг», её место среди всех русских фамилий. У группы фамилий тоже есть её «ранг» — среднее место входящих в неё фамилий. Именно эту величину мы и называем индексом места. Пользуемся мы ей часто — это просто и эффективно.
Например, у нас есть список всех фамилий Западного региона, расположенных по их частоте в Западном регионе. Насколько этот список вторит «всеобщему»? Насколько «западные» фамилии совпадают со списком «всеобщих» фамилий? Чтобы ответить, нужно рассчитать индекс места для «западных» фамилий. Чтобы не считать индексы для тысяч фамилий, мы ограничиваемся расчётом для десяти самых частых фамилий. И эти показатели работают очень эффективно.
4) СРАВНЕНИЕ ПО ЧАСТОТАМ ФАМИЛИЙ. Здесь фамилии неотличимы от обычных генетических маркёров, и мы пользуемся обычными методами: рассчитываем генетические расстояния по частотам всех фамилий как бы по частотам аллелей, строим график многомерного шкалирования и так далее. Это позволило напрямую сравнить расстояния между регионами по частотам фамилий с расстояниями между популяциями из тех же регионов по частотам гаплогрупп Y хромосомы. Обнаружилась высокая корреляция (равная 0.6), доказывающая, что частоты фамилий достоверно свидетельствуют о «настоящем» сходстве популяций подобно «настоящим» генам.
5) СРАВНЕНИЕ ПО СЕМАНТИКЕ ФАМИЛИЙ. Мы уже говорили — такой анализ возможен только для фамилий. Каждая фамилия, встреченная в популяции, относится к тому или иному классу, и подсчитывается, какой процент фамилий приходится на каждый класс. Затем популяции сравниваются (на глазок или количественно) по полученным профилям классов фамилий. В этой книге мы классифицировали и сравнивали не все фамилии, а только «топ-50» каждого региона.
6) КАРТОГРАФИРОВАНИЕ ОТДЕЛЬНЫХ ФАМИЛИЙ. Здесь и статистический, и семантический подходы отходят в тень, и на сцене появляется карта — наш главный инструмент во всей книге. Картографирование фамилий ничем не отличается от картографирования распространения генов или любых других признаков.
Неожиданно и приятно для исследователя, любящего фамилии, что даже в географии отдельных фамилий явно видны пространственные закономерности. Даже такая, казалось бы, вездесущая фамилия, как Иванов, оказывается отнюдь не вездесущей. Её зона обитания — запад и север «исконного» русского ареала, а, например, на юге она редка. Тем самым мы попутно опровергаем миф о случайном, повсеместном, недавнем и неинтересном возникновении русских фамилий от имён — ведь если бы миф был верен, Ивановы встречались бы с одной и той же частотой повсюду, где крестили по православному календарю.
Раз фамилии картографируются так же, как и все остальное в геногеографии, значит с картами фамилий можно проводить дальнейший анализ — комбинировать их и в обобщённые карты главных компонент, и в карты инбридинга.
7) РАСЧЁТ СЛУЧАЙНОГО ИНБРИДИНГА. Это показатель весьма важный — он измеряет степень подразделённости популяций, и, кроме того, степень «огомозигочивания» (снижения гетерозиготности), что даёт прогноз груза рецессивных наследственных болезней. Этот традиционный для «фамильной генетики» расчёт мы провели для всех русских популяций. Результирующая карта показывает невысокие значения инбридинга на юге, и его возрастание к северо-востоку «исконного» русского ареала.
ОТСЕВ РЕДКИХ ФАМИЛИЙ
Наш обзор мы начали с числа 67 000 — именно столько обнаружилось русских фамилий. Но отражают ли они «только коренное» население, как требуется в геногеографии, обращенной к истории генофонда? При сборе генетических и антропологических данных мы спрашиваем каждого человека, где родились его родители и предки. Тех, кто происходит из данной местности («коренное население») мы включаем в выборку. А тех, у кого есть предки издалека — отсеиваем («пришлое население»). Так мы делим на коренное и на пришлое население при анализе генов. Но при анализе фамилий мы не можем опросить каждого из миллиона человек!
Вместо прямого опроса, все исходные данные о фамилиях мы пропустили через сито демографического критерия. В результате из примерно миллиона человек осталось около 700 тысяч человек — остальные триста тысяч оказались носителями фамилий, которые нигде, ни в одном районе не достигают численности даже в пять человек. Эти фамилии мы расцениваем как вероятно «пришлые» в изученных популяциях, а потому неинформативные для анализа коренного населения. Таких фамилий оказалось очень много: из 67 тысяч отсеялось пятьдесят три тысячи! Осталось лишь 14 тысяч фамилий, которые мы расцениваем как коренные — и только эти фамилии используются в большинстве видов анализа.
Стоит задуматься, не слишком ли много мы потеряли при таком отсеве? Скорее всего, нет. Ведь хотя мы отсеяли 75 % фамилий, но общее число человек снизилось только на 25 %. Именно потому, что эти фамилии очень редкие, их носителей не так много. Не включая их в анализ, мы скорее избавляемся от случайных помех, чем теряем ценную информацию о генофонде. Ведь наша цель — изучение фамилий не ради них самих, а ради изучения генофонда.
ФАМИЛИИ НЕ РАДИ ФАМИЛИЙ
Начиная наше изучение русских фамилий, мы стремились получить новые знания о структуре русского генофонда. Однако в процессе изучения обнаруживалось столько любопытных и удивительных свойств фамилий, что наше исследование стало во многом методическим: мы освоились с таким типом маркёров как фамилии, придумали и опробовали новые методы их анализа. Теперь пора оглянуться и посмотреть, какие же конкретные знания о русском генофонде это нам дало.
Главным является, пожалуй, информация о степени сходства разных регионов: сходство популяций среднерусской полосы, особость юга и севера. Важны и данные о Сибири: отсутствие своеобразия генофонда современного русского населения Сибири, его приближённость к усреднённому русскому генофонду, и в особенности к регионам средней полосы, и из них в первую очередь к Западному.
Карта инбридинга — второй важный результат — показывает его возрастание к северу и востоку. Значит, именно в этом направлении растёт подразделённость русского генофонда — восточные и северные популяции более изолированы друг от друга, и вероятно, меньше по численности и занимаемому ареалу, чем популяции того же ранга на западе и юге.
Наконец, третьим важнейшим результатом стали карты главных компонент. Для прочих типов признаков (классических маркёров, антропологии, Y хромосомы) карты главных компонент были главным обобщающим результатом. Теперь и фамилии встают в строй, становясь ещё одним очевидцем в «мультиокулярном» подходе, ещё одним свидетелем структуры генофонда. И карты главных компонент фамилий тоже показывают нам изменчивость, близкую к широтной, не противореча остальным свидетелям. Но в отличие от главных компонент по остальным системам, главные компоненты фамилий куда более своеобразны.
Это вызвано, прежде всего, тем, что анализ главных компонент мы смогли провести лишь по 75 фамилиям, а среди этих фамилий непропорционально много «календарных» и слишком мало фамилий, характерных для северного и южного регионов. Скорее всего, именно поэтому широтная изменчивость на картах фамилий оказалась затушёвана. Это окончательно прояснится в будущем, когда мы изучим недостающие регионы и сможем построить главные компоненты не по 75, а по всему множеству фамилий. Пока же первая главная компонента изменчивости фамилий выявляет распространение именно календарных фамилий. Именно они вносят основной вклад в первую компоненту, которая, как и календарные фамилии, сильно смещена к западу.
ЧТО ДАЮТ ФАМИЛИИ?
Что же нам дало изучение русских фамилий? Мы не будем повторять все те результаты, которые касаются фамилий как таковых. Мы посмотрим, что это дало для изучения русского генофонда.
Во-первых, фамилии оказались ещё одним — и парадоксально надёжным! — источником сведений о структуре генофонда. Они подтвердили различия между южными и северными русскими популяциями при меньших различиях между западными и восточными. При анализе других систем этот вывод следовал из главных компонент. При анализе фамилий он угадывается в компонентах и ясно виден на графиках сходства регионов. Фамилии дали дополнительную информацию и по многим более частным вопросам, уточняя и проясняя структуру русского генофонда.
Но, во-вторых, и в главных, «показания» фамилий оказались удивительно сходными с показаниями генов. Чего стоит, например, одна лишь высокая корреляция (r=0.6) между матрицами расстояний по фамилиям и по гаплогруппам Y хромосомы! Это неизменное сходство результатов, полученных по фамилиям и по генам, подводит к новому подходу, новому плану использования фамилий: сначала разведка структуры генофонда с помощью фамилий — и лишь затем планирование собственно генетических исследований. Ведь фамилии можно изучить тотально — для всех популяций, а в популяции для каждого человека. То есть сделать именно то, что невозможно сделать по генам.
Поэтому можно сперва провести разведку боем: изучить структуру генофонда по данным о фамилиях, выявить основные закономерности, основные «кластеры» популяций — и уже по этим данным планировать изучение генофонда по генетическим маркёрам.
Например, разумно было бы изучать по одной популяции из каждого кластера, выявленного фамилиями, чтобы охватить основное разнообразие генофонда. Тем самым фамилии не дадут упустить при генетическом обследовании ни одну из своеобразных, отличающихся групп. А именно эта опасность — постоянная головная боль полевого исследователя генофонда.
Можно предложить и ещё одно яркое применение фамилий — для изучения переселенческих генофондов. Предположим, какая-то группа населения сформировалась за счёт миграций из нескольких источников, нескольких «материнских» групп. И, зная частоты генов в материнских группах и располагая данными по фамилиям, мы можем узнать частоты генов в переселенческой группе, не изучая её! Для этого нужно по данным о фамилиях установить, какие группы являлись материнскими и в каком соотношении они смешались в переселенческой группе. А дальше остаётся усреднить частоты генов в материнских популяциях, взвесив их на полученные по фамилиям «коэффициенты миграции» в переселенческую группу.
Конечно же, польза от фамилий не исчерпывается помощью в планировании исследований для генетики или в изучении «переселенческих» генофондов. Главным результатом своей работы с фамилиями авторы хотели бы видеть широкое распространение этого типа маркёров и в теории, и в практике исследований разных генофондов.