Вопрос 1: Когда появился термин ДНК-генеалогия?
Насколько мне удалось найти, впервые термин был использован в 1992 году в работе японских авторов[3], но в виде «митохондриальная ДНК-генеалогия». С тех пор авторы этот термин не использовали. Когда я ввел этот термин в 2006 году в сочетании «ДНК-генеалогия» для изучения Y-хромосомы, попгенетики подняли в сети страшный шум, уверяя, что это плохое название, что его никто не использует (как ни удивительно, это обычно главный аргумент у попгенетиков, на что я обычно говорю – «добро пожаловать в науку», там много что в первый раз), и что оно никогда не приживется. Особенно усердствовали попгенетики Балановский и Запорожченко. Через несколько лет прижилось. Сейчас введение словосочетания ДНК-генеалогия в поисковую систему Google дает – на русском языке 340 тысяч результатов, на английском языке (DNA Genealogy) – около 10 миллионов результатов, в русскоязычную поисковую систему Нигма – 924 тысячи результатов.
Но попгенетики извернулись, и перешли к новой тактике. О, ДНК-генеалогия – это давно известный термин, «словосочетание «ДНК-генеалогия» известно как минимум с 1986 года[4], см. Avise J.C., Ellis D. Mitochondrial DNA and the Evolutionary Genetics of Higher Animals (англ.) // Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences. – Т. 312. – № 1154. -С. 325–342. – DOI:10.1098/rstb.1986.ooii[5]».
Беда в том, что нет в указанной статье такого словосочетания. Да хоть бы и было где – ну и что? Не появлением словосочетания определяется появление новой науки. Для этого нужно неустанно работать, продвигая в науку методологию, полученные результаты, отстаивая их и соответствующие интерпретации от нападок недругов, которые всегда имеются, о них в значительной степени и эта книга. В науке всегда имеется ревность, недоброжелательство, доходящее до ненависти – и в основном от того, что «середнячки» истово охраняют свои «делянки». Я пишу «середнячки» – потому что люди, продвинутые в науке, всегда щедры на то, чтобы делиться своими достижениями, они поощряют новоприбывающих, потому что наука продвигается совместными усилиями, от этого выигрывают все. Середнячки же, люди в науке случайные, всегда секретничают там, где никаких секретов нет и быть не может, они ревнивы и часто злобны, они всегда опасаются за свое «место», потому что понимают, что слабы и способностями к творчеству не обременены. Их высшее достижение – зацепиться за публикацию, пусть в соавторстве с несколькими десятками человек, все равно в резюме пойдет, где число соавторов можно не указывать.
Так вот, не понимают середнячки, что не появлением словосочетания определяется появление новой науки. Поэт Андрей Белый написал еще в 1921 году
«Мир – рвался в опытах Кюри
Атомной, лопнувшею бомбой»
и никто не приписывает ему изобретение или создание атомной бомбы.
И дальше Википедия продолжает: В 1990-х словосочетание «ДНК-генеалогия» (англ. DNA genealogy) часто встречается в работах молекулярных биологов. См., напр.: Hora1 S., Satta Y., Hayasaka K., Kondo R., Inoue T., Ishida T., Hayashi S, Takahata N. Man’s place in Hominoidea revealed by mitochondrial DNA genealogy // Journal of Molecular Evolution. – 1992. – Т. 35. – № 1. -С. 32–43. – DOI:10.1007/BF00160258
Опять дезинформация – не только не «часто встречается», а не встречается вообще, за исключением указанной работы 1992 года, в названии которой есть словосочетание «митохондриальная ДНК-генеалогия». Надо сказать, что всего S. Hora1 опубликовал 106 научных статей, и в них слова «ДНК-генеалогия», и то «митохондриальная», встретились всего в одной, здесь процитированной. Да, еще в одной, в следующем, 1993 году, которая называлась так же, потому что частично отзывалась из-за ошибок. В статьях J.C. Avise, которых было опубликовано 182, в период с 1973 по 2014 год, слов «ДНК-генеалогия» вообще не было. Ни в одной статье. Вот так русская Википедия подрывает свою репутацию, и без того неважную.
Заключение – термин ДНК-генеалогия в том смысле, в котором сейчас используется, появился в русскоязычной сети в 2006 году, и в публикациях в 2007 году – А.А. Клёсов «Поиски пропавших колен израилевых с помощью ДНК-генеалогии»[6], А.А. Клёсов «Иосиф и его братья»[7], А.А. Клёсов «Хинди-руси бхай-бхай с точки зрения ДНК генеалогии, или откуда есть пошли славяне»[8].
Вопрос 2: Что можно дать в качестве определения и краткого описания ДНК-генеалогии как новой науки?
ДНК-генеалогия – одна из областей естествознания, молекулярная история. ДНК-генеалогия рассматривает закономерности наследования изменений нерекомбинантных (негенных) участков ДНК человека в ходе его эволюции на шкале времени от десятков и сотен лет до миллионов лет. Другими словами, ДНК-генеалогия изучает динамику накопления мутаций в ДНК человека, используя подходы химической и биологической кинетики, которые в свою очередь являются частью физической химии. Важнейшая особенность методологии ДНК-генеалогии – определение констант скоростей мутаций в ДНК (в первую очередь в тандемных повторяющихся последовательностях Y-хромосомы, так называемых маркерах, которых по оценкам имеется примерно 2500, а также накопления снипов, необратимых мутаций в ДНК) и приложение этих констант к расчетам хронологии древних событий – древних миграций человека, времен жизни общих предков изучаемых популяций.
Многочисленные примеры таких расчетов даны в настоящей книге.
Вопрос 3: Вы ввели понятие «молекулярная история» как синоним «ДНК-генеалогия». Смысл понятен, но прокомментируйте, пожалуйста.
Суть понятия молекулярной истории в том, что становится возможным следить за передвижениями древних народов не с помощью лопаты и кисточки археолога, не обмеряя черепа, не хитроумно расплетая созвучия и значения слов в живых и мертвых языках, не изучая древние фолианты в библиотеках и монастырях, а прослеживая за метками в Y-хромосомах наших ДНК. Они, эти метки, не могут «ассимилироваться», или «поглотиться» другими языками, культурами, или народами, как это происходит тысячелетиями с языками, культурами, народами в рамках понятий истории, лингвистики, этнографии, антропологии. Иначе говоря, методология новой исторической науки, «молекулярной истории», или ДНК-генеалогии, основывается на изучении молекул нуклеиновых кислот, а именно ДНК, дезоксирибонуклеиновой кислоты, в человеческих организмах, как живых, так и в древних костных останках. То, что еще несколько лет назад казалось каким-то развлечением, оказалось, дает истории, антропологии, археологии, лингвистике возможность проверить концепцию, рассмотреть данные под принципиально другим углом, связать воедино казалось бы разрозненные части общей картины наших знаний об окружающем мире.
Разумеется, не следует понимать буквально слова выше, как то, что отныне не нужно читать фолианты, изучать языки, и не проводить археологических раскопок. Напротив, это все приобретает еще большую значимость и ценность, поскольку усиливает выводы традиционных подходов в совокупности с выводами ДНК-генеалогии, при условии взаимного их согласования. Или, напротив, заставляет пересматривать казалось бы устоявшиеся выводы, если они входят в явное противоречие с данными ДНК-генеалогии.
Вопрос 4: Почему такое простое и очевидное понятие, как «молекулярная история», встречает сопротивление?
Очень просто – по инерции, из желания ничего не менять, желания сохранить статус-кво, сохранить привычную и часто коррумпированную систему рецензирования, распределения грантов. Возражают в первую очередь все те же Клейн и Балановские, они боятся изменений в привычной системе. Возражения против ДНК-генеалогии превратились уже в некую паранойю. Им, видимо, представляется, что если они хоть с чем-либо согласятся, то «проиграли». Но на их несогласия уже давно никто не обращает внимания. Вообще у людей ограниченных любое новшество вызывает резкое противодействие, просто потому что новшества их напрягают.
Это напоминает мне бурные дискуссии в 1960-х годах людей с подобной ментальностью, которые протестовали против введения термина «молекулярная биология», доказывая, что молекулярной биологии быть не может, это «редукционизм». Да и зачем, когда есть биохимия, которая занимается теми же вопросами. А, видимо, до того были протесты подобных же людей против введения понятия «биохимия», когда есть биология и есть химия, и этого достаточно. Но в 1960-х годах вопрос решался просто – выходило постановление ЦК КПСС о создании нового научного направления «молекулярная биология» и постановление Президиума АН СССР об образовании соответствующего Института в системе Академии наук СССР, директор В.А. Энгельгардт, и создании журнала под названием «Молекулярная биология», главный редактор он же. После этого дискуссия внезапно и по вполне понятным причинам прекращалась. Кто не согласен с постановлением ЦК КПСС – выходи по одному.
Сейчас времена другие, поэтому дискуссии либо идут до изнеможения участников, ничего не решая, либо новое направление устанавливает себя де факто, игнорируя мнения людей с протестной ментальностью. Этим, вторым путем и идет ДНК-генеалогия. Де юре приходит следом, как, например, официальная регистрация Академии ДНК-генеалогии в России в июле 2015 года. Затем продолжает создаваться инфраструктура Академии и нового направления – создается Лаборатория ДНК-генеалогии, идет работа над проектами Академии, продолжают выходить книги по ДНК-генеалогии, видео- и кинофильмы, и вскоре народ удивляется – а что там за дискуссия раньше была, смысл какой был?
Вопрос 5: Что такое Академия ДНК-генеалогии? Кто в нее входит?
Академия ДНК-генеалогии была создана в 2007 году, первоначально в США, затем ее научное представительство распространилось на Россию (Москва) и Японию (Цукуба). Она задумывалась по принципу классических академий античности – собрание единомышленников, выпускающее свое издание. С июля 2015 года Академия ДНК-генеалогии является официально зарегистрированной российской некоммерческой организацией, которая занимается развитием и популяризацией ДНК-генеалогии.
Сразу стоит оговориться, что члены Академии ДНК-гене-алогии – это не «академики». По принятой практике академик – это член Национальной Академии наук, в России – члены РАН, и ничего другого. Например, на официальном сайте Национальной Академии наук Грузии, членом которой я являюсь, стоит уведомление, что никакая другая организация, кроме Национальной Академии наук, не имеет права использовать термин «академик». Исходя из подобного принципа, члены Академии ДНК-генеалогии – это исследователи, энтузиасты, любители, сторонники и все те, кому небезразлична ДНК-генеалогия, кто видит её важную роль для науки и общества, кто помнит и изучает историю своих предков. Но не «академики». Опыт показывает, что тем, кому интересна ДНК-генеалогия, интересны и другие области знания, и наоборот, людям, интересующимся знанием, интересна и ДНК-генеалогия.
Идея создания Академии ДНК-генеалогии пришла в 2006 году в ходе обсуждения структуры нового общества единомышленников, заинтересованных в развитии ДНК-генеалогии, и создании журнала этого общества. Было предложено назвать общество Российской Академией ДНК-генеалогии, новый журнал – Вестник Российской Академии ДНК-генеалогии. Как водится, поднялся крик на лужайке, тут же объявились скептики, которым никогда ничего новое не нравится, в общем, пришлось их проигнорировать, и в 2007 году был создан Устав новой Академии, в июне 2008 года вышел первый выпуск Вестника Российской Академии ДНК-генеалогии. Он был на английском языке, объемом 233 страницы, и содержал две большие статьи – «Основные принципы ДНК-генеалогии. Скорости мутаций и их калибровка» и «Происхождение евреев с точки зрения ДНК-генеалогии». С тех пор вышло 73 выпуска Вестника, общим объемом около 15 тысяч страниц. С января 2012 года, с появлением в составе Академии иностранцев и многих публикаций ими в Вестнике, название изменилось на Академия ДНК-генеалогии. С июля 2015 года Академия ДНК-генеалогии получила официальную регистрацию в Министерстве юстиции РФ и является российской некоммерческой организацией.
Основной целью Академии ДНК-генеалогии является развитие и популяризация ДНК-генеалогии, координация фундаментальных и прикладных научных исследований, разработка и реализация исследовательских программ и внедрение их результатов в практику смежных дисциплин (история, археология, лингвистика, антропология, этнография, документальная генеалогия). В то же время, стоят задачи ДНК-генеалогической подготовки научных кадров из смежных дисциплин, создание условий для их научного творчества в области ДНК-генеалогии, содействие международному сотрудничеству в области ДНК-генеалогии, интеграции российских ученых в мировое научное сообщество. Выход на масштабное исследование палео-ДНК, в котором последуют открытие за открытием. Задачи – широчайшие по своему масштабу и ожидаемому результату.
При этом надо понимать, что ДНК-генеалогия – это настолько разноплановая совокупность направлений наук, что она в целом охватывает все науки о человеке, в которых есть хронологическая, временная компонента. Это и эволюция человека – как же там без хронологической компоненты, и древние миграции человека, и вопросы этнообразования, и исторические науки, и языкознание, а именно динамика языков в пространстве и во времени. Например, глоттохронология (лексикостатистика) потому и имеет более чем шаткий статус в лингвистике, что она не связана с ДНК-генеалогией, с хронологией древних миграций, и ограничивается формальными расчетами при значительных допущениях и приближениях. Достаточно взглянуть на список Проектов Академии ДНК-генеалогии (см. ответ на следующий Вопрос), чтобы понять, насколько ограничена наука о человеке без знания ДНК-генеалогии – ни один из тех Проектов не решен современной наукой, причем во многих случаях не решен за 100200-300 лет и больше.
Расчеты по мутациям в гаплотипах и Y-хромосоме в целом – это только отдельная, но крайне важная часть ДНК-генеалогии. Там без специальных знаний в кинетике химических и биологических систем не обойтись, и именно это вызывает наибольший дискомфорт и агрессивность тех, кто пытается «тянуть одеяло на себя», но этими знаниями не обладают. Они беспомощны в ДНК-генеалогии, и в первую очередь это относится к представителям популяционной генетики в России. Их наука – сугубо описательная, пусть таковой и остается. ДНК-генеалогия прошла намного дальше, и с ней «конкурировать» уже бесполезно. Можно только мирно сотрудничать.
Но расчеты по мутациям в ДНК выводят на новые горизонты знания, и там ДНК-генеалогия призвана образовать творческий симбиоз с археологией, историей, лингвистикой, этнографией, этногенезом и сопряженными науками. Там провести разграничительные линии уже невозможно. Проекты Академии будут тому наглядным доказательством.
Приоритетным направлением научной деятельности Академии является также развитие теоретической базы ДНК-генеалогии и разработка на ее основе надежных методов прикладной ДНК-генеалогии, ведение собственных научных проектов и организация работы Лаборатории ДНК-генеалогии. Поскольку Академия ДНК-генеалогии сразу выходит на широкие круги общества, то мы с самого начала отказались от «элитной модели» Академии. Причина проста – о ДНК-генеалогии говорят, спорят, начинают изучать свои ДНК-генеалогические линии, ждут открытия Лаборатории ДНК-генеалогии. Оказалось, что у нового научного направления очень много сторонников. И это замечательно. Общественная поддержка очень важна для становления и развития ДНК-генеалогии, и каждый может стать членом Академии ДНК-генеалогии. Но есть два условия. Первое – знание своей гаплогруппы, иначе какой деятельный интерес к ДНК-генеалогии без этого? Но мы не имеем права никого обязывать проходить ДНК-тест в США. Поэтому тест можно будет выполнить в Лаборатории ДНК-генеалогии, которая скоро должна открыться в Москве. Второе условие – поддержка Проектов Академии ДНК-генеалогии, с размером ежегодного взноса 3000 рублей. Это важно, потому что другого финансирования у Академии нет, а работы много. От уплаты взноса в первый год освобождаются те, кто уже сделал ранее пожертвование в сумме не менее 3000 рублей, или оказал другую конкретную помощь Академии – помогал в оформлении документации при регистрации Академии, разработал логотип Академии и т. д. Список членов указывается на официальном сайте http://dna-academy.ru/
Вопрос 6: Вы ввели понятие научного патриотизма в рамках понятий ДНК-генеалогии. Поясните, пожалуйста.
В общественном смысле научный патриотизм – это укрепление интереса к своим корням, предкам, формирование взаимного уважения между разными народами. Суть научного патриотизма – в восстановлении исторической справедливости о происхождении народов и их роли в истории. Это сейчас – более чем актуальная задача в отношении буквально всех народов Российской Федерации, и не только их. В частности, ДНК-генеалогия призвана активно противостоять русофобам всех мастей в их непрекращающихся уже более двухсот лет попытках умалить значимость славян и русских в истории, в том числе с привлечением порочной концепции «норманизма», которую громил еще М.В. Ломоносов. ДНК-генеалогия резко сдвигает баланс в сторону научного патриотизма, показывает, что норманизм – это фантом, это мировоззрение «пятой колонны», русофобство по своей сути. В проявлении своего научного патриотизма крайне заинтересованы осетины, карачаево-балкарцы, ингуши и чеченцы, которые все хотят доказательств своего аланского происхождения. В проявлении научного патриотизма крайне заинтересованы крымские татары и татары в целом, башкиры, чуваши, марийцы и множество других народов, в том же исключительно заинтересованы таджики, киргизы, афганцы, армяне, грузины, крайний интерес проявляют народы бывшей Югославии – сербы, словенцы, хорваты, боснийцы, македонцы, черногорцы и другие. Все возлагают надежды на ДНК-генеалогию и ее Проекты.
Вопрос 7: Над какими Проектами идет или будет проводиться работа в Академии ДНК-генеалогии?
Проекты Академии ДНК-генеалогии объединяют комплекс мультидисциплинарных исследований, включающих ДНК-генеалогию, историю, археологию, языкознание, этнографию и сопряженные науки, и ставят целью, как правило, продвижение наших знаний там, где их пока не сумели в полной мере, или вообще, продвинуть более традиционные науки. Проекты Академии позволяют критически рассмотреть существующие данные, выводы и концепции (если такие имеются), и сформулировать новое знание. Проекты создаются на тех направлениях, где ученые не пришли к консенсусу или вопрос о консенсусе пока даже не был поставлен, хотя проблема в целом известна, порой столетиями.
Аланский Проект. В настоящее время ряд этнических образований Российской Федерации претендуют на свое происхождение от алан – ветви скифов, которых историки относят к периоду от начала нашей эры до 8-10 вв. н. э. Это, в первую очередь, карачаево-балкарцы, осетины, ингуши и чеченцы. Аргументы выдвигаются разные – от легенд, сказаний, этнонимов, лингвистических признаков до анатомических особенностей, которые приписываются аланам. Свидетельства науки при этом обычно категоричны, противоречивы и не могут быть примирены друг с другом уже как минимум 200 лет. Аланский Проект Академии основывается на массовом тестировании ДНК современников из упомянутых этносов, на тестировании ископаемых ДНК из паспортизированных скелетных останков, отнесенных археологами к аланам, и на ожидаемом консенсусе специалистов из всех упомянутых этносов (последнее желательно, но не обязательно, если консенсуса невозможно достичь даже при наличии убедительных данных ДНК-генеалогии). Проект необходимо проводить при непосредственном участии региональных правительств и научных учреждений. Энтузисты, готовые участвовать в реализации Проекта, на местах имеются, включая государственных служащих.
Арийский Проект базируется на массовом тестировании таджиков и жителей сопредельных территорий, а также на тестировании ископаемых ДНК исторической Бактрии. Цель Проекта – отнесение гаплотипов и гаплогрупп/субкладов тестируемых к историческим ариям и/или скифам и соответствующее продвижение исторической науки. Проект необходимо проводить при непосредственном участии правительств всех упомянутых этнических образований. Энтузиасты, включая профессоров вузов Таджикистана и правительственных служащих, готовы участвовать в реализации Проекта.
Проект Рюриковичей ставит своей целью выяснение того, к каким ДНК-генеалогическим линиям относятся наиболее вероятные современные претенденты на принадлежность к династии Рюриковичей, тестирование ДНК из усыпальниц и достижение консенсуса, если это возможно, с ведущими генеалогами России и Польши. Проект необходимо проводить при непосредственном участии правительств России и Польши.
Проект древних славянских племен ставит своей целью идентификацию ДНК-линий основных древнеславянских племен – полян, древлян, вятичей, кривичей (смоленских, избор-ских и северных), ильменских (новгородских) словен, радимичей, дреговичей, северян, полочан, волынян, бужан (потомков дулебов), уличей, тиверцев, хорват и других. Проект необходимо проводить в содружестве с археологами и историками соответствующих направлений.
Татарский Проект ставит своей целью идентификацию ДНК-генеалогических линий основных групп татар Российской Федерации – казанские, астраханские, сибирские, крымские, касимовские, пермские, мишари, тептяри (башкирские), кряшены (волго-уральские), нагайбаки (челябинские) и другие, а также также польско-литовские татары, и выявление их предположительных общих предков по гаплогруппам. Также – выяснение ДНК-генеалогических связей татар с булгарами.
Проект Коэнов ставит целью составление базы данных гаплотипов, относящихся – по заявлениям их носителей – к линии коэнов (коханим), полумифических потомков Аарона, брата Моисея, ДНК-линии Леви, одного из колен Израилевых, жившего предположительно 3600–3300 лет назад. Это – промежуточная цель, на пути к основной цели – выявление того, в какой степени этот миф имеет исторические корни и какая ДНК-линия (гаплогруппа, субклад, гаплотипы) может считаться с наибольшим обоснованием линией Аарона. Проект будет проводиться при поддержке Международной ассоциации коэнов (коханим) и лично Президента Ассоциации, Машуа Коэна.
Проект пропавших 10 колен Израилевых. Основная цель этого Проекта состоит в идентификации ДНК-линий каждого из 12 колен Израилевых, а также ДНК-линии Леви, не входившей в состав 12 колен. Проект будет проводиться при поддержке Международной ассоциации коэнов (коханим) и лично Президента Ассоциации, Машуа Коэна, а также заинтересованных еврейских организаций. Сотрудничество с ними уже ведется.
Сакартвельский проект ставит целью создание базы данных грузинских субэтносов на основе массового тестирования грузин, и в содружестве с грузинскими археологами (в особенности Константина Пицхелаури, чл. – корр. Национальной АН Грузии) продвижения знаний об истории Грузии и грузинских археологических культурах в контексте их родовой принадлежности. Проект поддерживает Президент Национальной АН Грузии, академик Г.И. Квеситадзе. Главные музеи Грузии выразили желание предоставить свои паспортизированные образцы ископаемых скелетных останков для ДНК-тестирования.
Норманнский Проект преследует цель ДНК-генеалогической проверки так называемой «норманнской теории» основания российской государственности и массового заселения Руси норманнами, под которыми обычно подразумеваются скандинавы (по разным данным от 10 тысяч человек до сотен тысяч человек) во второй половине I тыс. н. э.
Балканский Проект ставит целью ДНК (родовую) реконструкцию состава мужской популяции Сербии, Хорватии, Боснии-Герцеговины, Словении, Македонии, Черногории во II тыс. до н. э. – I тыс. н. э., выяснение роли предков славян в Троянских войнах (конец II тыс. до н. э.) и в военных походах по Малой Азии в те же времена, в выявлении славянского компонента в исторических венетах и этрусках. Помимо этого, Проект включает изучение ископаемых ДНК в скелетных останках Лепенского Вира (9–7 тысяч лет назад), культурах Винча, Старчево и родственных балканских культурах.
Разумеется, список Проектов не ограничивается перечисленными выше. Он постоянно в рассмотрении и развитии.
Вопрос 8: Русское издание Википедии утверждает, что вы «позиционируете ДНК-генеалогию как авторскую концепцию, как новую научную дисциплину». И далее Википедия утверждает – «однако исследования генетического разнообразия человечества ведутся на протяжении уже почти сотни лет. В рамках современной популяционной генетики существует прикладная наука – генетическая генеалогия, изучающая характер генетических взаимосвязей на основе генеалогических ДНК-тестов. Генетическая генеалогия имеет в России и в других странах другое популярное название – ДНК-генеалогия». Прокомментируете?
В этой книге я буду многократно обращаться к подобным заявлениям и их авторам. Авторы их – как правило, популяционные генетики, которые с самого начала появления ДНК-генеалогии заняли позицию конфронтации, к чему причин было немало. Одна из основных причин была в том, что попгенетики хотели полностью контролировать исследования по «генетическому разнообразию человечества», как сформулировано в вопросе выше, и противодействовали всему, что выходило из под их контроля. Со мной их контроль не удался с самого начала, отсюда негодование и конфронтация, которые со временем трансформировались с их стороны в «войну на уничтожение», сопряженную с «информационной войной».
Другая важная причина заключалась в том, что исследования в области ДНК-генеалогии немедленно выявили вопиющую безграмотность популяционных генетиков, особенно в расчетном аппарате, представлении данных, показали полное отсутствие научной школы в российской и международной попгенетике. Оказалось, что популяционные генетики в течение последних двух десятилетий генерировали фактически мусор в академической литературе. Расчеты датировок при использовании принятых и узаконенных в попгенетике «популяционных скоростей», они же «скорости Животовского», неизменно приводили к ошибкам на уровне 250–350 % (!), то есть там, где датировки древних племен и их миграций должны были быть, скажем, 5000 лет, у популяционных генетиков получались 15 тысяч лет. Естественно, это приводило к совершенно искаженным интерпретациям исторического характера, в свою очередь приводившим к форменному абсурду. Я в своих работах всё это вскрывал и описывал, а попгенетики ничем не могли возразить.
Так продолжалось семь лет, с 2007 по 2014 гг, попгенетики молчали и делали вид, что ничего не происходит. За эти семь лет ни одного возражения от них в научной литературе не было, не считая совершенно беспомощного ответа от группы попгенетиков[9] на мою критику в журнале Human Genetics (2009)[10]. Да и там было не нападение на ДНК-генеалогию, а была робкая и пассивная защита «популяционных скоростей» в попгенетике, главным аргументом которой было, что «их применяют в литературе», значит, все в порядке. На этом я ниже еще остановлюсь.
Так вот, в ноябре 2014 года попгенетики открыли агрессивную кампанию против ДНК-генеалогии. Но поскольку никаких возражений против самой новой науки они найти не могли, то они обратили свою атаку на меня лично, на факты моей биографии и професссиональной деятельности, и основное внимание было при этом уделено лжи, подтасовкам, передергиваниям. Об этом уже было и будет в этой книге. Статья в Википедии обо мне (которую не я готовил и не я обновлял) подверглась форменному вандализму, выросла за счет лжи, подтасовок и недоразумений во много раз, и то, что написано в вопросе выше – тоже часть этой кампании. Небольшая группа вандалов (а то, что группа небольшая, ясно из обсуждения этой статьи в Википедии, причем наиболее активным вандалом был кандидат филологических наук А. Касьян, отнюдь не обременный знаниями ни в попгенетике, ни тем более в ДНК-генеалогии. Что им двигало в такой активности уродовать статью в Википедии – я понятия не имею. Он же подписал печально известное и лживое «письмо 24-х», о котором шла речь в Предисловии этой книги, и будет идти речь дальше, поэтому его активность в уродовании статьи в Википедии отнюдь не отражало его объективность.
Теперь, после этих объяснений, вернемся к заданному вопросу. Я не знаю, что я там «позиционирую», но ДНК-генеалогия действительно является новой научной дисциплиной. В науке понятие «новой научной дисциплины» определяется ее методологией. Методология ДНК-генеалогии не является методологией ни генетики, ни популяционной генетики. Расчетный аппарат ДНК-генеалогии является полностью отличным от расчетного аппарата генетики или популяционной генетики. Публикации по ДНК-генеалогии совершенно отличаются от публикаций по генетике или популяционной генетике. Википедия даже поместила высказывание О. Балановской, что она не в состоянии понять расчетный аппарат ДНК-генеалогии – цитирую: «они обрабатывают данные непонятными способами». Действительно, какая же ДНК-генеалогия «популяционная генетика», когда математический аппарат другой и непонятный? Вывод – не «позиционирую» я ДНК-генеалогию как новую научную дисциплину, а она таковой и является.
Далее, Википедия утверждает, что «однако исследования генетического разнообразия человечества ведутся на протяжении уже почти сотни лет». Ну и замечательно, только причем здесь ДНК-генеалогия? Мало того, что ДНК-генеалогия не имеет дело с «генетическим разнообразием», нет генов в ДНК-генеалогии. ДНК-генеалогия – не генетика. Это попгенетика занимается наследственными заболеваниями, картированием их по территориям и этносам, а ДНК-генеалогия этим совершенно не занимается. Да и вообще понятие «разнообразие» в ДНК-генеалогии отсутствует. Это попгенетика измеряет какие-то мутные «коэффициенты разнообразия», которые никогда и никому не были нужны. Стандартным местом в попгенетике является сообщение, что какая-то популяция имеет «коэффициент разнообразия» 0.98, а какая-то имеет 0.87, но я никогда не видел, чтобы эти цифры в публикациях обсуждались. Это совершенно никчемные величины. Разумеется, в ДНК-генеалогии их нет. Вывод – эти «исследования ведутся на протяжении уже почти сотни лет» – к ДНК-генеалогии никакого отношения не имеет. Мало ли что там «ведутся»? Иследования в астрологии тоже давно ведутся, но причем здесь ДНК-генеалогия?
Википедия продолжает – «В рамках современной популяционной генетики существует прикладная наука – генетическая генеалогия, изучающая характер генетических взаимосвязей на основе генеалогических ДНК-тестов». Ну и пусть существует, ДНК-генеалогия там опять не при чем. Балановские написали большой том под названием «Русский генофонд на Русской равнине», как обычно у них, совершенно невразумительный, и что показательно – во всем томе не приведено ни одного гаплотипа. Это и есть, видимо, «генетическая генеалогия». Да и вообще «изучение характера генетических взаимосвязей» не имеет никакого отношения к ДНК-генеалогии. Нет там генетики, нет и «генетических взаимосвязей».
Наконец, опять Википедия – «Генетическая генеалогия имеет в России и в других странах другое популярное название – ДНК-генеалогия». Да, имеет, и в России тоже, только слов «ДНК-генеалогия» до наших работ в России не было. Сейчас – есть. Кто хочет оспорить – пусть найдет хотя бы одну публикацию до 2006 года на русском языке, в который были бы слова «ДНК-генеалогия». Да и сейчас вряд ли есть, за исключением наших работ и тех, кто на них ссылается. Давайте проверим. Вводим в Google слова ДНК-генеалогия, на русском языке. Смотрим на первые десять результатов:
1. Реклама тестирующей компании Гентис, 2010 год.
2. Опять реклама Гентис, 2013 год
3. Видеоролик моего выступления на презентации книги.
4. Видеоролик моего выступления «Се – человек».
5. Реклама компании Гентис, зарегистрированной в 2009 году.
6. Описание нашего сайта «Родство», с сообщением, что термин «ДНК-генеалогия» впервые появился на этом сайте в 2006 году.
7. Статья «Введение в ДНК-генеалогию», написанная на основании моих статей и выступлений.
8. Сайт Игоря Гаршина, 2014 год.
9. Выступление М.Н.Задорнова, 2013 год.
10. Реклама моей книги «Происхождение славян».
Ну и далее – выступление члена нашей Академии ДНК-генеалогии; содержание нашего Вестника Академии ДНК-генеалогии; опять реклама книги «Происхождение славян», и так далее, 342 тысячи результатов, как сообщает Google. Кто найдет слова ДНК-генеалогия ранее 2006 года на русском языке – сообщите мне, буду признателен. На английском языке – одна статья с этими словами в названии, см. Вопрос 1. Всё. Никаких «генетическая генеалогия имеет в России и в других странах другое популярное название – ДНК-генеалогия» до 2006 года нет. Опять Википедия обманула. Зачем? А потому что ее «писатели» играют в детскую игру – любой ценой обмануть. Они думают, что это что-то изменит, или там репутацию уронит, что им страстно хочется. Зачем? Это, пожалуйста, к психиатру, не ко мне.
Вопрос 9: Чем популяционная генетика отличается от ДНК-генеалогии?
Практически всем. Адресуемыми вопросами, целями и задачами, методологией, расчетным аппаратом, характером выводов, определениями популяций. Но главное – это вообще другая область науки. Популяционная генетика – описательная по сути, а ДНК-генеалогия – аналитическая. Попгенетика описывает структуру популяций, ДНК-генеалогия описывает историю популяций. Название ведь о многом говорит. Не случайно биологическая химия – это химия, а химическая физика – это физика. Физическая химия – это химия. Биофизика, то есть биологическая физика – это физика. Второе слово в таких составных названиях дисциплин показывает, к какой области науки дисциплина относится. Так вот, популяционная генетика – это генетика. А ДНК-генеалогия к генетике по сути дела никакого отношения не имеет, это – генеалогия, то есть история.
Популяционные генетики с самого начала возникновения термина «ДНК-генеалогия» пытались не допустить возникновения новой науки, потому что прекрасно понимали, что потеряют контроль, монополию на публикации в этой области, и самое главное – что их примитивные и зачастую неверные методы получат огласку. Так, кстати, и получилось. Поэтому они с самого начала возражали против термина ДНК-генеалогия, настаивали, что это то же самое, что популяционная генетика. Это, конечно, не так.
В итоге в российской популяционной генетике сложилась печальная ситуация. Небольшая группа крикливых оппонентов, одни из которых хотят сохранить для себя систему распределения финансовых грантов, то есть продолжать иметь полный доступ к деньгам, другие – их приятели, у третьих есть личные причины, у каждого свои, начинают агрессивно «захлопывать», не гнушаясь никакими средствами. Для этого есть Википедия, есть научные конференции, которые они сами организуют, есть сетевые издания, которые они сами контролируют, есть «дискуссионные сайты», типа «Троицкого варианта», которыми они или управляют, либо вводят ведущих в заблуждение, и кампания разворачивается. Как показывают данные, которые приведены ниже в данной книге, всего десяток человек-оппонентов генерируют на «дискуссионных сайтах» тысячи сообщений, а поскольку это почти исключительно ложь и передергивания, то дискутировать там смысла не имеет. Тактика таких дискуссий давно отработана. Выдвигается очередное ложное положение. Если на него не отвечать, то пишут, что не отвечает, значит, согласен. Если отвечать, раздается хор голосов, что «он оправдывается», значит, неправ. Потоком идут лживые приписки, которые «обвиняемый» никогда не говорил, приводятся якобы «сведения» персонального характера, которые не соответствуют действительности. Отвечать на все это смысла не имеет.
Так вот, о популяционной генетике. Популяционная генетика – это часть генетики, о чем говорит ее название, но со своими особенностями. Главная задача популяционной генетики – это выявление связи между генотипом и фенотипом, то, к чему ДНК-генеалогия не имеет отношения. Популяционная генетика иногда тоже рассматривает гаплогруппы и гаплотипы Y-хромосомы, как и ДНК-генеалогия, но на этом сходство заканчивается. Аппарат популяционной генетики, применяемый для интерпретации получаемых данных, например, «метод главных компонент», характеризуется со стороны ДНК-генеалогии как совершенно примитивный и ведущий к заблуждениям, и не используется в ДНК-генеалогии. Он не отвечает задачам ДНК-генеалогии.
В целом же генетика человека – это наука, изучающая наследственность и изменчивость признаков, определяющих врожденные особенности человека, и передаваемых, как правило, через гены. Но ДНК только на 2 % состоит из генов, а в Y-хромосоме генов вообще ничтожная доля. ДНК-генеалогия в настоящее время изучает в основном Y-хромосому, и не изучает наследственность и изменчивость упомянутых признаков, передаваемых через гены.
Но дело даже не столько в этом. Направления и области науки определяются не объектами исследования, а методологией исследования. Именно методология исследования отличает, например, химию от физики, хотя объекты часто одинаковы. Методология генетики совершенно другая, чем методология ДНК-генеалогии. У них разные задачи исследований. ДНК-генеалогия по сути историческая наука, она оперирует хронологией, датировками древних событий, и для этого ДНК-генеалогия использует свой расчетный аппарат, которого нет в методологии генетики. ДНК-генеалогия использует и развивает методы физико-химической кинетики в применении к ДНК, переводит картину мутаций в хронологические, исторические показатели, как указывалось выше. Это вообще не входит в методологию генетики, у нее другой экспериментальный и аппаратурный базис.
Повторяем, что экспериментальные данные ДНК-гене-алогии – это картина мутаций в нерекомбинантных (то есть не комбинирующихся с другими в ходе передачи наследственной информации потомкам) участках мужской половой хромосомы (на самом деле – и в митохондриальной ДНК, но пока в малой степени, так как информативность мтДНК в ДНК-генеалогии пока несравненно меньше, чем информативность Y-хромосомы). Речь здесь идет об информативности для исторических исследований, которую определяет картина мутаций как в Y-хромосомах отдельных людей, так и их групп, племен, родов, популяций. Естественно, в данном контексте термин «популяций» относится к мужской половине рассматриваемой популяции. В ДНК-генеалогии популяция – это мужская часть населения, на которую распространяются выводы, полученные при рассмотрении определенной выборки. Популяция может или ограничиваться выборкой, или, чаще, быть шире выборки, но при этом подразумевается или доказывается, что выявленные закономерности выборки распространяются на рассматриваемую популяцию. Например, если в пределах популяции сделаны несколько независимых выборок, и результаты в пределах погрешности расчетов совпали, то эти результаты могут распространяться на всю популяцию, пока не найдено обратного.
В ДНК-генеалогии понятие популяции имеет несколько другой смысл, чем в популяционной генетике. Если в ДНК-генеалогии, как пояснено выше, популяция – это мужская часть населения, исторически сложившаяся на определенной территории или в ходе древней миграции, и относящаяся к одному роду, как правило, по мужской линии, то есть воспроизводящая себя в границах рода из поколения в поколение, то в популяционной генетике популяция – это относительно обособленная группа населения, исторически сложившаяся на определенной территории и воспроизводящая себя в этих границах из поколения в поколение. Как видно, между этими двумя определениями популяциями есть два заметных различия. Первое – что в популяционной генетике популяция включает мужчин и женщин, в ДНК-генеалогии – или только мужчин, или только женщин. Причина проста – расчеты в ДНК-генеалогии ведутся или только по мужской линии (Y-хромосома), или только по женской (мтДНК). Второе – в ДНК-генеалогии нет требования обособленности популяции, потому что критерии выборок и расчетов другие. Если на одной территории проживают носители нескольких гаплогрупп, то после идентификации этих гаплогрупп обработка соответствующих данных производится раздельно. В итоге выясняется, как правило, что их древние миграции были различными, что датировки тех миграций были различными, и что, разумеется, общие предки разных гаплогрупп, то есть популяций, были различными.
Итак, методология новой науки – перевод динамической картины мутаций в хронологические показатели, во времена жизни общих предков популяций, а на самом деле – общих предков древних родов и племен. То есть фактически по мутациям в ДНК производится расчет времен, когда в древности жили эти рода и племена, и как эти времена меняются от территории к территории, что может указывать на направления древних миграций[11].
Попгенетики утверждают, что и генетика, и ДНК-генеалогия изучают ДНК, значит – ДНК-генеалогия это генетика. Но это ошибка – полагать, что направление науки определяется объектом исследования. Изучать ДНК- это далеко не обязательно генетика. Например, химик, растворяя ДНК в кислоте и изучая, скажем, вязкость получаемого раствора, вовсе не занимается генетикой. Альберт Сент-Дьорди как-то сказал – «Дайте химику динамомашину, и он тут же растворит ее в соляной кислоте». Это вовсе не означает, что химик при этом будет заниматься электродинамикой.
Это же относится и к искаженным и примитивным методам обработки картин мутаций в ДНК в рамках популяционной генетики. Если популяционный генетик увидит (или получит) набор из сотни гаплотипов, скажем, 37-маркерных, в котором, например, четыре гаплотипа одинаковых, и еще семь будут совпадать друг с другом случайными парами, он сообщит, что в наборе имеется «89 уникальных гаплотипов», и это и будет результатом его исследования, который пойдет в статью в научный журнал. Ни он, ни рецензенты не хотят признать, это эта «информация» не имеет ни малейшей ценности, и фактически никому в таком виде не нужна. Но таковы принципы и правила популяционной генетики. «Молекулярной историей» это назвать никак нельзя. А специалист в ДНК-генеалогии сразу скажет, что общий предок этих ста гаплотипов жил 925±105 лет назад, потому что натуральный логарифм отношения 100/4, поделенный на константу скорости мутации для 37-маркерных гаплотипов (0.09 мутаций на гаплотип на условное поколение в 25 лет) равен 36 → 37 условных поколений, то есть общий предок этой сотни гаплотипов жил примерно 925 лет назад. Сказать это с большей определенностью можно тогда, когда подсчитано число мутаций во всех ста гаплотипах, и если оно будет равно, например, 324 (или близко к тому), тогда 324/100/0.09 = 36 → 37 условных поколений (этот метод расчета называется линейным, в отличие от приведенного выше логарифмического), то есть ровно тот же промежуток времени до общего предка. Погрешность расчетов определяется по известным правилам[12]. Совпадение времен до общего предка для «логарифмического» и «линейного» метода (в первом мутации не считаются, во втором считаются) свидетельствует, что закономерности образования мутаций в гаплотипах следуют кинетике первого порядка, что в свою очередь означает, что все сто гаплотипов действительно произошли от одного прямого общего предка.
Популяционная генетика такими подходами не пользуется, они ей чужды по ряду причин, среди них – приверженность устаревшим, традиционным подходам, отсутствие соответствующего образования, клановость, отсутствие хорошей научной школы. Короче, ДНК-генеалогия является другой дисциплиной, нежели популяционная генетика.
Вопрос 10: Можно ли называть снипы и гаплотипы в Y-хромосоме «генами»? Почему попгенетики постоянно называют их «генофондом»?
Называть снипы и гаплотипы/маркеры в Y-хромосоме «генами» категорически нельзя. Называть совокупность снипов и гаплотипов «генофондом» категорически нельзя. То, что их так называют Балановские – это или вопиющая безграмотность, или совершенно расхлябанный жаргон. Они, Балановские, повсюду используют термин «генофонд», относя его к гаплогруппам, субкладам и гаплотипам. Они не понимают, или не знают, что генофонд – это совокупность генов. Даже Википедия это знает, цитирую – «Генофонд (также генный пул, пул генов – англ. «gene pool»)». Понятие генофонда сформулировал еще в 1928 году А.С. Серебровский, цитирую – «Совокупность всех генов данного вида… я назвал генофондом». Нет в гаплотипах и гаплогруппах генов, никакой это не генофонд.
Балановские же от статьи к статье, от высказывания к высказыванию называют снипы (!) «генофондом». Очередной пример, из десятков и сотен, в недавней статье в сборнике «Археология, этнография и антропология Евразии» (Том 43, № 2, 2015), статья называется (привожу только часть названия) «Структура генофонда по данным маркеров Y-хромосомы». В авторах – Е. Балановская. И дальше, первая фраза Абстракта «Изучен генофонд популяции по SNP-маркерам Y-хромосомы». Категорически неверно. Я уже не говорю, что здесь безграмотность еще и в другом – не пишут в Абстракте «изучено то-то», пишут, что именно обнаружили, нашли, какие выводы сделали. Не пишут в Абстракте «мы собирали грибы», пишут «мы нашли 8 кг грибов», если уж объяснять на пальцах. Но Балановская и эти элементарные вещи не знает, научная школа напрочь отсутствует.
Говоря о ДНК-генеалогии – ни к генетике, ни к генофонду она отношения не имеет. Хотя в определённой части ДНК-генеалогии рассматривают и гены, например, при рассмотрении всего генома человека, но это – специальная часть ДНК-генеалогии, и этого мы здесь касаться не будет. ДНК (дезоксирибонуклеиновая кислота) – это не только гены. Гены вообще занимают только 1,9 % последовательности ДНК. Остальные 98,1 % – длинные участки, так называемые «никчёмные». Генов там нет.[13]
«Никчёмными» эти негенные последовательности ДНК назвали по незнанию, и это название уже уходит в прошлое. По мере исследований, оказалось, что эти последовательности хранят массу информации не только «генеалогического» характера. Более того, оказалось, что они, эти «никчёмные» участки, содержат сотни, если не тысячи крошечных генов РНК, кодирующих так называемые микро-РНК, длиной всего пару десятков нуклеотидов каждый, и которые регулируют синтез белков. Но это – предмет другого повествования.
Эти негенные участки ДНК в мужской Y-хромосоме, одной из 23 хромосом, которые доставляются сперматозоидом в организм будущей матери, копируются от отца к сыну, поколение за поколением. Поскольку у матери такой хромосомы нет, то сын наследует её только от отца. Хромосомы сплетаются с материнской ДНК и образуют новую комбинированную молекулу ДНК, в которой хромосомы отца и матери перетасовываются. Перетасовываются все, кроме мужской Y-хромосомы.
Так и получается, что отец передаёт сыну эту Y-хромосому интактной, строго скопированной со своей. Свою Y-хромосому он получил от своего отца. Тот – от своего. И так далее, на тысячи, десятки тысяч и сотни тысяч лет вглубь, назад, к далёким предкам современных людей и к предкам тех далёких предков.
Если бы Y-хромосома так и передавалась из поколения в поколение действительно неизменной, толку для генеалогии от неё было бы мало. Но неизменного ничего в мире нет, особенно когда речь о копировании. Копирования без ошибок не бывает. В том числе и копирования Y-хромосомы.
Вопрос 11: О каких «экспериментальных точках», или «экспериментальных данных» идет речь при описаниях цели и задач ДНК-генеалогии? Что за «динамическая картина мутаций» в Y-хромосоме? Как это – переводить «картину мутаций» в хронологические показатели?
Результаты ДНК-тестирования мужчин в ДНК-генеалогии сводятся к двум основным показателям. Это – гаплотип и гаплогруппа. Гаплотип – это набор чисел, который является «личным номером ДНК-паспорта» любого мужчины, без исключения. А гаплогруппа, фигурально говоря, это обложка паспорта. Это – не индивидуальная, а групповая характеристика. Гаплогруппа определяет носителя гаплотипа в определенный род, или племя. У любой гаплогруппы, как у любого рода или племени, был один общий предок, патриарх. Поэтому как номер паспорта при наличии обложки является уникальным «определителем» человека, так и гаплотип в совокупности с гаплогруппой являются не менее уникальным определителем человека, при условии, что номер (гаплотип) является достаточно протяженным. Примеры дадим ниже.
Если у мужчины такого номера и паспорта нет, то это не мужчина, а женщина. Именно к такому выводу сейчас нередко приходят археологи, которые именно так наиболее надежно определяют пол скелетного остатка в древнем захоронении. Нет Y-хромосомы, нет мужского гаплотипа и мужской гаплогруппы – значит, женщина. У последних – свой ДНК-паспорт, под названием «митохондриальная ДНК», который они передают своим детям, как девочкам, так и мальчикам. А отец передает исключительно Y-хромосому, и только, разумеется, сыновьям.
Иногда бывают забавные ошибки, которые нередко встречаются в генетике, или в популяционной генетике даже в первичных данных. Так, несколько лет назад изучали геном неандертальца, и обнаружили, что его нуклеотидные последовательности соответствуют гаплогруппе R1b, что для неандертальца более чем невероятно. Потом вообще оказалось, что это самка неандертальца.
В итоге генетики поняли, в чем дело – это было загрязнение образца ДНК от современников, собирающих и обрабатывающих образцы. Вопрос был закрыт.
Итак, у каждого мужчины или мальчика есть Y-хромосома (которой, повторяю, у женщин нет), которая с большой точностью передается к сыну от отца, а тому – от своего отца, а тому – от своего, и так на протяжении сотен, тысяч, десятков и сотен тысяч лет, и все эти тысячелетия, поколение за поколением, Y-хромосома передается почти в неизменном виде. «Почти» – это потому что в мире ничего неизменного – на протяжении тысячелетий – не бывает. В Y-хромосоме тоже происходят постепенные (точнее, микроскачками) изменения, и в среднем на каждое поколение, от каждого отца к каждому сыну, в Y-хромосоме происходит одна мутация, при которой один нуклеотид (это – минимальный блок ДНК, размером примерно в молекулу обычного столового сахара) случайно, неупорядоченно превращается в другой. А в Y-хромосоме таких нуклеотидов 58 миллионов. Так что «почти в неизменном виде» – это одна мутация на 58 миллионов потенциальных вариантов, которые в остальном остаются неизменными. Каждая такая мутация наследуется практически навсегда, потому что при копировании ДНК в следующем поколении биологическая копировальная машина в клеточном ядре «не знает», как оно там было в прошлом поколении. Ее задача – копировать.
Поэтому у каждого мужчины в Y-хромосоме своя картина мутаций. У близких родственников картина мутаций похожа, потому что они, родственники, сравнительно недавно произошли от одного общего предка, и дополнительные мутации в их Y-хромосомах еще не успели образоваться. Если общий предок жил тысячелетия назад, то картина мутаций у потомков разная. Как эту картину отображают?
Отображают картину мутаций в виде так называемых гаплотипов, упомянутых выше как «личный паспорт» каждого мужчины, а именно в виде определенных последовательностей чисел, характерных для каждого человека. Чем эта последовательность длиннее, тем уникальнее гаплотип. Например, у автора этих строк гаплотип Y-хромосомы, состоящий из 111 чисел, записывается в следующем виде:
13 24 16 11 11 15 12 12 10 13 11 17 16 9 10 11 11 24 14 20 34 15 15 16
16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22
22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 31 15 9 15 12 25
27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10 18 15 20 12
24 15 12 15 24 12 23 19 11 15 17 9 11 11
Это – так называемый 111-маркерный гаплотип. Здесь первое число показывает, что в одном из маркеров, или локусов Y-хромосомы определенная последовательность нуклеотидов повторяется 13 раз. В другом маркере, который здесь показан как следующий, блок нуклеотидов повторяется 24 раза, и так далее.
Покажем для сравнения 67-маркерный гаплотип киргиза, из Киргизского Проекта FTDNA (FTDNA – это наиболее известная американская коммерческая компания, которая также ведет значительную исследовательскую работу, и ведет сотни научных и информационных проектов):
13 25 16 11 11 14 12 12 10 13 11 18 15 9 10 11 11 23 14 21 32 12 15
15 16 11 11 19 23 16 16 19 17 33 40 14 11 11 8 17 17 8 11 10 8 12 10
12 21 22 15 10 12 12 13 8 14 22 21 12 12 11 13 11 11 12 12
И еще один гаплотип, другого киргиза из того же Проекта:
13 26 16 11 11 11 12 12 10 14 11 17 15 9 10 11 11 24 14 21 31 12 15
15 16 11 11 19 23 16 16 18 17 33 40 15 11 11 8 17 17 8 11 10 8 12
10 12 21 22 15 10 12 12 13 8 13 22 21 12 12 11 13 11 11 12 12
Выделены мутации между моим гаплотипом и каждым из приведенных киргизских. Их, соответственно, 31 и 33 мутации, а между двумя киргизскими – всего 9 мутаций. Видно, что оба киргиза между собой намного более близкие родственники, чем каждый из них со мной. Уже просматривается основа для определенных выводов, особенно когда изучаются не два гаплотипа, а десятки, сотни, тысячи гаплотипов.
Здесь мутации в ряде маркеров подсчитывались специальным образом, но не будем сейчас на этом останавливаться. Эти различия можно перевести в хронологические показатели, зная среднюю скорость образования мутаций в гаплотипах, и получится, что общий предок автора этих слов и указанных киргизов жил примерно 4500 лет назад, в середине III тыс до н. э., как раз во времена арийских миграций по Русской равнине и Средней Азии, а обоих киргизов – примерно 1010 лет назад, в начале 11-го века нашей эры. Как делается такой расчет, мы покажем ниже.
Вопрос 12: Вы упомянули, что в Y-хромосоме происходит в среднем одна снип-мутация за поколение. Как это определили?
По данным разных исследователей, необратимые снип-мутации в Y-хромосоме, и, видимо, в ДНК в целом, происходят со средней скоростью между 0.5 × 10-9 и 1.0 × 10-9 на нуклеотид в год. В последнее время прошла серия работ независимых исследователей, в которых средняя скорость снип-мутаций определена как 0.78-0.82 × 10-9 на нуклеотид в год. Наконец, исследователи в компании YFull, которые занимаются расчетами скоростей мутаций в Y-хромосоме, принимают в своих расчетах величину скорости 0.8178 × 10-9 на нуклеотид за год[14], хотя такая точность определения совершенно нереальна. Поскольку вся Y-хромосома – примерно 58 миллионов нуклеотидов, и если скорость снип-мутации – 0.8178 × 10-9 на нуклеотид за год, то это составляет 0.8178 × 10-9х58 × 106 = 0.04743 на всю хромосому в год, или 1.185 на всю хромосому за 25 лет. Даже если скорость мутаций не такая точная, а, как свидетельствуют разные публикации, между 0.5 и 1.0 × 10-9, то снип-мутации происходят в среднем между 0.725 и 1.45 мутаций на всю Y-хромосому за 25 лет. То есть как ни считать, мутации в Y-хромосоме происходят со средней скоростью примерно одна мутация за поколение.
Вопрос 13: В последнее время датировки образования гаплогрупп и субкладов определяют по числу снип-мутаций между субкладами или от рассматриваемого субклада до настоящего времени. Сколько при этом принимают число лет на снип? В литературе встречаются величины от 90 до 200 лет на снип. Как такое может быть? Судя по вашим сообщениям, вы весьма критически относитесь к расчетам по снипам, предпочитая расчеты по гаплотипам. Так ли это?
Такое быть не может по разным причинам – или неправильно считают, или считают по разным фрагментам Y-хромосомы. В ответе на предыдущий вопрос было показано, что если брать для расчетов всю Y-хромосому, то одна снип-мутация происходит примерно раз в 25 лет, и эта величина еще зависит от того, какую скорость мутации принять для расчетов. Если скорость мутации будут брать от 0.5Х10-9 до 1.о × 10-9 на нуклеотид за год, то снип-мутация происходит раз в интервал времени между 34 и 17 лет. Мы уже видим, что если скорость мутации не откалибровать надежно, то точность такого метода невелика. Помимо того, точность в реальных условиях еще более низкая, потому что почти никто не секвенирует полную Y-хромосому в поисках снипов, а секвенируют фрагменты, либо небольшие, в 300–500 тысяч нуклеотидов, либо в 10 миллионов нуклеотидов (как в методе BigY), либо, реже, в 30 миллионов нуклеотидов. Но когда пишут, что секвенируют фрагмент в 10 миллионов нуклеотидов, там фрагмент легко может оказаться между 8 и 11 миллионами, и это еще оптимистическое заключение.
Давайте посмотрим, к чему это приведет. Как отмечалось выше, компания YFull принимает величину константы скорости мутации 0.8178Х10-9, в таком случае одна мутация во всей
Y-хромосоме происходит в среднем раз в 1/0.04743 = 21.08 лет. Во фрагменте в 30 миллионов нуклеотидов – раз в 41 год. Во фрагменте в 10 миллионов нуклеотидов – раз в 122 лет. Если фрагменты малые, в 300 тысяч нуклеотидов, то раз в 4075 лет. Вот и выбирайте. YFull собщает, что средний размер фрагмента Y-хромосомы, по которому они ведут расчеты, составляет 8467165 нуклеотидов (такая точность тоже смешна, ну да ладно, это у попгенетиков неисправимо). Тогда одна мутация в таком фрагменте происходит в среднем раз в 144.41 лет (это опять сообщают YFull, опять с такой точностью). Когда умножают на число снипов, к этому прибавляют еще 60 лет. Как объясняют в YFull, 60 лет – это средний возраст клиента, который к ним обращается.
Итак, если читатель не хочет разбираться в деталях, то на этом этапе можно резюмировать, что если исследователи сообщают, что анализируют (в поисках снипов) фрагменты Y-хромосомы в 10 миллионов нуклеотидов, то там на самом деле может быть восемь с половиной миллионов нуклеотидов, и если при этом считать, что скорость снип-мутации составляет именно 0.8178 × 10-9 на нуклеотид в год, то одна снип-мутация происходит раз в 144 года. На деле там, конечно, погрешность более чем солидная.
Но это еще не всё, и погрешность часто еще значительно больше. Дело в том, что снип-мутации происходят не через равные промежутки времени, а неупорядоченно. Если при этом рассматриваются цепочки снипов протяженностью десятки и сотни тысяч лет, то это аналогично рассмотрению ситуации с сотнями бросков монеты, и погрешности из-за неупорядоченности нивелируются. Но для относительно недавних снипов метод расчета очень неточный. Например, если снип образовался 750 лет назад, то в цепочке нисходящих снипов их всего 750/144 = 5 снипов, и погрешность определения времени образования, согласно формулам математической статистики, не меньше ±46 % (с 68 %-ной достоверностью) или ±92 % (с 95%ной достоверностью). В итоге погрешности у большинства датировок по снипам в таблице значительно более высокие, чем у датировок по мутациям в гаплотипах, которые будут рассматриваться ниже.
Есть еще серьезная проблема – в расчетах компании YFull часто игнорируют фактическое количество снипов, и ставят ту датировку, которая им представляется более правильной, «по понятиям». При этом они всегда постулируют, что при разветвлении снипов они образовались точно в одно и то же время, хотя это события совершенно независимые. По аналогии, если у отца двое сыновей, то их возраст далеко не всегда одинаковый, один мог родиться, когда отцу было 18 лет, другой – когда отцу было 70 лет. Такой постулат, «о равенстве возраста сыновей» часто приводит к ситуациям, когда к одному снипу от вышестоящего ведет 5 мутаций (в среднем 720 лет), к другому 20 мутаций (в среднем 2880 лет), а YFull записывает их «возраст» как одинаковый, либо 720, либо 2880 лет, выбор датировки фактически произвольный. В итоге получаются несуразные датировки.
Примеры – в переходе R1a-Y35 > YP7278 зафиксировано 9 промежуточных снипов (это приведено в таблице на сайте YFull), что соответствует 1300 лет разницы, однако датировка для обоих снипов, родительского и нисходящего, приведена как одинаковая, 4300 лет назад. В переходе CTS3402 > CTS2613 зафиксировано 17 промежуточных снипов (2450 лет разницы), однако датировка для обоих снипов в списке YFull – одинаковые 4300 лет назад, вместо 1850 лет назад для нисходящего, как должно быть (и как дает более точная датировка по гаплотипам). И так в таблицах YFull повторяется десятки и сотни раз.
Приходится на этом столь подробно останавливаться, потому что в последнее время усиленно распространяется легенда, что расчеты по снипам – значительно более точные, чем любыми другими методами. Историки могут принять эту легенду за чистую монету, и опять повторится ситуация последних 15 лет, когда практически все расчеты популяционными генетиками, опубликованные в академических журналах, были кардинально искажены, с завышениями до 300–400 %. Для расчетов на времена удаленные, как правило, более 5-10 тысяч лет назад, и тем более на 100–200 тысяч лет назад, когда число снип-мутаций исчисляется многими сотнями, расчеты по снипам действительно могут оказаться полезными, но вводимые постулаты, как равенство датировок для «параллельных» снипов, опять сводит эту пользу к нулю, если не к отрицательным величинам.
Так что да, я весьма критически отношусь к расчетам датировок по снипам, если они не подтверждены перекрестными расчетами с использованием других методов, например, по мутациям в гаплотипах, о чем речь пойдет ниже. Но часто бывает, что другие методы непригодны, или нет соответствующих гаплотипов. Тогда приходится принимать то, что есть. Но часто бывает, что совпадение расчетов по снипам и гаплотипам вполне удовлетворительное. Это придает уверенность, что в принципе подход, основанный на числе снипов, правильный, но он нуждается в доработке.
Здесь надо сказать, что попгенетики опять в своем амплуа – Балановский уже провозгласил, что метод расчетов по снипам самый точный, и ненавистные ему расчетные подходы ДНК-генеалогии можно отставить. Это опять было провозглашено без какого-либо исследования, и единственная статья, в которой Балановский этот метод использовал, дала неверные результаты. Дело в том, что Балановский в своей манере выхватил из многих вариантов лишь одну скорость мутации – 122 года на снип, без малейшего ее обоснования или проверки, и опять получил неверные датировки[15].
Вопрос 14: Что такое гаплотип, и откуда получают те числа, которые показаны при записи гаплотипов?
Эти числа называются «аллели», и показывают, сколько раз определенная (относительно короткая) последовательность нуклеотидов повторяется в Y-хромосоме ДНК человека. Например, такая последовательность: аденин-гуанин-аденин-тимин, или в сокращенном виде АГАТ, или, как чаще записывают, AGAT. Участок Y-хромосомы, в котором имеет место такой повтор, который еще называют «тандемным повтором», четко определен, и носит название DYS393 (DYS означает DNA Y-chromosome Segment, то есть “сегмент Y-хромосомы ДНК). Каждый из таких участков ДНК называется «маркером», и таких маркеров в Y-хромосоме человека примерно 2500.
В моем гаплотипе, приведенном выше, как и в гаплотипах обоих киргизов, это – первое число, равное 13. Это записывается как DYS393=13, и означает, что у всех нас в данном маркере четверка AGAT повторяется 13 раз. Вот так:
и эти повторы обрамляются уже неупорядоченными последовательностями нуклеотидов в ДНК, как показано выше.
Второе число, аллель в маркере DYS390, у нас троих у всех разное, у меня 24, у одного из упомянутых киргизов 25, у другого – 26. Это – суммарное число повторов других тандемных четверок, а именно TCTG, то есть тимин-цитозин-тимин-гуанин, и ТСТА, тимин-цитозин-тимин-аденин.
В данном случае четверка, TCTG переходит в четверку TCTA, и число повторов складывается.
То есть мы видим, что тандемные повторы состоят не только из разных нуклеотидов в разных комбинациях, и различаются не только числом повторов, но и порой разные повторы комбинируются в одном маркере. Все это создает огромное число вариантов комбинаций, и, как уже было упомянуто, в Y-хромосоме имеется примерно 2500 разных маркеров. Из них в ДНК-генеалогии используется пока не так много, немногим более ста, в редких случаях несколько сотен, как будет показано ниже. Большинство их стандартизованы, то есть записываются в стандартном виде, содержат определенное число аллелей, записанных в определенной последовательности. Ниже я продемонстрирую разные варианты гаплотипов, взяв свой за пример.
Гаплотипы ДНК выбирают так, чтобы в них маркеров было как можно больше (но все-таки чтобы оставаться в рамках практичности), и в ранних работах, примерно до 2005-го года, использовались 6-маркерные гаплотипы, как, например, такой
16 12 24 11 11 13
Это – аллели в маркерах DYS19, DYS388, DYS390, DYS391, DYS392 и DYS393. Видно, что в ранних работах маркеры в гаплотипах располагали в порядке нумерации. Но система быстро сбилась из-за ее непрактичности, потому что при добавлении новых маркеров приходилось опять перетасовывать всю цепочку гаплотипа. Поэтому до 12-маркерных гаплотипов (в 7-, 8-, 9-, 10-, 11-маркерных) наблюдается разнобой в их последовательности, а с 12-маркерных система в целом упорядочивается, и новые маркеры просто добавляются к первым 12 маркерам:
13 24 16 11 11 15 12 12 10 13 11 17
Это – маркеры DYS393, DYS390, DYS19, DYS391, DYS385a, DYS385b, DYS426, DYS388, DYS439, DYS389-1, DYS392 и DYS389-2.
Впрочем, некоторый разнобой есть и здесь. Например, последняя аллель записывается в двух вариантах – как записано выше (DYS389-2 = 17), и как сумма DYS389-1 и DYS389-2, то есть 30. На мой взгляд, лучше первый вариант, потому что со вторым часто происходит путаница с подсчетом числа мутаций. Например, если мутация в маркере DYS389-1 изменила величину аллели с 13 до 14, то сразу видно, что там всего одна мутация:
13 24 16 11 11 15 12 12 10 13 11 17
13 24 16 11 11 15 12 12 10 14 11 17
А во втором варианте записи имеем
13 24 16 11 11 15 12 12 10 13 11 30
13 24 16 11 11 15 12 12 10 14 11 31
и для неопытного глаза представляется, что там прошли две мутации.
Далее идут 17-, 19- и 23-маркерные гаплотипы, в которые имеются уже несколько рассогласований – и по порядку маркеров, и по величинам аллелей, но не будем на этом здесь останавливаться.
Далее идут 25-маркерные гаплотипы, в которых к первой 12-маркерной панели добавлена вторая, 13-маркерным панель:
13 24 16 11 11 15 12 12 10 13 11 30–16 9 10 11 11 24 14 20 34 15
15 16 16
и 37-маркерные
13 24 16 11 11 15 12 12 10 13 11 30–16 9 10 11 11 24 14 20 34 15 15
16 16–11 11 19 23 15 16 17 21 36 41 12 11
Здесь показан пример записи гаплотипов с разделительными дефисами (или тире) между панелями гаплотипов, чтобы не сбиваться при длинных, монотонных последовательностях чисел. Сейчас работа рутинно ведется с 67-маркерными гаплотипами
13 24 16 11 11 15 12 12 10 13 11 30–16 9 10 11 11 24 14 20 34 15 15
16 16–11 11 19 23 15 16 17 21 36 41 12 11–11 9 17 17 8 11 10 8 10
10 12 22 22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13
и 111-маркерными гаплотипами
13 24 16 11 11 15 12 12 10 13 11 30–16 9 10 11 11 24 14 20 34 15 15
16 16–11 11 19 23 15 16 17 21 36 41 12 11–11 9 17 17 8 11 10 8 10
10 12 22 22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13–31 15
9 15 12 25 27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10
18 15 20 12 24 15 12 15 24 12 23 19 11 15 17 9 11 11
Это все, напоминаю, гаплотип одного и того же человека, автора данной книги, все они – один и тот же «ДНК-генеалогический паспорт», только с разным разрешением, которое, естественно, тем больше, чем более протяженный гаплотип. Но наука на этом не останавливается, и, например, у того же автора определен уже 431-маркерный гаплотип:
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16
16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22
22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 31 15 9 15 12 25
27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10 18 15 20 12
24 15 12 15 24 12 23 19 11 15 17 9 11 11 10 12 15 15 10 10 8 8 9 13 7 8
10 10 13 14 14 15 31 32 11 10 9 9 8 24 8 8 8 16 22 22 24 21 23 14 16
25 28 15 15 6 11 14 15 8 14 11 12 10 11 10 10 11 11 18 10 12 10 7 10 5
8 9 5 5 11 15 8 29 6 7 10 13 11 6 7 7 7 16 10 11 16 22 23 11 12 12 10 7
12 12 13 7 3 20 18 11 11 8 9 13 13 10 11 22 12 16 13 14 11 11 12 10 12
9 13 9 12 11 12 16 7 14 12 10 9 10 4 7 7 13 13 12 11 9 11 10 11 14 8 4 8
6 11 11 16 9 11 13 19 12 12 9 10 9 9 11 11 9 9 14 14 15 9 7 10 12 14 13
14 14 12 6 32 10 11 16 8 7 17 17 11 11 6 13 12 13 11 10 7 13 12 7 12 12
7 14 17 17 11 25 8 8 12 8 8 1113 11 12 10 8 13 8 13 14 10 11 9 20 17 15
36 9 13 14 39 33 36 9 10 10 12 18 19 13 9 14 44 10 8 14 9 8 20 11 11
11 11 10 9 9 9 8 8 8 8 9 11 9 23 11 9 16 31 8 20 8 13 12 8 16 10 9 33
27 23 22 10 8 12 10 8 14 8 8 32 55 7 7 5 9 6 11 11 11 13 9 39 33 7 8
27 7 5 13 7 15 28 25 60 42 12 31 22 20 12 3 4
Таких гаплотипов в мире определено пока всего несколько десятков, так что практическая польза от них пока невелика, за исключением нескольких специальных случаев, которые будут пояснены ниже.
В академических публикациях по популяционной генетике, впрочем, пока продолжают использовать гаплотипы от 8- до 17-маркерных, и лишь в крайне редких случаях более протяженные, и это тот случай, когда «любители» далеко обогнали профессионалов. Хотя те «любители» на самом деле зачастую намного квалифицированнее профетоионалов, это просто профессионалы называют тех «любителями», чтобы не признавать свое колоссальное отставание и интеллектуальный застой в популяционной генетике. Этого вопроса мы коснемся ниже, его не обойти при изложении ДНК-генеалогии.
Вопрос 15. После изложения основ ДНК-генеалогии и ее отличий от популяционной генетики, подведите, пожалуйста, итоги по значимости ДНК-генеалогии, о том, как она появилась и какие в этой области Ваши самые значимые публикации.
Итак, речь здесь идет о новой науке, которая только создается, основы которой только закладываются в последние годы. Если точнее, то основы этой новой науки уже созданы, причем стремительно[16], и идет прогрессивное накопление экспериментального материала. Новый материал поступает потоком, ежедневно в базы данных уходят десятки и сотни новых «экспериментальных точек», которые по принципу обратной связи корректируют методологию новой науки, что приводит к уточнению методов расчета.
Имя этой науки – ДНК-генеалогия. Ее экспериментальные данные – это картина мутаций в нерекомбинантных участках мужской половой хромосомы (на самом деле – и в митохондриальной ДНК, но в этой книге речь пойдет в основном о Y-хромосоме, более информативной для исторических исследований), причем картина мутаций как в Y-хромосомах отдельных людей, так и их групп, популяций. Методология новой науки – перевод динамической картины мутаций в хронологические показатели, во времена жизни общих предков популяций, а на самом деле – общих предков древних родов и племен. То есть фактически производится расчет времен, когда в древности жили эти рода и племена[17]. Более того, расчеты показывают, как эти времена меняются от территории к территории, что может указывать на направления древних миграций[18].
Мутации, рассматриваемые в ДНК-генеалогии – это или одиночные (как правило) замены нуклеотидов в ДНК, как, например, аденин на цитозин, или цитозин на тимин, или вставки нуклеотидов, или делеции, или мутации более сложные, при которых ошибка копирующего фермента приводит к переносу в Y-хромосоме целого блока нуклеотидов, тандемного, как его порой называют. Это дает или удлинение серии таких блоков на один (редко – сразу на два-три блока), или их укорачивание. Первые мутации – SNP (Single Nucleotide Polymorphism, или в переводе «одиночные нуклеотидные вариации»), или «снипы», обычно очень стабильны, и их для ДНК-генеалогии отбирают только такие, которые случаются только один раз (два раза – максимум) за историю человечества. Поэтому они являются маркерами родов человечества. Примеры будут даны ниже.
Мутации второго типа – STR (Short Tandem Repeats, или «короткие тандемные повторы») – значительно более быстрые, и происходят в определенных участках, или локусах, или маркерах (это все синонимы) Y-хромосомы ДНК раз в несколько десятков или сотен поколений. Набор этих маркеров составляет гаплотип, примеры гаплотипов будут даны ниже. Гаплотип – это по сути цепочка чисел, показывающих число повторов в определенных маркерах.
Естественно, чем длиннее гаплотип, тем выше вероятность того, что в нем произойдет мутация. Мы уже поясняли выше, что мутация в гаплотипах – это результат ошибки в копировании блоков нуклеотидов, тех самых «коротких тандемных повторов», биологической системой копирования ДНК в клетке. Поскольку этих «коротких тандемных повторов» в Y-хросомоме многие тысячи (выше показано 431 таких повторов, и это только среди 10 миллионов нуклеотидов Y-хромосомы, этот размер определяется методологией исследования; всего же в Y-хромосоме примерно 58 миллионов нуклеотидов, или, точнее, нуклеотидных пар, но не будем здесь вдаваться в излишние подробности). Отсюда можно заключить, что таких «тандемных повторов» в Y-хромосоме может быть примерно 2500, и это, видимо, максимально возможный размер гаплотипа. Каждый «тандемный повтор», то есть маркер, мутирует, то есть копирующая система ошибается при копировании протяженных гаплотипов, с вероятностью примерно 0.00178 раз в поколение при протяженнности поколения 25 лет, или раз в 560 поколений, или раз в 14 тысяч лет. Здесь надо сделать два замечания. Во-первых, эта скорость мутации, раз в 14 тысяч лет – средняя величина, рассчитанная по большому числу маркеров. Чем короче гаплотип, тем реальная скорость мутации более отклоняется от средней величины. Во-вторых, величина поколения в 25 лет в ДНК-генеалогии называется условным поколением, она – сугубо математическая величина. Если кому-то больше нравится брать 30 лет за поколение, то вероятность мутации на 30 лет составит примерно 0.00214, или раз в 468 поколений (по 30 лет), или раз в 14 тысяч лет. Как видим, конечный результат получается точно такой же. Более подробно это будет показано ниже.
Поэтому долгие споры, которые популяционные генетики ведут уже многие десятилетия, а именно, сколько лет брать на поколение, не имеют большого смысла, да ни к чему так и не привели. Они просто не очень знакомы с понятием константы скорости мутации (k), а она в расчетах всегда помножена на протяженность поколения (t). Поэтому протяженность поколения нельзя брать произвольно, как захотим, она завязана на константу скорости мутации. Если взять 25 лет на поколение для одной константы скорости мутации, 30 лет – для другой константы, 20 лет на поколение для еще одной константы, но конечный результат получается один и тот же. Потому что это произведение (kt) калибруется по известным генеалогиям и историческим событиям.
Как было отмечено выше, мутация в каждом маркере в среднем происходит раз в 14 тысяч лет, но в гаплотипах, то есть определенных наборах маркеров, мутации происходят со следующими средними скоростями:
– в 6-маркерном гаплотипе она происходит (на весь гаплотип) в среднем раз в 135 условных поколений, или раз в 3380 лет (в этом коротком гаплотипе маркеры мутируют более медленно, чем в других гаплотипах),
– в 12-маркерном – раз в 50 поколений, или в 1250 лет,
– в 25-маркерном – раз в 22 поколения, или в 550 лет,
– в 37-маркерном – раз в 11 поколений, или в 275 лет,
– в 67-маркерном – раз в 8 поколений, или в 200 лет,
– в 111-маркерном – раз в 5 поколений, или в 125 лет,
– в 431-маркерном гаплотипе – примерно раз в поколение, или, точнее, раз в 33 года.
Ясно, что мутаций в протяженных гаплотипах будет больше, чем в коротких за тот же промежуток времени, и изучение истории популяций, принимая в расчет число мутаций, случившихся со времени жизни общего предка популяции, будет точнее.
Поясним это на простом примере. У автора этих строк есть коллега, родом из Белоруссии, и, как показали исследования, мы с ним принадлежим не только к одному роду, то есть не только к одной гаплогруппе (это будет пояснено ниже), но и к одному славянскому племени. Мы не знаем точно, как оно называлось в древности – поляне, или древляне, или вятичи, или кривичи (а кривичи были как минимум смоленские, изборские и северные), или дреговичи, полочане, ильменские словене, радимичи, северяне, волыняне или бужане, тиверцы, уличи, белые хорваты или какие другие. В ДНК-генеалогии наше племя (или племена) носит название «восточно-карпатская ветвь гаплогруппы R1a», и дальше идут символы, детализирующие восточно-карпатскую ветвь на много уровней, на которые расходилось это племя, продолжая ДНК-линию патриарха племени, то есть сохраняя в своей Y-хромосоме специфические, уникальные мутации патриарха. Естественно, чем древнее жил патриарх, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с его гаплотипом.
Так вот, в 6-маркерном формате наши с коллегой из восточнокарпатской ветви гаплотипы выглядят так:
16 12 24 11 11 13
16 12 25 11 11 13
Между ними – одна мутация, что соответствует 1/0.0074 = 135 → 156 условных поколений, или 3900 лет, то есть наш общий предок жил примерно 3900/2 = 1950 лет назад. Надо отметить, что 6-маркерные гаплотипы весьма неточны, для показа чего и служит этот иллюстративный пример. Здесь 0.0074 мутаций на гаплотип – контанта скорости мутации для 6-маркерных гаплотипов, стрелка – табличная поправка на возвратные мутации[19].
В 12-маркерном формате:
13 24 16 11 11 15 12 12 10 13 11 30
13 25 16 11 11 14 12 12 10 13 11 29
Здесь между двумя гаплотипами уже три мутации, что дает 3/0.02 = 150 → 176 условных поколений, или 4400 лет, то есть общий предок жил примерно 2200 лет назад. Здесь 0.02 мутаций на гаплотип – контанта скорости мутаций для 12-маркерных гаплотипов. Вариация датировок, примерно 13 %, находится в пределах обычной погрешности расчетов, хотя гаплотипы короткие, мутаций мало.
В 25-маркерном формате:
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16 16
13 25 16 11 11 14 12 12 10 13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16
Здесь между двумя гаплотипами 9 мутаций (мутации между последними четверками гаплотипов считаются по определенным правилам, для так называемых мультикопийных маркеров, там всего две мутации), что дает 9/0.046 = 196 → 242 условных поколений, или 6050 лет, то есть общий предок жил примерно 3025 лет назад. Здесь 0.046 мутаций на гаплотип – контанта скорости мутаций для 25-маркерных гаплотипов. Вариация датировок по первым трем форматам гаплотипов уже заметна, и достигает 55 % (1950, 2200, и 3025). Может показаться, что чем длиннее гаплотипы, чем древнее общий предок, но это не так. В 37-маркерном формате
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15
16 16 11 11 19 23 15 16 17 21 36 41 12 11 13 25 16 11 11 14 12 12 10
13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16 11 11 19 23 15 16 17
19 35 42 13 11
между двумя гаплотипами 14 мутаций, что дает 14/0.09 = 156 → 184 условных поколений, или 4600 лет, то есть общий предок жил примерно 2300 лет назад. Здесь 0.09 мутаций на гаплотип – контанта скорости мутаций для 37-маркерных гаплотипов. Вариация датировок по первым четырем форматам гаплотипов (1950, 2200, 3025, 2300 лет до общего предка) уже начала стабилизироваться.
В 67-маркерном формате
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16
16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22
22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 13 25 16 11 11 14
12 12 10 13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16 11 11 19 23
15 16 17 19 35 42 13 11 11 8 17 17 8 12 10 8 10 10 12 22 22 15 10 12
12 13 8 14 22 21 12 12 11 13 11 11 12 13
между двумя гаплотипами 19 мутаций, что дает 19/0.12 = 158 → 187 условных поколений, или 4675 лет, то есть общий предок жил примерно 2340 лет назад. Здесь 0.12 мутаций на гаплотип – контанта скорости мутаций для 67-маркерных гаплотипов. Вариация датировок по первым пяти форматам гаплотипов (1950, 2200, 3025, 2300, 2340 лет до общего предка) еще более стабилизировалась.
В 111-маркерном формате
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16
16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22
22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 31 15 9 15 12 25
27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10 18 15 20 12
24 15 12 15 24 12 23 19 11 15 17 9 11 11 13 25 16 11 11 14 12 12 10 13
11 29 15 9 10 11 11 25 14 20 32 12 15 15 16 11 11 19 23 15 16 17 19
35 42 13 11 11 8 17 17 8 12 10 8 10 10 12 22 22 15 10 12 12 13 8 14
22 21 12 12 11 13 11 11 12 13 31 14 9 15 12 25 27 19 12 12 12 12 10 9
12 11 10 11 11 30 12 14 25 13 9 10 19 15 20 11 23 16 12 15 25 12 23
19 11 15 17 9 11 11
между двумя гаплотипами 26 мутаций, что дает 26/0.198 = 131 → 150 условных поколений, или 3750 лет, то есть общий предок жил примерно 1875 лет назад, в начале нашей эры. Здесь 0.198 мутаций на гаплотип – контанта скорости мутаций для 111-маркерных гаплотипов.
Заметим, что чем длиннее гаплотип, тем более стабилизуется константа скорости мутации в расчете на маркер. Для 67-маркерных гаплотипов она равна 0.12/67 = 0.00179 мутаций на маркер, для 111-маркерных гаплотипов она равна 0.198/111 = 0.00178 мутаций на маркер, и если для 409 маркерных гаплотипов она тоже равна 0.00178 мутаций на маркер, то скорость мутаций равна 0.00178x409 = 0.728 мутаций на весь гаплотип. Проверим это. В 409-маркерных гаплотипах между гаплотипами двух упомянутых коллег 95 мутаций
10 12 15 15 10 10 8 8 9 13 7 8 10 10 13 14 14 15 31 32 11 10 9 9 8 24
17 17 8 8 8 16 22 22 24 21 23 14 16 25 28 15 15 6 11 10 14 15 8 14 11
12 10 11 10 10 11 11 18 10 12 10 7 10 5 8 9 5 5 11 15 8 29 6 7 10 13 11
6 7 7 16 10 11 16 22 23 11 12 12 10 7 12 12 13 7 3 20 18 11 11 8 9 13 13
10 11 22 12 16 13 14 11 11 12 10 12 9 13 9 12 11 12 16 7 14 12 10 9 10
4 7 7 13 13 12 11 9 11 10 11 14 8 4 8 6 11 11 16 9 11 13 19 12 12 9 10 9
9 11 11 9 9 14 14 15 9 7 10 12 14 13 14 14 12 6 32 10 11 16 8 7 17 17 11
11 6 13 12 13 11 10 7 13 12 7 16 11 15 12 13 30 24 11 11 13 12 12 9 11
12 14 11 10 12 12 15 12 12 20 34 8 12 11 15 16 9 10 11 11 12 15 15 16
16 7 14 17 17 11 25 8 8 8 12 8 8 23 11 15 13 11 12 12 10 9 15 15 8 13 8
13 15 12 14 10 11 17 10 9 12 20 17 15 36 21 9 10 13 10 14 39 33 36 9
11 12 12 13 11 10 10 12 12 18 19 13 9 14 44 10 12 8 14 24 9 12 15 8 15
20 11 11 21 11 11 10 10 17 9 9 9 9 8 8 8 8 9 12 8 11 15 10 9 23 11 16 9
16 31 8 20 8 13 12 8 16 10 9 33 27 23 22 10 9 8 23 11 12 11 10 11 10 8
11 14 8 8 20 32 55 7 7 5 9 6 11 11 11 13 9 39 33 7 8 27 7 5 13 7 15 28
25 31 60 18 42 25 24 12 31 22 20 12 12 3 4 14 11 10 12 15 15 10 10
8 8 9 13 7 8 10 10 13 14 14 14 31 32 11 10 9 9 8 24 17 17 8 8 8 8 23
23 24 21 22 15 15 25 28 15 16 6 11 10 13 14 8 14 11 12 10 11 10 11
11 11 18 10 12 11 7 10 5 8 9 5 5 11 16 8 29 6 7 10 13 11 6 7 7 16 10 10
16 22 23 11 11 13 10 7 12 12 13 7 3 19 20 10 11 8 9 13 12 10 11 22 11
15 14 14 11 11 12 10 12 9 12 9 12 12 11 16 7 14 13 10 9 9 4 7 7 13 14
12 11 9 11 10 11 14 8 4 8 6 11 11 16 9 11 13 19 12 12 9 10 9 9 11 11 9 9
9 14 14 14 9 7 10 12 14 13 14 14 12 6 32 10 11 16 8 7 17 17 11 11 6 12
12 14 11 10 7 13 12 7 16 11 14 12 13 29 25 11 11 13 12 12 9 11 12 14 11
10 13 12 14 12 12 20 32 8 12 11 15 15 9 10 11 11 11 12 15 16 15 7 14
17 16 11 25 8 8 8 12 8 8 22 11 14 13 11 12 12 10 9 15 15 8 13 8 13 16
12 15 10 11 17 10 9 12 19 14 15 38 21 9 10 16 10 13 39 34 35 9 11
11 12 13 12 10 10 12 12 17 20 13 9 14 43 12 12 8 14 25 9 12 15 8 15
21 11 11 19 11 11 10 10 17 9 8 9 9 8 8 8 8 9 12 8 11 15 10 9 22 11 16
9 15 32 7 19 8 13 12 8 18 10 9 33 28 23 22 10 9 8 23 11 12 11 10 11
10 8 11 14 8 8 19 32 48 7 7 5 9 6 11 11 11 13 9 39 32 7 8 27 7 5 12 7
15 29 22 31 45 19 42 25 23 12 32 22 20 12 11 3 4 14 11
то есть дистанция между ними равна 95/0.728 = 130 → 149 условных поколений, или 3725 лет, и общий предок жил примерно 1860 лет назад. Это практически полностью совпадает с 1875 лет до общего предка, что рассчитано по 111-маркерным гаплотипам. Но и другие оценки на самом деле находятся в пределах погрешностей расчетов. Давайте рассмотрим это более детально. Если формально рассчитать погрешности, то данные для времени жизни нашего с коллегой общего предка (из восточно-карпатской ветви гаплогруппы R1a) выглядят следующим образом:
6-маркерные гаплотипы, 1950±1950 лет назад
12-маркерные 2200±1290 лет
25-маркерные 3025±1050 лет
37-маркерные 2300±660 лет
67-маркерные 2300±575 лет
111-маркерные 1875±510 лет
409 маркерные 1860±270 лет назад
Все эти данные не противоречат тому, что наш с ним общий предок жил в начале нашей эры, но с укорачиванием гаплотипа погрешность определения растет.
Надо сказать, что здесь даются упрощенные примеры, потому что по двум гаплотипам расчеты обычно не ведут, ведут по десяткам и сотням гаплотипов, если таковые есть в наличии, рассчитывают математические погрешности в определяемых цифрах, и т. д. В таких случаях погрешности расчетов приближаются к плюс-минус 10 % от определяемой величины. Здесь только иллюстрируется принцип расчета.
Ясно, что у протяженных гаплотипов 111-маркерных гаплотипов разрешение лучше (400-маркерные гаплотипы пока крайняя редкость). Но их определять дороже, чем более короткие, поэтому в академических исследованиях, при постоянной нехватке денежных средств, приходится работать с более короткими гаплотипами. Длинные гаплотипы определяют в коммерческих компаниях, обычно персонально, каждый для себя, и передают, как правило, в общественные базы данных. Сейчас в общественных базах данных – сотни тысяч гаплотипов, и базы прирастают многими гаплотипами ежедневно.[20]
Несколько опережая изложение в данной Части, сообщим, что примеры характерных 6-маркерных гаплотипов ветвей гаплогруппы R1a (как правило, славянских ветвей, выходцев с Русской равнины) следующие:
16 12 25 11 11 13 Центрально-евразийская ветвь
16 12 25 11 11 13 Ветвь Русской равнины
16 12 25 11 11 13 Северо-евразийская ветвь
16 12 25 11 11 13 Западная евразийская ветвь
16 12 25 11 11 13 Балтийская ветвь
16 12 25 11 11 13 Восточно-карпатская ветвь
16 12 25 11 11 13 Младшая арийская ветвь (индоарии)
16 12 25 11 11 13 Арабская ветвь (потомки митаннийских ариев)
16 12 25 11 11 13 Иранская ветвь
16 12 25 10 11 13 Центрально-европейская ветвь
16 12 25 10 11 13 Балто-карпатская ветвь
16 12 24 11 11 13 Юго-восточная (арийская) ветвь
15 12 25 10 11 13 Западно-карпатская ветвь
15 12 25 11 11 13 Северо-европейская ветвь
17 12 25 11 11 13 Северо-карпатская ветвь
17 12 25 10 11 13 Восточно-славянская ветвь
17 12 24 11 11 13 Младшая центрально-евразийская ветвь
Мы видим, что ветви настолько близкие по происхождению, что первые 9 гаплотипов из 17 в 6-маркерном формате не разделяются. Только в некоторых случаях можно условно определить, к какому наследственному ДНК-роду, то есть гаплогруппе, относятся ветви гаплогруппы R1a. Но разница между ветвями тем больше, чем протяженнее гаплотипы. Обычно в ДНК-генеалогии стараются работать с 67- и 111-маркерными гаплотипами.
Гаплогруппа – это род, который почти во всех указанных примерах в гаплогруппе R1a у славян имеет общего предка примерно 4900 лет назад, у отдельных ветвей – от 5200 лет назад (у предковой арийской ветви) до 2000 лет назад и меньше, то есть начинается только в новой эре. Ниже о родах-гаплогруппах будет пояснено значительно более подробно.
Как мы покажем ниже, гаплотипы, а именно числа в них, называемые аллели, напрямую связаны с хронологией древних миграций людей, переходами людей на новые места, событиями прошлого – войнами, климатическими катаклизмами, эпидемиями, в общем, со всем тем, что так или иначе влияло на численность популяций человека в определенные времена и на определенных территориях. Например, расчеты могут показать когда древние арии появились на Русской равнине, когда они появились в Индии, Иране, Афганистане, на Ближнем Востоке, в Европе – потому что эти события приводили к появлению на этих территориях и в те времена общих предков популяций, которые разрастались вплоть до нашего времени, образуя «кусты» гаплотипов со всеми мутациями в них, то есть изменениями чисел в маркерах.
Столь относительно небольшое время до общего предка двух наших коллег из восточно-карпатской ветви[21], около двух тысяч лет назад (см. выше), нашло объяснение при более глубоком исследовании – оказалось, что они оба по предкам принадлежат не только к «ветви R1a Русской равнины» и несут необратимые метки в Y-хромосоме, характерные для этой ветви (это – метка под названием Z280, время образования примерно 4900 лет назад), но и более специфические «нижеследующие» метки, которые в классификации имеют названия CTS1211 (время образования примерно 4300 лет назад), CTS3402 (время образования примерно 3800 лет назад), Y33 (время образования примерно 3600 лет назад), CTS8816 (время образования примерно 3500 лет назад), далее Y2902 (время образования примерно 2100 лет назад), которая и маркирует восточно-карпатский род. Вот от предка этого рода (или, может, на ступеньку ниже, пока не идентифицированного) и расходятся гаплотипы наших двух коллег, насчитывая между ними 26 мутаций в 111-маркерных гаплотипах, и 95 мутаций в 409-маркерных гаплотипах.
Итак, кроме гаплотипов (и обратимых мутаций в них) наши ДНК несут практически необратимые метки, называемые «снипы» (см. выше, SNP), которые фактически помечают рода и племена, которые, как правило, состоят из потомков одного древнего общего предка, патриарха рода. Если племя «составное», то ветви племени, происходящие из разных родов, легко выявляются по гаплотипам. Вполне возможно, что древним племенем, из которого вышел общий предок двух наших коллег, гаплотипы которых мы рассмотрели выше, и которое получило условное название «восточно-карпатская ветвь», окажется одно из хорошо нам известных древнеславянских племен, но пока соответствующей «калибровки» не проведено. Мы пока не знаем, какие у тех древнеславянских племен были гаплотипы и субклады, но скоро непременно узнаем, при анализе ДНК их ископаемых костей.
Расчеты, приведенные выше, оказались возможными, потому что уже показано и доказано, что мутации в маркерах происходят в основном (или исключительно) неупорядоченно, и к ним оказалось возможным применять правила и подходы химической кинетики, или биологической кинетики, кому какой термин больше нравится – суть одна. Маркеры мутируют по законам кинетики первого порядка, других закономерностей пока не обнаружено. Это означает, что каждому маркеру свойственна определенная константа скорости мутации, и каждому гаплотипу (состоящему, как мы уже знаем, из набора маркеров) – тоже свойственна определенная средняя константа скорости мутации, равная сумме констант скоростей мутаций отдельных маркеров. Поэтому чем древнее общий предок популяции, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с ним, тем больше поколений (и лет) отделяет современных потомков от их общего предка, и это число поколений (и лет) рассчитывается методами ДНК-генеалогии.
Поскольку ДНК-генеалогия – наука новая, коротко опишем ее историю, и проиллюстрируем ее надежность и обоснованность. Иначе мы рискуем, что читатель отнесется к ней с недоверчивостью и скептицизмом – мало ли что кто может напридумывать…
ДНК-генеалогия заявила о себе как о новой научной дисциплине всего восемь лет назад, в 2008 году. Начало было положено обширным анализом в рамках новой науки в то время протяженных (25-маркерных) гаплотипов гаплогруппы R1a Y-хромосомы европейского мужского населения, с расчетом времен жизни общих предков по странам и регионам (результаты были опубликованы в третьем выпуске журнала «Вестник Российской Академии
ДНК-генеалогии» в августе 2008 года). Было показано, что мужское население (гаплогруппы R1a) современной Германии имеет общего предка примерно 4600 лет назад, и базовый (предковый) гаплотип его был следующий:
13 25 16 10 11 14 12 12 10 13 11 30 15 9 10 11 11 24 14 20 32 12 15
15 16
25 ноября того же года, то есть через три месяца, вышла статья Haak et al.[22], в которой были описаны ископаемые гаплотипы гаплогруппы R1a, найденные в местечке Эулау, Германия, с датировкой 4600 лет назад. Ископаемые гаплотипы имели вид
13/14 25 16 11 11 14 X X 10 12/13 X 30 14/15 X X X X X 14 19 X
X X X X
(двойные числа в ископаемых гаплотипах – это те, которые точно определить не смогли, здесь возможны варианты). Знаки X указывают на пропущенные аллели в ископаемых гаплотипах. Только две аллели (числа в гаплотипах выше) различались на один шаг, 10 и 11 в четвертом положении (DYS391), и 19 и 20 ближе к концу гаплотипа (DYS 448). Это вполне естественно, никто не мог утверждать, что найденные в захоронении останки принадлежали именно первопредку «германских» R1a, тем более что там была целая семья. Две мутации разницы по расчетам в рамках ДНК-генеалогии дают всего несколько сотен лет расстояния между ними, что укладывается в диапазон погрешности расчетов[23].
Со времени этого первого положительного испытания и демонстрации практического совпадения расчетов и археологических датировок, то есть с лета 2008 года, и начался отсчет новой науки ДНК-генеалогии.
Продолжая пример, покажем, как проводился расчет и на основании чего. В те времена, 2008-й год, в академической литературе использовались в основном гаплотипы от 6- до 10-маркерных, были известны 12-маркерный (в номенклатуре компании FTDNA, что расшифровывается как Family Tree DNA) и 17-маркерный гаплотип, который был введен в практику в 2006 году, но для хронологических расчетов они практически не использовались. Короткие же гаплотипы обрабатывались популяционными генетиками с применением «популяционной» скорости мутации, которая была ужасающе неверна, и завышала датировки обыкновенно на 250–350 %[24].
В подходе ДНК-генеалогии 2008 года строилось дерево гаплотипов для проверки на общую симметричность, то есть на отсутствие выраженных ветвей. Принципы построения подобных деревьев будут объяснены ниже. Сейчас можно пояснить, что выраженные ветви на дереве гаплотипов означают, что у них был свой отдельный общий предок, и его нужно датировать отдельно, разделяя ветви. Иначе получится «два землекопа и две трети». Иными словами, если в относительно недавнее время некто из данного рода (отраженного на дереве) дал особенно обильное потомство – например, передвинулся в дальние благодатные края, без войн и эпидемий, то дерево окажется гипертрофированным, та «благодатная» ветвь со своим общим предком (тот «некто», который передвинулся в дальние края) будет резко выделяться на дереве, и такое дерево нельзя усреднять по мутациям «поперек ветвей». Грамотный анализ дерева покажет, что, например, патриарх всего дерева жил 2500 лет назад, а этот «некто», основатель отдельной ветви, жил всего 600 лет назад. Так и надо представлять данные.
Рис. 1. Дерево из 67 гаплотипов современных немцев гаплогруппы R1a в 25-маркерном формате (Клёсов, 2008)[25].
Если же усреднять поперек всего дерева, то получится, что якобы общий предок всего дерева жил, например, 1200 лет назад (или любое число между 2500 и 600 лет назад). Как видим, этот «общий предок» оказывается фантомным, и такие некорректно полученные результаты искажают выводы работы. К сожалению, так обычно работают популяционные генетики. Именно так, обрабатывая большую серию гаплотипов евреев, они получили якобы возраст якобы общего предка современных евреев (гаплогруппы J1) как 3200 лет назад, и объявили, что это время исхода евреев из Египта (точнее, когда жил Аарон, первосвященник). На самом деле в их исходных данных было две серии гаплотипов, с общими предками 4000 и 1000 лет назад, но авторы работы на ветви гаплотипов не смотрели [26].
Возвращаемся к дереву немецких гаплотипов образца 2008 года (рис. 1). Ниже будет показано, как получаются такие деревья и как их понимать. Здесь отметим, что дерево на рис. 1 показывает общую симметричность (множество мелких ветвей в нем можно анализировать по отдельности, но опыт показывает, что итоговый результат будет практически такой же), и его можно количественно обрабатывать как единую систему, то есть что все 67 гаплотипов происходят от одного общего предка. На все 67 гаплотипов в 12-маркерном формате имелось 208 мутаций от приведенного выше базового гаплотипа, и в 25-маркерном формате – 488 мутаций. В первом случае получаем 208/67/0.02 = 155^183 условных поколений (по 25 лет) от общего предка (напомним, что стрелка указывает на поправку на возвратные мутации), то есть 4575±560 лет до общего предка. Во втором случае, для 25-маркерных гаплотипов, получаем 488/67/0.046 = 158 ^187 условных поколений, то есть 4675±510 лет до общего предка. Как видим, совпадение почти абсолютное для расчетов по 12- или 25-маркерным гаплотипам. Надо сказать, что уже в первом выпуске Вестника, в июне 2008 года, проводились многочисленные расчеты для 37- и 67-маркерных гаплотипов, что тогда было неслыханно. Результаты всех этих расчетов верны до настоящего времени.
Надо сказать, что неопытный читатель тут же запротестует, что, мол, как можно по всей Германии, или любому другому региону судить по каким-то 67 гаплотипам, а там живут миллионы человек. Эта тема была подробно, с экспериментальными данными проанализирована в ДНК-генеалогии, и объяснена в ответе на Вопрос 37, где был задан риторический встречный вопрос – чтобы понять, что море соленое, нужно ли пробовать воду из всех бухточек? А как же химики делают анализ растворов, беря пробу всего лишь в долю миллилитра из ведра, цистерны, озера? Когда делают анализ крови, что, всю кровь из вас выкачивают? Нет. Значит, вопрос о размере пробы поставлен некорректно. Вопрос на самом деле сводится к тому, равномерно ли перемешана система, чтобы по малой пробе, или выборке, судить о всей системе.
Рис. 2. Дерево из 286 гаплотипов современных немцев гаплогруппы R1a в 67-маркерном формате (база данных IRAKAZ-2015). Три гаплотипа внизу (номера 1, 2, 3) относятся к древнейшему субкладу гаплогруппы, R1a-M420, и в расчеты (см. текст) не включались. Все остальные гаплотипы относились к субкладу М417 (см. диаграмму) и нижестоящим субкладам (на диаграмме не показаны, их несколько десятков). Расчеты проводили на калькуляторе Килина-Клёсова, поскольку ручной расчет системы с более чем 22 тысячи аллелей слишком трудозатратен.
Продолжая это рассмотрение, рассмотрим выборку по Германии уже 2015 года. Теперь в ней 286 гаплотипов в 67- и 65 гаплотипов в 111-маркерном формате (база данных IRAKAZ-2015). Выше – дерево 67-маркерных гаплотипов.
В подписи к рис. 2 для иллюстрации приведена «лесенка» нескольких субкладов гаплогруппы R1a, родительской которых является гаплогруппа R (ее снип – М207, то есть это индекс характерной и уникальной мутации в Y-хромосоме ДНК, которую (мутацию) несут все потомки первопредка гаплогруппы R. Через тысячелетия (в данном случае примерно через 10 тысяч лет) один из потомков первопредка гаплогруппы R получил мутацию М173 (очередной снип), и эта гаплогруппа, которую это потомок основал, став ее патриархом, в классификации называется R1. Она возникла (путем образования мутации М173) примерно 30 тысяч лет назад. Далее, примерно 20 тысяч лет назад, возникла гаплогруппа R1a (путем образования мутации/снипа М420), это произошло, видимо, в Южной Сибири, на Алтае. Три носителя данного снипа были найдены в Европе, в Германии, и они попали на дерево гаплотипов на рис. 6, под номерами 1, 2 и 3. Их последующие потомки – носители субкладов R1a1, R1a1a1, R1a1a, и так далее, на десятки уровней вниз.
Возвращаемся к дереву гаплотипов на рис. 2. Общий предок всех 67-маркерных гаплотипов дерева жил 4848±415 лет назад, всех 67- и 111-маркерных гаплотипов – 4294±298 лет назад, при округлении получаем 4800±400 и 4300±300 лет назад. Среднюю величину можно не брать, и так видно, что она практически равна полученным ранее, в 2008 году, и с совершенно другой выборкой в Германии 4575±560 лет и 4675±510 лет до общего предка, расчитанным по 12- и 25-маркерным гаплотипам.
Таким образом, обе выборки – 2008 и 2014 гг в Германии являются вполне репрезентативными для целей настоящего исследования.
Помимо этого, в ДНК-генеалогии введен принципиально новый метод для расчетов хронологии, основываясь на картине мутаций ДНК- так называемый логарифмический метод. Покажем его эфективность на примере, приведенном выше, для серии из 67 гаплотипов гаплогруппы R1a из Германии (см. рис. 2). В 12-маркерном формате из этой серии всего три гаплотипа идентичны друг другу, значит, это и есть базовые, то есть предковые гаплотипы (хотя для столь малого числа базовых гаплотипов не исключена ошибка в их отнесении к предковым, потому они и называются базовыми, а не буквально предковыми). Получаем: [ln(67/3)]/0.02 = 155 → 183 условных поколений, то есть примерно 4575 лет до общего предка всей серии. Расчет по мутациям, которых в этой серии было 208 (см. выше), дает 208/67/0.02 = 155→183 условных поколений (по 25 лет) от общего предка, то есть 4575±560 лет до общего предка. Совпадение получилось практически абсолютным, но это в данном расчете случайно, потому что чисто статистически в данной серии могли оказаться как 2, так и 4 базовых гаплотипа, и погрешность при таких малых количествах базовых гаплотипов велика. Тем не менее, логарифмический (без подсчета мутаций) и линейный (с подсчетом мутаций) методы расчетов показывают, что серия гаплотипов вполне подходит для расчетов, и что общий их предок действительно жил примерно 4600 лет назад.
Но для 25-маркерных гаплотипов при таком малом числе гаплотипов и таком довольно удаленном общем предке расчет по логарифмическому методу уже невозможен. Даже два базовых 25-маркерных гаплотипа сохраняются всего лишь на протяжении [ln(67/2)]/0.046 = 76 → 83 условных поколений, то есть примерно 2075 лет. После этого и двух базовых гаплотипов не остается. Но даже отсюда можно – просто на взгляд, без расчетов – получить граничную информацию о времени жизни общего предка серии гаплотипов, в данном случае – больше 2100 лет назад. Здесь 0.02 и 0.046 – константы скорости мутаций для 12- и 25-маркерных гаплотипов.
Чем больше по численности серия гаплотипов, происходящих от одного предка, тем точнее расчет времени жизни этого предка. И тем больше экономия времени при расчетах, поскольку логарифмический метод не требует подсчета числа мутаций в гаплотипах. Например, из 2000 12-маркерных гаплотипов субклада R1b-L21 114 гаплотипов являются базовыми, то есть идентичными друг другу. Это дает [ln(2000/114)]/0.02 = 143 → 167 условных поколений, или 4175±570 лет до общего предка. Расчет по мутациям (для 67-маркерных гаплотипов) дает 4325±350 лет до общего предка. Разница между логарифмическим и линейным (то есть по мутациям) методами расчета дает всего лишь 3.6 % разницы, хотя погрешность расчетов ее увеличивает. Если округлить полученные величины с учетом погрешностей до 4200 и 4300 лет до общего предка, разница между ними становится равной всего лишь 2.4 %.
Другой подобный пример – из 2000 12-маркерных гаплотипов субклада RW-Z280 базовыми являются 88 гаплотипов. Мы уже видим, что R1a-Z280 заметно старше, чем R1b-L21 (см. предыдущий абзац). Действительно, это дает [ln(2000/88)]/0.02 = 156 → 184 условных поколений, или 4600±б70 лет до общего предка. Расчет по мутациям (для 67-маркерных гаплотипов) дает 4825±320 лет до общего предка (см. таблицу выше). Разница между логарифмическим и линейным (то есть по мутациям) методами расчета дает всего 4.9 % разницы. Если округлить полученные величины с учетом погрешностей до 4600 и 4800 лет до общего предка, разница между ними становится равной 4.3 %. Для 25-маркерных гаплотипов базовых в серии из 2000 R1a-Z280 остаются только два базовых, что дает [ln(2000/2)]/0.046 = 150 → 176 условных поколений, или примерно 4400 лет до общего предка. Погрешность там велика, поскольку там, где есть только два базовых гаплотипа, легко могли остаться один или три. Но видно, что закономерности в целом соблюдаются.
Как мы видим, мутации в гаплотипах потомков расходятся от предкового гаплотипа как круги по воде, число мутаций легко рассчитывается, и они подчиняются довольно простым количественным закономерностям. Для кругов на воде, расходящихся от места, куда был брошен камень, легко рассчитать, когда был брошен камень, если знать скорость распространения волны и место нахождения круговой волны в данный момент времени. Чем больше прошло времени – тем дальше круги ушли, тем больше они разошлись. Так и в гаплотипах – чем больше время, прошедшее от общего предка, тем больше мутаций накопилось в гаплотипах его потомков. Число этих мутаций связано с временем, прошедшим от общего предка, с числом гаплотипов в серии, и с константой скорости мутации в гаплотипах, и выражается простой формулой: n/N = kt, где n – число мутаций в серии из N гаплотипов, k – константа скорости мутации (в числе мутаций на гаплотип за условное поколение, равное 25 лет), t – число условных поколений, с табличной поправкой на возвратные мутации[27]. На сотнях и тысячах примеров показано, что эта формула работает при любом числе гаплотипов и мутаций в них, и при любом времени, прошедшем от общего предка рассматриваемых гаплотипов.
Однако при очень больших временах, более 10–20 тысяч лет, и особенно более 100 тысяч лет, нужно использовать гаплотипы с «медленными» маркерами, то есть с малыми константами скоростей мутаций, и тем самым снижать число мутаций и число возвратных мутаций. По аналогии, вряд ли целесообразно изучать скорости радиоактивного распада элементов со временами полураспада в тысячелетия, используя секундомер. Или пытаться изучать круги на воде за километры от места, куда был брошен камень, для этого нужно значительно более мощное воздействие. Как всегда, нужен конкретный анализ в конкретной ситуации, единых подходов на все случае жизни не бывает. Варианты конкретного анализа в конкретных ситуациях и рассматривает ДНК-генеалогия. Некоторые ситуации и расчеты мы расмотрим ниже.
Как мы видим, мутации в ДНК-генеалогии – это не только единичные необратимые мутации-снипы, описанные выше, которые определяют гаплогруппы и субклады, но и обратимые мутации, меняющие числа повторов, или аллели, в гаплотипах. В русскоязычной литературе их называют просто «мутации», с пониманием, что это не те мутации (в генах), которые обычно возникают под действием радиации. Переход числа повторов в маркере Y-хромосомы от 25 к 24 или 26 (или наоборот) имеет совершенно другую природу, чем «поломка» гена. Такой переход является следствием спонтанной ошибки ДНК-копирующей «биологической машины», это процесс первого порядка с точки зрения физико-химической кинетики, он не зависит от внешних воздействий. О процессах первого порядка будет рассказано ниже.
Помимо того, что в 2008 году ДНК-генеалогия прошла проверку на реальных (ископаемых) гаплотипах, показав ту же хронологию, в том же 2008 году, в июне, вышел первый выпуск Вестника, который позже стал международным. В первом выпуске были две больших статьи – «Основные правила ДНК-генеалогии» (54 страницы) и «Происхождение евреев с точки зрения ДНК-генеалогии» (179 страниц). С тех пор вышло 73 выпуска Вестника, общим объемом более 15 тысяч страниц, все выпуски в открытом доступе (http://dna-academy.ru/proceedings/, www.anatole-klyosov.com). Со второго выпуска (июль 2008) в разделе «Обращения читателей и персональные случаи ДНК-генеалогии» публикуются ответы на письма читателей из разных стран мира. До сегодняшнего выпуска опубликованы персональные истории в виде ответов на 249 писем читателей. Авторы Вестника – в основном российские специалисты и любители ДНК-генеалогии, но также специалисты из США, Италии, Франции, Словении, Сербии, Италии, Германии, Бельгии, Шотландии и других стран. Помимо этого, в материалах Академии, которая официально утверждена в федеральных органах РФ в июле 2015 года, публикуются персональные интерпретации гаплотипов и снипов для людей, подавших на рассмотрение данные тестирования своих ДНК.
С того же 2008 года опубликованы 25 научных статей по ДНК-генеалогии в академических журналах (21 на английском языке, одна – в старейшем российском академическом журнале «Биохимия»), и три – в журнале «Исторический Формат») вышли 8 книг по ДНК-генеалогии (7 на русском языке и одна на сербском, в Белграде), и 112 научно-популярных статей по ДНК-генеалогии, из них 80 статей на Переформате – сайте, который выпускается профессиональными историками (http://pereformat.ru/klyosov).
Научные статьи в области ДНК-генеалогии публиковались в журналах Human Genetics (2009), J. Gen. Genealogy (2009), Advances in Anthropology (2011–2014), Биохимия (2011), Eur. J. Human Genetics (2014), Frontiers in Genetics (2014), Исторический Формат (2015). Весной 2013 г. автор настоящей книги получил приглашение быть главным редактором журнала Advances in Anthropology («Успехи антропологии»), и сделал его профильным журналом по ДНК-генеалогии (наряду, конечно, с публикациями авторов по разным направлениям антропологии). Первой статьей в «Успехах антропологии» была статья по константам скоростей мутаций в гаплотипах Y-хромосомы и их калибровке, то есть количественной связи с хронологией[28]. Концептуально сделать это было несложно, поскольку кинетика химических и биологических мутаций – прямая специальность автора данной книги, он в свое время заканчивал кафедру академика Н.Н. Семенова, единственного лауреата Нобелевской премии среди советских химиков, и написал немало учебников для Высшей школы (в основном издательства Московского университета и издательства «Наука»), часть – со специалистом в области химической кинетики, деканом Химического факультета МГУ чл. – корр. АН СССР И.В. Березиным. За разработку кинетики химических и биологических реакций тот же автор стал лауреатом Государственной премии СССР по науке и технике (1984), а до того – лауреатом премии Ленинского комсомола (1978). Так что концептуально разработать количественную основу ДНК-генеалогии сделать было несложно, но надо было ее верифицировать на тысячах примеров, чтобы она была надежной. Это было сделано с использованием 3160 гаплотипов (2489 из них – в 67-маркерном формате, из 55 ДНК-генеалогических линий из 8 основных гаплогрупп). Эта работа и была опубликована в Advances in Anthropology в 2011 году[29], во втором выпуске журнала после его основания в том же году.
В последующем в том же журнале были опубликованы статьи с детальным описанием гаплогруппы R1a в мире, гаплогруппы R1a в Европе (с описанием 38 ветвей гаплогруппы R1a), гаплогруппы R1b, ДНК-генеалогии и лингвистики, ДНК-генеалогии и древней керамики от трипольской культуры до культур Юго-Восточной Азии и обеих Америк, а также четыре статьи об Африке и происхождении человека с точки зрения ДНК-генеалогии (две в 2012 г, и две – в 2014 г, одна из них редакторская). Одна статья из этих четырех[30] установила своеобразный рекорд популярности у читателей журнала – по состоянию на 25 октября 2015 года она была просмотрена более 90 тысяч раз, и «скачана» более 20 тысяч раз (http://www.scirp.org/journal/HottestPaper.aspx?Journalro=737).
Описанное выше – это крупный успех нового направления, отражение его признания. Стало ясно, что ДНК-генеалогия фактически является молекулярной историей (см. выше ответы на Вопросы 3 и 4).
Вопрос 16: Как в Y-хромосоме образуются мутации?
Время от времени при копировании Y-хромосомы в копии проскакивают ошибки. Фермент под названием ДНК-полимераза (на самом деле вместе с целым набором молекулярных инструментов копировальной машины) или просто ошибается и делает некоторые участки ДНК короче или длиннее, удлиняя или сокращая «тандемные повторы» нуклеотидов, или «ремонтирует» повреждённые участки и в ходе «ремонта» удаляет повреждение (эта операция называется «делеция»), или «вшивает» новый нуклеотид (называется «вставка», или «инсерт»). То, что удалось отремонтировать, в мутации не попадает, как будто мутации и не было. Что не удалось – передается сыну при рождении. Если родилась дочь, то Y-хромосома не передается. Если есть только дочери, или детей нет – Y-хромосома терминируется, вместе с мужской наследственной линией.
Мутации, которые интересуют ДНК-генеалогию, бывают двух типов – или изменение числа повторов, тандемов (STR), что описано выше, или «точечные», одно- или несколько-нуклеотидные (SNP), снипы.
Оказалось, что многие повторы нуклеотидов находятся у разных людей в одних и тех же участках Y-хромосомы. Эти участки уже специалистами пронумерованы, классифицированы, сведены в списки. Они получили название «маркеры». Набор маркеров, точнее, повторов в них, называется «гаплотип». Уже известных маркеров – больше тысячи. Они, как правило, одни и те же у всех людей на Земле и отличаются друг от друга только числом повторов, что вызвано теми самыми ошибками ферментов (и других элементов биологического копирования) при копировании из поколения в поколение.
Примеры повторов приведены в ответе на вопрос 14. Ясно, что «мутации», которые приводят к изменению числа тандемных повторов в Y-хромосоме, не есть те «мутации», о которых все имеют представление как о «поломках в генах», например, под воздействием радиации. Мутации, которые рассматривают в гаплотипах, происходят не в генах и не являются «поломками». Это, как объяснено выше – ошибки при копировании ДНК. Они имеют весьма сложную архитектуру, и радиацией не вызываются. Это – не поломка, а координированная перестройка.
Вопрос 17: Что такое «общий предок» выборки носителей гаплотипов, и как мутации могут помочь определить, когда он жил?
Любая группа мужчин, относящихся к одной и той же гаплогруппе и к одному и то же субкладу, а также к любой выборке гаплотипов, образующей ветвь в пределах одного субклада, являются в каждом случае родственниками, и происходят от одного общего предка. Можно привести и обратное определение – если мутация, которая осуществилась в Y-хромосоме, унаследовалась в ДНК потомков, то все эти потомки происходят от одного общего предка, у которого и произошла данная мутация.
В принципе, в любой гаплогруппе и любом субкладе имеется множество групп людей, которые происходят от их общего предка. Например, у двух родных братьев есть общий предок – их отец. Если к ним добавить дядю, то общий предок всех троих – отец дяди и дедушка братьев.
Чем глубже во времени общий предок группы людей, или популяции, в терминах ДНК-генеалогии, тем больше у него потомков. Все потомки наследуют гаплотип их общего предка, но чем дальше во времени отстоит общий предок, тем больше мутаций накапливается в гаплотипах потомков. Приведем простой пример. Допустим, общий предок жил 2500 лет назад, то есть 100 условных поколений назад (в ДНК-генеалогии за условное поколение принимается 25 лет, и константы скоростей мутации вычисляются в расчете на условное поколение протяженностью 25 лет). Если выявить сто потомков этого общего предка, в их 12-маркерных гаплотипах обнаружится примерно 200 мутаций, причем у 14 человек гаплотипы будут одинаковыми, и все 200 мутаций будут неупорядоченно распределены, в разной степени, между оставшимися 86 потомками.
Вот эти одинаковые 14 гаплотипов и представляют собой предковый гаплотип. За прошедшие 100 поколений – чисто статистически – в гаплотипах 86 потомков пройдут мутации, а в гаплотипах 14 потомков мутаций еще не будет. Вот таким образом определяют предковый, или базовый гаплотип.
Проверим представленные выше числа. 200 мутаций в 100 гаплотипах в 12-маркерном формате (константа скорости мутаций в 12-маркерных гаплотипах равна 0.02 мутаций на гаплотип за условное поколение) соответствуют величине 200/100/0.02 = 100 условных поколений, то есть примерно 2500 лет (здесь для простоты не вводится поправка на возвратные мутации, смысл которой будет пояснен в следующей главе). Это – линейный метод расчета времени до общего предка популяции. В то же время согласно логарифмическому методу если из 100 гаплотипов в 12-маркерном формате остались неизменными 14, то это соответствует времени, прошедшему от общего предка популяции, равному [ln(100/14)]/0.02 = 98 условных поколений, то есть примерно тому же времени, рассчитанному с помощью линейного метода.
Из этого примера должно быть понятно, что чем более недавний общий предок, тем большее число идентичных друг другу гаплотипов (или их фрагментов) наблюдается в выборке, и тем надежнее выявляется предковый гаплотип. Если общий предок жил очень давно, то одинаковых гаплотипов в выборке может остаться всего два-три – например, три гаплотипа из сотни 12-маркерных гаплотипов останутся при [ln(100/з)]/0.02 = 175 условных поколений до общего предка, то есть общий предок жил 4375 лет назад (на самом деле больше при учете возвратных мутаций). Когда в серии гаплотипов наблюдаются всего два-три одинаковых гаплотипа, они могут не обязательно быть предковыми, а оказаться одинаковыми случайно, в результате игры неупорядоченных мутаций. Поэтому понятие «предковый» гаплотип лучше не употреблять, за исключением совсем уже явных случаев, и в ДНК-генеалогии вместо «предковый» гаплотип обычно употребляют «базовый».
Итак, общий предок популяции – это предполагаемый носитель «базового», или «предкового» гаплотипа. Время жизни общего предка популяции вычисляется по совокупности гаплотипов его потомков, принимая во внимание число мутаций, накопившееся в популяции, нормированное на гаплотип или на маркер, и константу скорости мутации, или частоту мутации в расчёте на поколение. Расчёты времён жизни общих предков популяций позволяют делать предположения о времени и направлениях миграций популяций в древности, о передвижениях популяций. Поскольку, передвигаясь, популяции оставляли следы в виде материальных признаков, это позволяет проводить интерпретацию археологических данных в отношении носителей этих признаков, их принадлежности к определённым родам и племенам, связанных родственными взаимоотношениями. Аналогично, популяции, передвигаясь, приводили к перемещению языков, диалектов, и определение общих предков и времён их жизни даёт возможность прослеживать динамику языков в отношении соответствующих родов и племён, связанных родственными взаимоотношениями.
Вопрос 18: Можно ли привести примеры предковых гаплотипов, датируемых десятками и сотнями тысяч лет назад? Можно ли выявить гаплотип общего предка всех мужчин на Земле?
«Общий предок всех людей» – понятие скорее концептуальное, чем буквальное, абсолютное. Чем больше накапливается данных, тем понятнее становится, что «общий предок всех людей» теряется среди переплетений ДНК-генеалогических линий, уходящих на сотни тысяч лет вглубь. Поэтому введенное некоторое время назад понятие «хромосомный Адам» не является научным и никогда не было доказано. Интуитивно, такой общий предок возможен, но он, скорее всего, будет «плавающей мишенью».
Понятие «одного предка» можно рассматривать на разных уровнях сложности. Например, древнейшая африканская линия (гаплогруппа А00) имеет общего предка с гаплогруппой R1a примерно 210 тысяч лет назад, то есть оттуда, из такой глубины тысячелетий расходятся гаплотипы современных носителей гаплогруппы A00 и этнических русских гаплогруппы R1a:
13 11 12 10 11 16 10 8 14 14 8 8 8 9 12 11 12 8 12 12 11 11 (А00)
12 12 11 11 11 11 11 8 17 17 8 10 8 12 10 12 12 8 12 11 11 12 (R1a)
Здесь приведены 22 очень «медленных» маркера Y-хромосомы, каждый из которых мутирует раз во многие тысячелетия. Можно подсчитать, что эти гаплотипы разошлись на 26 мутаций, и расчеты, основанные на скорости мутации каждого маркера, показывают, что эти 26 мутаций соответствуют времени жизни их общего предка примерно 210 тысяч лет назад. Но даже беглый взгляд на эти гаплотипы показывает, что ДНК древнейших африканцев и этнических русских, носителей гаплогруппы R1a, не так уж намного различаются, или, скорее, являются принципиально сходными.
Хорошо, а если вместо типичного гаплотипа R1a подставить гаплотип R1b, преобладающей гаплогруппы Западной Европы? Мутации здесь настолько медленные, что в таком формате представления гаплотипа он будет практически одинаков по всей Западной Европе:
11 12 13 11 11 12 11 9 15 16 8 10 8 12 10 12 12 8 12 11 11 12 (R1b)
Мы видим, что при таком разрешении большая часть аллелей (это – числа в гаплотипах) у R1a и R1b одинаковы (совпадают 16 аллелей из 22). Между гаплотипами А00 и R1b – 24 мутации, что снижает возраст общего предка на семь тысяч лет, то есть на 3 %. Это – в пределах погрешности расчетов. Только не стоит строить пропорции, там счет нелинейный.