Глава 7 ДНК-тесты

Все ли ДНК-тесты одинаковы?

За последнее десятилетие благодаря развитию технологий исследования ДНК, накоплению колоссальных научных данных ДНК тесты стали весьма популярны и вышли за пределы медицинского сообщества. Научные исследования приоткрывают работу механизмов развития многих признаков у человека: от склонности к заболеваниям до особенностей усвоения некоторых компонентов пищи и даже формирования внешних данных. Научные отделы компаний, занимающихся генетическим тестированием, могут понятным языком дать такую информацию каждому желающему. Таких компаний достаточно много, однако чаще всего они используют лишь несколько технологий, о которых мы и поговорим в этой главе.

Полимеразная цепная реакция (ПЦР)

Некоторые компании предлагают тестирование ограниченного (зачастую очень небольшого) набора генетических признаков путем проведения нескольких ПЦР, проверяющих наличие того или иного конкретного генетического варианта. Одна ПЦР проверяет только одну генетическую вариацию, допустим, может проверить один вариант, отвечающий за непереносимость молочного сахара – лактозы.

Плюсы этой технологии в том, что анализ можно сделать в короткие сроки, а реагенты можно даже зарегистрировать как медицинское изделие. Регистрация подразумевает множество этапов валидации данных и лабораторного процесса, и если компания успешно регистрирует свой продукт как медизделие, то часто это говорит о его высокой точности. Также такая регистрация позволяет выдавать медицинские заключения.

Из минусов технологии стоит отметить относительную дороговизну анализа каждой отдельной точки в геноме и, как следствие, ограниченность количества возможных вариаций для тестирования. Таким способом исследовать десятки и тем более сотни генетических вариантов становится невыгодно, так как стоимость такого сложного продукта будет очень высокой. Классическими примерами применения ПЦР для генетических исследований являются анализы на некоторые генетические заболевания, APOE, фармакогенетику в сетевых клинико-диагностических лабораториях.

Секвенирование NGS

Секвенирование ДНК позволяет выявить почти полную последовательность всего генома и выявить наличие практически всех генетических изменений. Получив с секвенатора огромный массив генетических данных, дальше их сравнивают с условным образцом ДНК, и это дает не менее внушительный объем информации о каждом человеке.

Секвенирование применяется в трех главных видах анализа:

1. полногеномное секвенирование, в котором исследуется весь геном (около 100 % генетической информации), в том числе митохондриальная ДНК (небольшая кольцевая ДНК с примерно 40 генами, которую мы наследуем от матери);

2. полноэкзомное секвенирование, в котором исследуется весь экзом – кодирующая белки часть ДНК (это 1–2 % всей ДНК с информацией только о кодирующих участках генов – экзонах, без «генетических пробелов» – интронов);

3. генные панели, в которых исследуется заранее предопределенный для панели ограниченный набор десятков-сотен генов. Часто это нужно для поиска генетической причины различных заболеваний, например эпилепсии или болезней сердца.


Секвенирование позволяет устанавливать не только, какие «буквы» находятся в том или ином участке генома, но и находить большие структурные изменения ДНК (протяженные участки отсутствия или удвоения генетического материала, которые сложно выявить другими скрининговыми методами). Помимо этого мы можем узнать, какие варианты генов пришли от одного родителя и как эти варианты расположены на одинаковых парных хромосомах. Этот процесс называется фазированием и иногда нужен для установления или подтверждения клинического диагноза.

Секвенирование также позволяет устанавливать с высокой точностью целые последовательности «букв» – нуклеотидов, расположенные рядом на одной хромосоме внутри одного гена. Этот подход активно используется в фармакогенетике для подбора эффективных препаратов и типировании HLA аллелей. Стоимость таких исследований активно снижается с 2008 года, а ценность только увеличивается из-за развития науки и появления данных, которые дают возможность использовать результаты секвенирования на протяжении всей дальнейшей жизни и находить что-то новое.

Множество компаний сейчас предлагают услуги секвенирования генома или экзома с предоставлением клиенту данных в разных форматов, в том числе файлы с прочтениями (так называемые «сырые данные») и файлы с генотипами для всех проанализированных генетических вариантов.

Генотипирование на чипах

Генотипирование на ДНК микрочипах является самым распространенным и относительно недорогим методом генетического анализа. Чипы позволяют одновременно анализировать сотни тысяч заранее предопределенных участков генома. Чип так устроен, что каждая ячейка в нем проверяет наличие или отсутствие только двух вариантов в одной точке генома. Но можно проверить и большее количество вариантов, если использовать данные с других ячеек и специальным образом эти данные обработать. Технология генотипирования на чипах не регулируется в РФ, однако в некоторых странах она (или ее часть – например, некоторые отдельные анализируемые участки ДНК) зарегистрирована как медицинское изделие, что приравнивает ее медицинскую ценность к ПЦР анализам. По результатам такого теста мы получаем информацию о том, какие «буквы» человек получил от своих родителей в той или иной точке генома.

Если же говорить о ДНК тестах не с точки зрения технологии, а интерпретации генетических данных, то все зависит от компании и ее политики. Компании сами выбирают исследования, которые хотят использовать для интерпретации данных пользователя и выдачи ему каких-либо результатов.

Стоит отметить, что разные исследования имеют разную доказательность и статистическую ценность, поэтому не всегда огромное количество признаков в интерпретации той или иной компании говорит о том, что это хороший тест. Напротив, это может быть продукт использования всего, что доступно научному сообществу, без грамотного статистического подхода и фильтрации.

Также необходимо отметить, что ДНК-тесты, основанные на секвенировании и генотипировании на ДНК-микрочипах, не являются легальным инструментом установления родственных связей, как и не могут быть использованы для анализа некоторых заболеваний (например, спинальной мышечной атрофии). Эти тесты скрининговые, то есть не несут медицинской значимости и не могут быть использованы врачом при принятии клинически важных решений. При наличии узкого запроса и подозрении на наличие генетического заболевания необходимо использовать диагностические исследования в клинико-диагностических лабораториях при направлении лечащего врача.

Точны ли ДНК-тесты?

ДНК-тестирование за последнее десятилетие широко вошло в жизнь сотен миллионов людей в развитых странах. Компании, предоставляющие услуги генетического тестирования, предлагают множество разнообразных отчетов о наследственных заболеваниях, наследственных рисках, онкологических рисках, влиянию генетики на успешность лечения, различных физиологических особенностях и признаках, частично или полностью зависящих от генетической составляющей. Помимо банального интереса к фактам, которые можно узнать по результатам тестирования и за небольшие деньги, генетические тесты иногда помогают в буквальном смысле спасти жизнь человека, определив наличие, например, какой-либо мутации, связанной с развитием онкологических заболеваний, или с риском серьезных побочных эффектов при применении наркоза или лечения онкологического заболевания, тем самым помогая заранее предпринять действия по сохранению здоровья и снижению рисков.

Однако при всем этом иногда возникают ситуации ложноположительного определения каких-либо генетических мутаций, которые, согласно научным данным, приводят к развитию заболевания, скажем, еще в детском возрасте, в то время как тест сдал здоровый взрослый человек без клинических проявлений. Такие ситуации вызывают вопросы по поводу точности генетических тестов и степени доверия к ним. В этой главе мы попробуем раз и навсегда обозначить некоторые ключевые моменты, касающиеся качества генетического тестирования.

Начнем с одной из двух технологий, широко используемой некоторыми компаниями в продвинутых и недешевых тестах, – секвенированием следующего поколения (Next Generation Sequencing, NGS). Используемая технология производит многократное «чтение» фрагментов ДНК, где каждое прочтение (так называемый рид) имеет длину от 100 до 150 нуклеотидов («букв» ДНК). Подавляющая часть всех нуклеотидов в геноме оказывается прочитана много раз, а количество раз называется покрытием. Среднее покрытие по геному 30х говорит о том, что в среднем каждая «буква» генома была прочитана 30 раз.

На изображении ниже приведена иллюстрация того, как выглядят результаты секвенирования после выравнивания на референсный геном – определения участка генома, который был прочитан в каждом конкретном прочтении. Прочтения выглядят как серые горизонтальные полоски и в данном случае имеют длину 100 нуклеотидов. Количество таких прочтений, покрывающих каждый нуклеотид референсного генома (последовательность приведена в нижней части изображения) является покрытием. Например, позицию в геноме, обозначенную черным цветом, покрывает 44 прочтения (на экране видны не все 44), значит покрытие этой позиции – 44х.

Теперь еще раз обратим внимание на эту позицию – во всех прочтениях был обнаружен нуклеотид Т, что говорит о том, что в этом месте у человека есть замена референсного нуклеотида С на Т в гомозиготном состоянии (то есть генотип в этой позиции – Т/Т). Скорее всего, человек унаследовал вариант Т и от матери, и от отца. Сомнений здесь быть в целом не может. Однако посмотрим на другую позицию, выделенную темно-серым цветом. Из 42 прочтений, покрывающих эту позицию, 1 прочтение имеет нуклеотид А, в то время как другие имеют референсный нуклеотид G. С некоторой долей вероятности по этим данным можно предположить, что это ошибка секвенирования. Согласно исследованиям и спецификациям оборудования, например, компании Illumina, лидера в области лабораторного оборудования для генетических исследований, такие ошибки происходят с частотой 0,1–0,5 %, то есть на 1000 прочитанных нуклеотидов от 1 до 5 могут быть прочитаны неверно. Однако здесь нужно отметить, что многократное прочтение одного и того же участка в геноме многократно снижает вероятность определения неверного генотипа для этого локуса.

Наш пример ниже с неверно определенным нуклеотидом А в 1 из 42 ридов никак не повлияет на определение генотипа (G/G), так как биоинформатические программы, обрабатывающие такие данные, умеют находить и исключать такие ошибки секвенирования. Более того, каждый прочитанный нуклеотид в каждом прочтении имеет показатели качества, которые говорят о том, насколько система секвенирования была уверена в верности прочтения нуклеотида. Эти показатели также используется в биоинформатических программах, определяющих генотипы, еще больше снижая вероятность ошибок. В конце концов, алгоритмы финальной фильтрации данных вообще исключают участки с недостаточно хорошими показателями качества, позволяя быть максимально уверенными в конечном результате (рис. 13).


Рис. 13. Результаты секвенирования после выравнивания на референсный геном.


В секвенировании всегда нужно помнить о том, что на верность определения генотипа влияет огромное количество факторов, в том числе генетические контекст. Определить генетическую вариацию в генетически сложном регионе (например, длинной повторяющейся последовательности нескольких нуклеотидов) достаточно сложно, и вероятность ошибки для таких вариаций существенно выше. В целом нужно понимать, что такого рода генетические тесты являются скрининговыми, и в случае обнаружения каких-либо серьезных генетических изменений результат требует валидации методами так называемого золотого стандарта – ПЦР или секвенирование по Сэнгеру. Этим занимаются специализированные лаборатории, имеющие аккредитацию.

В случае обычных генетических тестов, выполняемых на ДНК микрочипах, ошибки составляют менее 1 процента всех прогенотипированных локусов, что подтверждается многочисленными исследованиями качества генотипирования различных чипов, в основном изготавливаемых компанией Illumina. Как и в случае с секвенированием, вероятность ошибки зависит от генетического контекста:

1. однонуклеотидные замены (например, A->G) имеют меньшую частоту ошибки, чем инсерции и делеции;

2. мультинуклеотидные замены (например, A->G,C) имеют вероятность ошибки выше, чем однонуклеотидные;

3. замены, располагающиеся в генетически сложных регионах, имеют более высокую вероятность ошибки, чем все остальные типы генетических вариаций.


В общем, можно сказать, что, как и в любом другом научном методе, вероятность ошибки никогда не бывает нулевой, но она минимизирована максимально в соответствии с доступными на данный момент технологиями лабораторного анализа и анализа данных. Все тесты являются скрининговыми, то есть позволяют дешево проанализировать огромное количество локусов генома. Найденные подозрительные и клинически значимые изменения нужно валидировать методами золотого стандарта, которые на порядки дороже в пересчете на один участок генома, однако позволяют установить истину.

О чем расскажут ДНК-тесты?

Генетические тесты позволяют узнать о человеке много различной информации, однако все компании, предоставляющие услуги генотипирования, предлагают плюс-минус одинаковые разделы. Их наполнение разнится, в то время как логика интерпретации остается одной и той же. В этой главе мы поговорим о том, какую информацию можно извлечь из среднестатистического генетического теста и как ее получают.

Моногенные (или наследственные) заболевания

Наследственные заболевания вызываются одним или несколькими генетическими изменениями в одном гене. Науке давно известно огромное количество конкретных мутаций различных генов, вызывающих развитие того или иного патологического состояния. Зная список этих мутаций, патогенные изменения последовательности нуклеотидов и их расположение в геноме человека, можно сравнивать результаты генотипирования, полученные из ДНК-теста, с этой базой патогенных мутаций и предоставлять результаты о найденных мутациях.

Стоит отметить, что некоторые мутации имеют неполную пенетрантность, то есть внешние проявления наличия мутации (в нашем случае какое-либо заболевание) проявляются не у всех людей, у кого эта мутация есть. Причины этого кроются в сложном наследовании и молекулярных взаимодействиях, которые не всегда технически возможно отследить в генетическом тесте. Как результат, некоторые находки анализа на наследственные заболевания могут не соответствовать внешним проявлениям, однако требуют сторонней проверки, например, при планировании семьи.

Риски заболеваний

Развитие некоторых заболеваний (например, болезнь Крона, ишемическая болезнь сердца и другие) зависит не от какой-либо одной мутации в каком-либо одном гене (как в случае с наследственными заболеваниями), а от целого спектра различных генетических вариаций в различных генах. То есть вероятность развития заболевания может, например, увеличиваться при наличии какого-либо варианта в каком-то одном месте генома, а при наличии другого варианта в другом участке ДНК – уменьшаться. Для разных заболеваний количество таких генетических вариаций, увеличивающих или уменьшающих риск развития заболевания, варьируется от двух до нескольких сотен. Каждая генетическая вариация вносит свой вклад (увеличивающий риск или уменьшающий его), и при анализе данных генотипирования эти вариации анализируются и определяется суммарный риск. Почти всегда на риск развития таких заболеваний влияет не только генетика, но и факторы внешней среды (образ жизни и т. п.), возраст, вес, пол. Эти параметры тоже имеют свой либо увеличивающий, либо уменьшающий риск вклад, и могут учитываться в интерпретации в случае, если человек, сдавший генетический тест, предоставляет эти данные об образе жизни и некоторых других параметрах.

Онкологические риски

Онкологические риски не похожи на риски заболеваний в контексте того, что это не численное значение риска, которое может быть низким или высоким. В онкологические риски могут включаться известные или потенциально патогенные мутации в определенных генах, ответственных за развитие (онкогены) или угнетение рака (онкосупрессоры). Наличие значимых мутаций в этих генах может свидетельствовать о высоком риске развития онкологических состояний на протяжении жизни человека. Такие мутации очень редко проверяются на ДНК микрочипах и максимально доступны для анализа при использовании секвенирования как технологии получения генетических данных. Поэтому следует всегда уточнять, каким методом будет исследоваться ваша ДНК.

Эффективность и риски лекарственных веществ

Связью генетики и метаболизмом лекарственных веществ занимается наука фармакогенетика. Основной концепт фармакогенетики кроется в том, что метаболизмом (разрушением или, наоборот, превращением в активные соединения) занимаются ферменты – белки, скорость работы которых может варьироваться в зависимости от генетических вариаций в генах, кодирующих эти ферменты. Фармакогенетике известны эти генетические вариации и их комбинации, встречающиеся вместе на одной хромосоме в одном гене, кодирующем фермент, и определяющие скорость работы фермента. Зная генетические вариации можно с той или иной долей уверенности говорить об активности какого-либо фермента в организме и, как следствие, скорости метаболизма лекарственного вещества, метаболизируемого этим ферментом. При низкой скорости метаболизма лекарственной вещество может накапливаться в плазме крови и вызывать побочные эффекты, а при высокой – наоборот, не достигать нужной (терапевтической) концентрации, снижая эффективность лечения. В некоторых генетических тестах пользователю доступна интерпретация по фармакогенетике с рекомендациями по использованию и дозированию того или иного лекарственного вещества.

Другие признаки

В этот искусственный раздел можно отнести все остальные признаки, которые сложно сгруппировать по смысловой нагрузке. Это могут быть и признаки, связанные с предрасположенностью к тому или иному уровню витаминов и гормонов, и признаки, связанные с некоторыми проявлениями внешности организма, физиологическими и другими особенностями.

Нужно ли проходить ДНК-тест?

Доступность и широкая популярность генетических тестов, которые можно сдать дома, растет с каждым годом. Появляются новые компании, предлагающие услуги генотипирования, появляются и новые научные данные, позволяющие узнать человеку о себе все больше и больше фактов, связанных с наследственностью и генетикой. Нужно ли это при прочих равных условиях? Разберемся далее.

Любой генетический тест, проводимый с использованием технологии генотипирования на ДНК микрочипах или секвенирования NGS, является скрининговым исследованием. Это значит, что результаты не несут медицинской значимости и не могут быть использованы врачами для принятия медицинских решений. Это следствие законодательного регулирования звучит не очень для потенциальных клиентов, задумывающихся о приобретении такого теста. Однако важно понимать, что отсутствие медицинской значимости абсолютно не говорит о качестве лабораторного и научного процесса, стоящего за генетическим тестированием.

Скрининговые тесты созданы специально для того, чтобы быстро и относительно дешево провести широкий скрининг (поиск отклонений) участков генома (локусов), в которых происходят наиболее частые и важные генетические изменения.

Точность генетического тестирования (то есть доля правильно определенных генетических изменений в ДНК) предельно высока, что позволяет выявить какие-либо значимые мутации до того, как они начнут проявлять себя. Отсутствие выявленных изменений также имеет высокую значимость из-за высокой чувствительности, то есть способности генетического теста найти мутацию при ее реальном наличии в ДНК.

Однако генетические тесты имеют свои минусы, в частности более высокую долю ошибок (часто ложноположительного определения наличия мутации) в сложных генетических контекстах, что требует обязательной валидации наличия мутации методами золотого стандарта (ПЦР, секвенирование по Сэнгеру). Валидировать все находки, разумеется, бессмысленно. Внимание нужно обращать исключительно на клинически значимые мутации, которые согласно научным данным приводят к развитию заболевания. При отсутствии таких находок можно, в целом, успокоиться.

Часто происходят ситуации, когда люди хотят сдать генетический тест после рекомендации врача сделать тестирование на одну или несколько мутаций. Такое направление обычно выдается при подозрении на наличие заболевания, семейной истории заболевания и так далее. В этих ситуациях очень важно понимать, что генетический тест не может быть использован для таких задач, и чаще всего требуемые мутации просто не проверяются тестом.

Более того, как уже было сказано выше, результаты не будут нести медицинской ценности, поэтому необходимо обратиться в клинико-диагностические лаборатории (частные или в специализированном медицинском учреждении), проводящие специализированные исследования ДНК методами золотого стандарта. Стоимость нескольких таких исследований может граничить со стоимостью генетического теста, в то время как медицинская ценность у него отсутствует.

Во всех остальных случаях, не касающихся доказательной медицины в плане наследственных и онкологических заболеваний, генетический тест предоставляет широкий спектр информации, а сырые данные генотипирования можно дополнительно интерпретировать в различных сервисах. Необходимости в получении этой информации обычно нет, если нет каких-либо медицинских показаний к исследованиям, однако знание своей генетики – ценно и интересно, поэтому решать только вам. Но лучше перед принятием решения о генетическом тестировании обратиться за консультацией к врачу-генетику, чтоб не упустить показания для узкоспециализированных исследований, обсудить подходящий объем исследований при планировании семьи и сформировать верные ожидания от тестов, которые вы планируете сдать.

Можно ли определить национальность с помощью исследования ДНК?

Когда появились генетические исследования, стало возможно проверять не только здоровье, а даже свои корни, свое происхождение. Компании, предоставляющие услуги генетических исследований, часто создают продукт, в котором есть все и сразу. Но исторически сложилось разделение на компании, которые делают ставку на определение различных признаков, связанных со здоровьем, в то время как другие сильны в этногенетических исследованиях и используют их для определения условной генетической принадлежности человека к той или иной группе людей.

Развитие технологий генотипирования позволило объединить эти два подхода и предоставлять пользователям генетических тестов максимум информации, которую можно извлечь из обычного генетического теста, где проверяется от 600 тысяч до 1 миллиона генетических вариантов. Стоит отметить, что исследования так называемого популяционного состава, определяющие генетическую схожесть генома отдельного человека с той или иной этнической группой, часто абсолютно неправильно интерпретируются пользователями таких тестов.

Дело в том, что человек может уже иметь некоторые знания о происхождении своих родственников, основанные на рассказах бабушек и дедушек, и ждет, что генетика обязательно покажет это. Обычно никто не рассказывает, как именно устроен механизм анализа генетических данных в области происхождения и порой люди сомневаются в достоверности результатов всего исследования, если он не оправдывает их изначальных ожиданий. В этой главе мы поговорим о том, что же такое «популяционный состав», почему он не имеет ничего общего с национальностью и почему нельзя делать поспешные выводы о качестве исследования по обнаруженным у человека популяциям.

Национальность – это, в первую очередь, политический термин, опирающийся на правовые взаимоотношения человека с той или иной формой организации общества. Однако это не мешает частому использованию этого термина в качестве обозначения этнической принадлежности.

То есть мы можем считать себя русскими, раз рождены на территории России, и наши бабушки и дедушки тоже, но популяционный состав может показать более широкий набор этносов, с которыми ваша ДНК имеет наибольшее сходство. В свою очередь, принадлежность к этнической общности в современном мире совсем не обязательно определяется родословной и наличием в ней предков, идентифицирующих себя как представителей того или иного этноса. То есть наши представления и самоидентификация могут сильно отличаться от данных генетического исследования популяционного состава.

Вследствие глобализации этнические и культурные барьеры, которые ранее ограничивали межнациональные контакты и браки и тем самым тесно связывали национальность и этническую принадлежность, постепенно перестают быть барьерами. Это приводит к тому, что этническая принадлежность становится все более культурологическим феноменом и определяется культурой, которую человек впитывает на той или иной стадии своего развития. Помимо этого, этническая принадлежность в странах с высоким уровнем глобализации, особенно в крупных городах – центрах сосредоточения различных культур и миграции – постепенно перестает быть связанной с историей предков, и, соответственно, с генетической составляющей.

Как же тогда исследователи могут делать вывод об этнической принадлежности генома отдельного человека?

Ответ кроется в том, что глобализация пока что не настолько глобальна. В мире есть множество обособленно проживающих общностей людей, которые вследствие географических и/или культурных барьеров, поддерживаемых изнутри, по-прежнему являются изолированными в генетическом смысле и стараются не допускать генетического смешения с представителями других общностей. Такие группы людей в генетике можно назвать популяциями, главный критерий определения которых, – это изолированность друг от друга и, как следствие, минимизация контактов и браков между разными популяциями. Отличительные для популяции генетические вариации – генофонд – и связанная с ними статистика дает возможность описать ту или иную популяцию в терминах генетики. Этот же инструмент можно применять для определения схожести генома отдельно взятого индивидуума с генофондом какой-либо популяции.

Результаты исследования схожести генома отдельного человека с различными популяциями называются популяционным составом. Здесь нужно подчеркнуть слово «схожесть», так как доступные науке методы проводят сравнение распределения генетических вариаций и определяют именно степень схожести наблюдаемого паттерна человека и паттерна генофонда той или иной популяции. Получаемые результаты – это наблюдение и так называемые «кажущиеся» результаты, получаемые методами, вероятностно воссоздающими предполагаемую истину, но не претендующими на нее.

Как же происходит анализ популяционного состава?

Сначала создается база данных геномов, принадлежащих людям из той или иной популяции. Популяция может быть популяцией греков, японцев, немцев и так далее, однако люди из этих популяций для внесения в базу должны соответствовать строгим критериям – обычно это факт постоянного проживания всех прямых предков на протяжении нескольких поколений на одной и той же территории и их одинаковой самоидентификации как представителей исследуемой популяции. Чем больше людей внутри одной популяции в базе, тем более показательной является выборка, тем больше статистических различий между представителями одной популяции можно описать и тем более точным может быть результат анализа. Однако количество популяций в анализе так же очень важно, ведь если в базе будет 10 популяций, то и результат анализа популяционного состава будет содержать не более 10 популяций. Даже если взять коренного удмурта и сделать ему анализ популяционного состава с использованием базы, в которой нет популяции удмуртов, то результаты анализа никогда и не покажут удмуртов. Описанные выше базы активно создавались ранее и продолжают создаваться путем организации экспедиций в места проживания отдаленных или изолированных популяций, или набором участников для исследований в крупных городах. Стоит отметить, что каждая компания, предоставляющая услуги генетических исследований, с большой долей вероятности использует разные базы, что приводит к различиям в результатах между разными компаниями.

Поэтому абсолютно нормально, что, если человек сдаст свой генетический материал в двух разных компаниях, он может получить несколько различающиеся результаты популяционного состава.

Вторым шагом в исследовании популяционного состава является анализ той самой базы геномов популяций. Для этого данные ДНК-анализа всех людей из базы анализируются, чтобы можно было увидеть вклад каждой из популяций в базе в данные каждого человека из базы. Тем самым для каждого человека можно получить численный вклад каждой из популяций базы в его или ее геном. Этот анализ позволяет получить многомерное пространство, в котором можно расположить каждый образец из базы. Выше пример как могут выглядеть такие кластеры, где видны отдельные популяции в базе.


Рис. 14. Кластеры отдельных популяций в базе данных для исследования популяционного состава.


Третий шаг – это анализ популяционного состава человека не из этой базы (условного клиента, сдавшего свой биоматериал для анализа). Комбинация методов из предыдущего шага и различных вероятностных подходов позволяет установить принадлежность образца к тому или иному кластеру (популяции), определенному на этапе анализа базы популяций. Здесь важно отметить тот факт, что анализ целого генома не производится. Напротив, исследуется несколько десятков или сотен тысяч участков генома, которые меньше всего «смешиваются» при формировании половых клеток, ведь для исследования популяционного состава лучше всего подходят наиболее стабильно передающиеся участки ДНК из поколения в поколение.

Для каждого участка генома можно получить «принадлежность» к той или иной популяции из базы популяций, где какая-либо популяция имеет максимальную схожесть с анализируемым участком по сравнению с остальными популяциями из базы. Каждый участок получает свой результат «принадлежности» (к какой популяции относится участок), а дальнейшая обработка для всех участков дает популяционный состав в виде процентов той или иной популяции, «обнаруженной» в исследуемом геноме.

Разумеется, в случае наличия предков из разных популяций и этнических общностей ДНК человека, можно сказать, «накапливает» в себе различные паттерны, присущие этим популяциям. Эти паттерны накапливаются и часто накладываются друг на друга, что мешает получать результаты, указывающие на какие-либо узкие группы популяций. Более того, наличие прадеда из Италии или отца из Польши абсолютно не гарантирует обнаружение значимого количества участков генома, схожих с указанными популяциями, вследствие случайного характера рекомбинации и не совсем равномерной передачи участков ДНК при образовании половых клеток. Сам анализ популяционного состава сложен и зависит от множества независимых факторов, которые влияют на конечный результат. Саму концепцию популяционного состава как продукта внутри генетического анализа необходимо воспринимать как информационно-познавательную.

Важно понимать, что если результаты популяционного состава не устраивают или есть сомнения из-за собственного представления о своем происхождении, то это не должно отбрасывать тень на результаты исследования в области здоровья, так как в их интерпретации используются другие алгоритмы.

Вплетется ли вирус в нашу ДНК? Сколько процентов ДНК человека составляют вирусы?

Ничто нечеловеческое нам не чуждо

Геном человека содержит более 20 тысяч генов, но не все они фактически являются исконно человеческими. Примерно 8 % нашей ДНК состоит из остатков древних вирусов. Бóльшая часть нашей вирусной ДНК происходит, в частности, из группы ретровирусов, в которую в том числе входит ВИЧ. Ретровирус вторгается в клетку-хозяина и внедряет свои гены в ДНК этой клетки. Эти вирусные гены используют клеточные ресурсы для создания новых вирусов, которые затем покидают клетку, чтобы заражать другие. Если ретровирус заразит яйцеклетку или сперматозоид, его ДНК потенциально может быть передана следующему поколению. Как только ретровирусы начинают передаваться по наследству, ученые называют их эндогенными ретровирусами.

Сначала эндогенные ретровирусы еще заставляют клетки-хозяева производить новые вирусы, но постепенно вирусная ДНК мутирует, и со временем эта способность теряется. Вместо этого они могут только создавать копии своих генов, которые затем вставляются обратно в ДНК хозяина. Чтобы ограничить ущерб, который могут нанести эти вирусы, хозяева производят специальные блокирующие белки. В конце концов большинство эндогенных ретровирусов настолько сильно изменяются, что превращаются в обычную последовательность, пусть и несущую в себе признаки вирусной. Однако некоторые вирусные белки все еще могут производиться.

Польза и вред

Польза

Исследователи высказывают предположения, что эти вирусные последовательности могут быть и полезными. Они могут влиять на гены, важные для функции плаценты, собственно, благодаря таким вирусам и появилась возможность вынашивать плод и питать его через плаценту у млекопитающих. Также есть доказательства того, что они играют роль в раннем развитии эмбриона, помогая бороться с инфекциями и развивать различные ткани. На раннем этапе клетки эмбриона могут превратиться в любую ткань. Когда эти универсальные клетки превращаются в более узкоспециализированные, они обычно «отключают» свои вирусные гены. Вирусные белки, вероятно, помогают удерживать стволовые клетки от потери универсальности.

Вред

Существуют противоречивые исследования, предполагающие, что некоторые виды онкологических заболеваний, такие как лимфомы, возникают, когда эндогенные ретровирусы вмешиваются в нормальную функцию генов.

Загрузка...