Итак, в начале 1990-х годов перед специалистами в области генетики и биохимии со всей остротой встала задача побуквенного редактирования генетического текста. Обычные помощники редактора — цветная ручка и программа Word — здесь бесполезны, ведь генетический текст представляет собой цепочку повторяющихся химических молекул — нуклеотидов, которые служат буквами этого текста. Требовалось создание принципиально новых инструментов, позволяющих работать с генетическим текстом с очень большой точностью, на уровне отдельных букв, то есть нуклеотидов, — что-то вырезать, что-то вставлять, и при этом очень точно и в живой клетке. Неправильная замена всего лишь одного нуклеотида может привести к остановке работы гена и гибели клетки.
Первые такие инструменты и появились в 1990-х годах (помните, в главе 2 мы начали рассказ о Джошуа Ледерберге и генетической рекомбинации). Для того, чтобы заменить букву или несколько букв генетического текста нам надо провести рекомбинацию, — только так в клетке может произойти замена. А для того, чтобы она произошла именно в нужном нам месте, необходимо внести разрыв в цепь ДНК. Для этого использовались особые ферменты — нуклеазы. Кроме того, какой-то механизм должен их направить в нужное место и точно распознать именно ту последовательность нуклеотидов (назовем ее «генетическим словом»), в которой нам нужен разрыв.
Для этого стали использовать так называемые мегануклеазы. Это крупные белковые молекулы, которые, кроме нуклеазной активности, характеризуются протяженным «генетическим словом», или, как говорят ученые, сайтом, который они распознают. Обычно это «слово» состоит из пятнадцати-сорока нуклеотидов. Такие длинные слова уникальны для геномов. Например, одна из первых мегануклеаз, I-Ssel, распознает определенную последовательность из восемнадцати нуклеотидов, и такое их сочетание случается настолько редко, что может встретиться в генетическом тексте, только если он в двадцать с лишним раз больше генома человека. Недостатками мегануклеаз являлись незначительное количество распознаваемых «генетических слов» и их размер (мега!), то есть протяженность сайта распознавания. Все это осложняло проведение экспериментальных работ с ними.
Первый значимый прорыв в направленном распознавании генетического текста внутри клетки произошел в начале XXJ века. Тогда придумали искусственные распознающие нуклеазы, которые получили название нуклеазы типа цинковых пальцев (zinc-finger nucleases). Наиболее интересен данный тип нуклеаз с точки зрения творческого, дизайнерского подхода человека к использованию фундаментальных знаний, поэтому далее мы уделим им немного больше внимания, а заодно узнаем об очень важных генах.
Мы уже говорили в главе 1, что в изученную часть ДНК человека, помимо самих генов, кодирующих белки, входят регуляторные последовательности — фрагменты ДНК, ответственные за работу гена. С химической точки зрения это такие же участки ДНК, как и гены, поскольку тоже составлены из четырех чередующихся в определенной последовательности нуклеотидов А, Т, Г и Ц. Как же эти участки ДНК могут регулировать работу гена?
Информация обо всех процессах в клетке записана в последовательности ДНК. Чтобы считать информацию с флешки, ее надо вставить в компьютер. Другим видом накопителя информации является стример. Он записывает информацию на магнитную ленту и используется в больших дата-центрах. Именно стримерам принадлежит рекорд по плотности записи информации на единицу площади. А принципиальное устройство стримера очень простое. Может, кто-то помнит или видел катушечный магнитофон: там две катушки, с одной лента сматывается, на другую наматывается, а посередине магнитная головка, которая касается ленты и считывает информацию, превращая ее в звук. Информация с ДНК — «магнитной ленты» — считывается такой же биологической «головкой». Этот «звукосниматель», который «озвучивает» ген, то есть делает его простую копию для преобразования в белок, называется транскрипционным комплексом, а процесс «озвучки» — транскрипцией. Транскрипционный комплекс собирается из нескольких белковых молекул, очень важно, чтобы он собрался в правильном месте, то есть выбрал правильный генетический текст для озвучки. За это отвечают так называемые транскрипционные факторы — белковые молекулы, которые узнают определенные комбинации «слов» (последовательностей нуклеотидов), носящих название промоторы.
И транскрипционные факторы, и промоторы эволюционно изменились очень мало, о чем свидетельствует их поразительное сходство у совершенно различных биологических видов, от плодовой мушки дрозофилы до человека. Это доказывает, что транскрипционные факторы были очень значимы в эволюции живых существ и, как мы теперь понимаем, играют огромную роль в функционировании наших генов.
Дело в том, что работа генов в организме подчинена тем же самым законам, что и устройство любого социума. Это значит, что в нем есть «господа» — такие, как транскрипционные факторы, а есть гены-«работники», которые подчиняются транскрипционным факторам. Один такой фактор может контролировать работу сотни генов, поэтому всего полторы тысячи транскрипционных факторов контролируют работу двадцати пяти тысяч генов.
Транскрипционный комплекс из транскрипционных факторов и различных кофакторов[8] как раз и задает все особенности транскрипции гена в определенной клетке и в определенное время. Изучать работу определенного гена в определенных условиях — это большая наука, но пока оставим эту тему в стороне.
Нас в данный момент интересует, что транскрипционные факторы очень хорошо умеют распознавать генетический текст, но все по-разному. Одни распознают текст очень специфично, и тогда не требуется слишком большой сборки из транскрипционных факторов и кофакторов, а другие — менее специфично, и тогда для повышения точности транскрипции генов могут понадобиться еще какие-то белки-помощники и еще один кофактор, которые осуществили бы «тонкую настройку».
Понятие транскрипционного фактора появилось в конце 1980-х годов, а чуть позже исследователи обнаружили целое семейство транскрипционных факторов, белковая структура которых имела повторяющиеся элементы, и эти элементы получили название цинковые пальцы.
Свое странное название эти фрагменты белковых молекул получили за характерную трехмерную структуру и наличие в их составе ионов цинка. Цинковый палец представляет собой последовательность аминокислот, состоящую из пары близко расположенных цистеинов (аминокислотных остатков), потом следует промежуток в полтора-два десятка любых аминокислот, и опять идут два близко расположенных цистеина или гистидина. Ионы цинка стабилизируют, удерживают эту конструкцию, связываясь координационными связями с двумя близко расположенными цистеинами. Представьте себе веревку с четырьмя завязанными узелками — это будут цистеины или гистидины. А теперь пальцами притяните все узелки в одну точку. Ваши пальцы сыграли роль иона цинка. У вас получатся три петли, которые можно назвать тремя пальцами. Так вот, каждый палец достаточно точно узнает три-четыре нуклеотида ДНК, расположенные в определенном порядке, и связывается с ними. Три пальца уже распознают девять-десять нуклеотидов — определенное слово генетического текста.
Рис. 6. Нуклеазы типа цинковых пальцев
Среди трех миллиардов букв, составляющих генетический текст ДНК, группа из трех-четырех букв попадается довольно часто. А вот если мы возьмем сочетание пяти-шести цинковых пальцев, которые однозначно определят последовательность примерно пятнадцати-семнадцати нуклеотидов генетического текста, то с вероятностью девяносто девять целых и девять десятых процента это будет уникальная последовательность среди трех миллиардов букв.
Конечно, для того чтобы этого добиться, тоже потребовалась большая работа. Цинковые пальцы были исследованы вдоль и поперек, и для каждого пальца специалисты изучили специфичность распознавания ими определенных сочетаний нуклеотидов. С помощью этого знания, используя рекомбинантные технологии, исследователи смогли создать искусственные сочетания цинковых пальцев, которые бы распознавали с полной определенностью нужный фрагмент генетического текста внутри клетки.
Сейчас изучены шестьдесят четыре цинковых пальца, которые могут распознавать шестьдесят четыре различные комбинации из трех нуклеотидов, входящих в последовательность ДНК. Исследователи научились достаточно точно распознавать очень конкретные слова генетического текста, с точностью до одной буквы, до одного нуклеотида, — и все это внутри живой клетки. Теперь, опять-таки с помощью рекомбинантных технологий, нужно было к распознающей части цинковых пальцев, которые у нас есть, дополнительно синтезировать и вставить в ту же самую белковую молекулу специальный белковый фрагмент, который обладает нуклеазной активностью. Это значит, что он может нарушать ковалентные связи в молекуле ДНК, то есть разрезать нить ДНК в том месте, где цинковые пальцы распознали определенную последовательность букв генетического текста.
Если мы знаем, какой конкретно генетический текст нужно исправить из-за наличия в нем мутации, и есть определенный нуклеотид, который нуждается в замене, то следующим шагом должна быть эта самая замена с помощью гомологичной генетической рекомбинации.
Технология использования нуклеаз типа цинковых пальцев активно развивалась в первое десятилетие XXI века. Очень большой вклад в разработку нуклеаз цинковых пальцев и связанных с ними методов редактирования генома внес американский генетик российского происхождения Федор Урнов. Однако у этого метода обнаружились и некоторые недостатки. Ограниченное количество известных цинковых пальцев значительно сужает применимость подхода для распознавания любого генетического текста. К тому же эта технология оказалась очень трудозатратной и дорогостоящей, так как для каждой конкретной мишени надо было разрабатывать особую нуклеазу цинковых пальцев, и на это уходило шесть — девять месяцев.
В 2010 году был открыт новый, более перспективный инструмент, позволяющий распознавать и разрезать последовательности генетического текста с большим успехом, чем нуклеазы цинковых пальцев. Это были особые искусственные конструкции, полученные из бактерий растений. Они были названы TALEN (Transcription activator-like effector nucleases), что расшифровывается как эффекторные нуклеазы, схожие с активаторами транскрипции. Распознаванием букв ДНК в них занимаются особые белковые домены, каждый из которых распознает только один нуклеотид. В природе есть прототипы таких доменов: это белки некоторых бактерий-паразитов, живущих в клетках сельскохозяйственных растений. Попадая в ядро растительной клетки, эти бактериальные белки имитируют транскрипционные факторы и связываются с определенными участками ДНК, активируя гены, необходимые для выживания паразита.
МЕТОД ГОДА
Термин геномное редактирование возник в конце первого десятилетия нынешнего века, а в 2011 году редактирование генома было признано методом года. Название метода подразумевало, что внутри клетки мы можем найти короткую последовательность генетического текста, состоящую примерно из пары десятков нуклеотидов, и заменить в ней хотя бы одну букву.
Вариабельность нуклеаз TALEN гораздо больше, чем у белков типа цинковых пальцев, и направлять нуклеазы можно даже более точно. Но это опять белок который каким-то образом надо сделать рекомбинантным и проверить эффективность его связывания c нашей последовательностью ДНК, которая является мишенью. Потом к нему должен быть присоединен фермент, обладающий нуклеазной активностью, то есть разрезающий ДНК в нужном месте. Это тоже достаточно сложно и трудоемко, к тому же взаимодействие двух разных белковых доменов может быть неоднозначным, да и специфичность не всегда возрастает. Тем не менее открытие TALEN'ов повысило интерес человека к точному редактированию генома.
Но почему надо обязательно заменять? Мы можем просто разрезать ДНК и не производить никакой гомологичной рекомбинации. Тогда, естественно, работа клетки нарушится. Как ни странно, это тоже инструмент, ведь для того, чтобы изучить работу гена в живой системе, нужно этот ген удалить и посмотреть, что будет без него. Этот стандартный исследовательский прием получил название генетический нокаут, или вышибание гена. В 2010 году была присуждена Нобелевская премия за разработку генетического нокаута с использованием эмбриональных стволовых клеток на экспериментальных моделях — мышах. Там тоже все основывалось на гомологичной рекомбинации, но если в природе такая рекомбинация происходит с частотой 10-6-10-7 событий на одну клетку, то в системе редактирования генома за счет внесения разрыва ДНК в нужном месте эффективность этого процесса повышается на три-четыре порядка. Это принципиально меняет трудозатраты и подход.
Но в 2013 году ситуация в технологии редактирования генома кардинально изменилась: мир заговорил о CRISPR/Cas9 — эта загадочная аббревиатура сегодня в первую очередь ассоциируется с тем, что мы называем геномным редактированием, а за открытие, которое за ней скрывается, была вручена Нобелевская премия по медицине 2020 года.
Впервые в мире биологии, биотехнологии, наук о жизни аббревиатура CRISPR прозвучала в 2002 году, но сегодня все специалисты в этих областях знают, что за непонятными буквами CRISPR скрывается очень большое научное открытие. Может быть, со временем оно даже будет оценено как одно из великих открытий первых десятилетий XXI века.
Расшифровывается эта аббревиатура тоже не слишком понятно: Clustered Regularly Interspaced Short Palindromic Repeats. По-русски: кластеризованные (расположенные группами) регулярно прерывающиеся короткие палиндромные повторы (напомню, что палиндромы — это слова-перевертыши, такие как слово «или», известная фраза «А роза упала на лапу Азора»).
На самом деле история этого открытия уходит в начало 1990-х годов. Конечно, начали с простейшего — микроорганизмов. И вот когда ученые стали расшифровывать генетический текст, составляющий геном микроорганизмов, как раз и была обнаружена эта странность — короткие палиндромные повторяющиеся фрагменты генетического текста в геноме бактерий, причем разных. Схематично это выглядело так: «или», «а роза азора», «или», «упала на лапу», «или»...
Было совершенно непонятно, к чему эти «или» могут относиться, и необычный феномен оставался загадкой очень долго. Понять, с чем имеют дело, ученые смогли только благодаря тому, что технологии секвенирования и анализа генетического текста совершенствовались все это время, а база знаний о геномах различных организмов постоянно пополнялась. Это может показаться удивительным, но в 2005 году сразу трем независимым группам исследователей удалось сделать шаг в понимании системы CRISPR. Именно широкомасштабное внедрение технологии секвенирования (напомним, что это специальный технологический процесс чтения генома, последовательности нуклеотидов ДНК) и компьютерного анализа генетического текста, который сегодня составляет отдельное направление исследований под названием биоинформатика, позволили сделать этот шаг.
Группа испанских ученых с помощью биоинформационных подходов анализировала геномы бактерий, которые уже были секвенированы и генетические тексты которых находились в базах данных, и обнаружила там коротенькие фрагменты бактериофагов — вирусов бактерий, разделенных «или», «упала на лапу». Как говорили раньше, произошло «открытие на кончике пера», только теперь вместо пера были принтер и компьютер. Две группы из Франции совершенно независимо секвенировали уже другие бактериальные геномы, которых еще не было в базах данных, и тоже обнаружили там маленькие кусочки генетического текста бактериофагов, разделенные повтором «или», «а роза азора» либо другими. Пазл понемногу начинал складываться. У бактерий в геноме есть фрагменты генетического текста их врагов — бактериофагов, то есть вирусов бактерий. Кусочки текста короткие, два десятка нуклеотидов. Это не то, что обнаружил Ледерберг, когда описывал интеграцию целого бактериофага в геном бактерии. Да и не одному бактериофагу принадлежат эти кусочки — они относятся к абсолютно разным бактериальным паразитам, которых у бактерий, как и у нас, великое множество. Это маленькие фрагменты чужого текста, разделенные палиндромами. Исследователи одной из французских групп заметили, что те штаммы бактерий, которые имели в своем геноме фрагмент бактериофага А, оказывались к нему устойчивы, не погибали. Те, которые имели фрагмент от Б, были устойчивы к Б. Но только вторая группа французских исследователей, обнаружив такое же явление, предположила, что в формирование этих структур вовлечена фрагментация (нарезание) ДНК продуктами генов с нуклеазной активностью, которые находились рядом с кластером CRISPR, поэтому соответствующие гены получили название CRISPR associated (ассоциированные с CRISPR), или Cas-гены. Более того, исследователи даже предположили, что это все нужно бактериальной клетке для борьбы с чужеродной ДНК. Это была их гипотеза. Доказательств еще не было, но уже предвиделась роль CRISPR/Cas.
НЕМНОГО ИСТОРИИ
Хочется немного остановиться на исследователях из второй французской группы. В нее входили два русских ученых — Александр Болотин и Алексей Сорокин, с которыми мне пришлось начинать карьеру в восьмидесятые годы, в бытность мою еще студентом Московского инженерно-физического института. Тогда мы встретились во Всесоюзном научно-исследовательском институте (ВНИИ) генетики и селекции промышленных микроорганизмов Главмикробиопрома СССР. Было такое ведомство, которое, помимо разработки штаммов микроорганизмов для медицины, сельского хозяйства и пищевой промышленности, должно было в случае необходимости в кратчайшие сроки переориентировать биотехнологические производства на выпуск микроорганизмов для биологического оружия. Но мы во ВНИИ генетики занимались мирными исследованиями по генной инженерии микроорганизмов и растений.
В лихие годы перестройки, когда ни генетика, ни медицина, ни питание не интересовали никого, все, кто мог, были увлечены растаскиванием имеющегося имущества, меньшая часть населения решила продолжить свою профессиональную деятельность, но там, где она востребована. Тогда много талантливых ученых покинули СССР для научной работы в странах Европы и Америки. Александр и Алексей работали в одной лаборатории ВНИИ генетики, и сначала Алексей уехал во Францию, чуть позже к нему присоединился Александр и еще несколько человек. После отъезда Саши Болотина я увиделся с ним в Новосибирске на конференции «Фундаментальные науки — медицине» в 2007 году. Мы встретились, как будто вчера расстались, и отлично провели время, засиживаясь чуть ли не до утра за разговорами. Александр тогда докладывал о новых открытиях в области CRISPR, а я, к своему сожалению, в то время совершенно не оценил важность этого открытия. У меня были свои интересы и увлечения: генная терапия, стволовые клетки человека; мне казалось, что это очень далеко от бактерий и бактериофагов.
Одной из компаний, давно применявших вирусы бактерий, является всем известная Danone, которая снабжает нас творожками и йогуртами под этим же торговым названием. Она активно использует бактериофаги в молочной продукции. Это делается для того, чтобы продукция, которую мы покупаем в магазине, была строго стандартизирована и сертифицирована. Любой творожок должен пройти правильный путь молочно-кислого брожения, и йогурты должны содержать только правильные микроорганизмы, чтобы получить определенный вкус. Во всех магазинах всех стран и городов продукция компании Danone не должна отличаться по качеству ни сегодня, ни завтра. Стандарт!
НЕТ В МИРЕ СОВЕРШЕНСТВА
Но представьте себе, что вы вылили ведро закваски в чан с пятьюдесятью тоннами молока. Перед тем как разлить продукт по баночкам и пустить на конвейерную упаковку, подходит дегустатор-биохимик и берет анализ. Проверяет — ба, это что ж такое? В свежем молочном продукте, кроме тех бактерий, которые были влиты в составе закваски, размножились еще какие-то! Продукт сброжен немножко по-другому, вкус чуть-чуть отличается от стандартного. Это плохо, ведь потребитель хочет, чтобы было так, как он привык. Мало того, могут измениться сроки хранения. А если йогурт скиснет раньше времени? А вдруг произойдет еще какая-нибудь неприятность, которую этот случайный попутный штамм бактерий может вызвать?
Увы, нет в мире совершенства. Иногда закваски чуть-чуть отклоняются от стандарта или молоко в чане может содержать небольшую долю случайно привнесенных бактерий. Это известная технологическая проблема.
Однако с проблемой попутных штаммов технологи научились бороться следующим образом. Специалисты выяснили, какие попутные, неправильные, ненужные нам бактерии появляются наиболее часто. И против них были найдены и выделены определенные бактериофаги, которые их убивали. При этом нужные микроорганизмы этими бактериофагами не инфицировались и чувствовали себя спокойно.
Вроде бы простое с технологической точки зрения производство, но какие там сложные взаимоотношения! Этот технологический процесс, который использовала компания Danone, отлично работал.
Но внезапно у Danone возникли серьезные проблемы. Работники компании обнаружили, что те бактериофаги, которые использовались в этом казалось бы стандартном технологическом процессе, перестали убивать ненужные бактерии. И творожки с йогуртами стали выходить скисшими, тухлыми, многие пошли в брак. Но почему?
Руководители Danone обратились за помощью к ученым. По случайности это исследование опять проводилось во Франции. Исследователи стали изучать бактерии Streptococcus thermophilus, которые наиболее часто используются для закваски, и устойчивость этого штамма к двум типам бактериофагов. Обнаружилось, что микроорганизм становится устойчив к фагу, если в его ДНК в район CRISPR попадает кусочек этого бактериофага и в бактерии активен ген Cas9. В 2007 году появилась работа, в которой было экспериментально показано, что наличие у бактерий кусочков вирусного генетического текста означает, что изучаемые бактерии были когда-то инфицированы этими вирусами и приобрели к ним иммунитет.
Прежде, до этого открытия, считалось, что адаптивный иммунитет присущ только высшим организмам, в том числе человеку. Благодаря его наличию, человек приспосабливается к окружающему миру в том смысле, что если он один раз встретился с некой инфекцией, то потом может стать к ней устойчивым. Многочисленные вакцины, которые, на наше счастье, снизили смертность от инфекционных заболеваний и тем самым увеличили среднюю продолжительность человеческой жизни лет на тридцать, как раз и связаны с адаптивным иммунитетом.
В отличие от бактерии, человек является многоклеточным организмом, в котором имеются различные ткани и есть системы органов, объединяющие различные ткани (опорно-двигательная, кровеносная и нервная системы), поэтому адаптивный иммунный ответ, функционирующий у человека, крайне сложен. Он основан на том, что распространение инфекции в сложно устроенном многоклеточном организме требует достаточно длительного времени — часов, а то и дней. Даже для вируса, который очень быстро распространяется по кровотоку, прохождение по кругу кровообращения все равно занимает пару десятков минут, а ведь ему еще надо проникнуть в клетки, которых в человеке 1014, чтобы инфицировать их.
Природа позаботилась о том, чтобы при попадании инфекции в организм он был всегда готов к ответу, стоял на страже своего здоровья. Происходит это так. Иммунной системой постоянно продуцируются различные варианты либо антител, либо клеток с распознающими рецепторами, которые путешествуют по нашему телу. Их вариантов существует множество, ведь неизвестно, с каким патогеном произойдет встреча, и они должны быть «заготовлены» чуть ли не на любой случай.
А дальше две возможности. Если за цикл путешествия по организму антитело или клетка с распознающим рецептором не встретили партнера по взаимодействию (бактерию, вирус или еще какого-нибудь врага), то они потом уничтожаются самим организмом, погибает клетка, продуцирующая данный вариант антитела или распознающего рецептора. Но если один из этих стражей встретил свою мишень, к которой он подходит, как ключ к замку, то клетка, которая произвела данное антитело или распознающий рецептор, не погибает, а начинает пролиферировать, то есть активно размножаться, чтобы своими «ключами» уничтожать все эти «замки».
Этот процесс, в котором осуществляется сложное клеточно-белковое взаимодействие, происходит постоянно. Беспрестанно генерируются миллионы B-лимфоцитов, вырабатывающих всевозможные антитела, и T-лимфоцитов, которые продуцируют клеточные рецепторы, распознающие чужеродные молекулы. Эти миллионы наших защитников все время погибают; только единицы из них, если человек инфицирован, встречаются со своими «половинками», «мишенями», которых они распознали. Таким образом, наш многоклеточный организм позволяет себе иметь ненужные в данный момент молекулы и клетки, которые массово производятся и уничтожаются при неиспользовании. Но бактерия — это всего одна клетка, все происходит на одной крохотной площадке. Обязанность бактерии — делиться каждые двадцать минут; как, например, это делает Esherichia coli, кишечная палочка — у нее не хватит энергии на то, что запросто делает многоклеточный организм, кидающий в себя ежедневно два килограмма пищи. У бактерии должны быть более простые и быстрые варианты защиты от той или иной внешней инфекции, в частности от бактериофагов.
Дальнейшие исследования детально объяснили, каким образом функционирует адаптивный иммунитет бактерии. Оказалось, что он, как и у человека, изначально работает случайным образом. К примеру, в бактериальную клетку проникает чужеродная ДНК бактериофага или плазмиды. Единственное, чем может бактериальная клетка защититься от проникшей в нее чужеродной ДНК, пока еще нет иммунитета, — это расщепить врага, уничтожить целостность генетической информации, то есть порезать ее на маленькие кусочки. Как только клетке удалось разрезать ДНК бактериофага в каком-то месте (а лучше в двух или даже трех местах), молекула вирусной ДНК становится нефункциональной и нанести вред клетке уже не может.
Но кусочки, на которые клетка расщепила ДНК бактериофага, не пропадают просто так. Они встраиваются в определенный район генома самой бактерии, который мы как раз и назвали CRISPR.
Итак, та бактерия, которой счастливо удалось избежать гибели от бактериофага и встроить крошечные кусочки его ДНК (короткие фрагменты по десять-пятнадцать нуклеотидов) в свой геном, получает устойчивость к данному бактериофагу и при делении передает эту устойчивость по наследству.
После того как кусочки ДНК бактериофага попали в CRISPR-район ДНК бактерии, эта бактерия начинает делать почти то же самое, что и многоклеточный организм: со своего CRISPR-района с чужеродными фрагментами она все время транскрибирует последовательности в виде коротких молекул РНК, которые когда-то пришли в бактериальный геном от вируса. Но присутствуют они не просто так, а уже вместе с нуклеазой Cas9.
Рассмотрим теперь, что происходит при повторном инфицировании этой бактерии тем же самым бактериофагом, кусочки которого в ней имеются. Если в бактерию проникла ДНК бактериофага, то короткая РНК способна связаться с комплементарным участком ДНК этого бактериофага, ведь она когда-то от него и произошла. И как только она это сделала, фермент Cas9, то есть нуклеаза, связанная с молекулой РНК, тут же расщепляет ДНК бактериофага и убивает врага (см. рис.7).
Эту короткую молекулу РНК, которая распознает определенный кусок генетического текста бактериофага и направляет нуклеазу на чужеродную ДНК, называют направляющей (guided) РНК.
Рис. 7. Работа CRISPR системы
ЧТО ЖЕ СЛУЧИЛОСЬ С DANONE
Мы рассмотрели, как у бактерии функционирует иммунная система, и стало понятно, что за беда приключилось у компании Danone. Обычная технология, когда в молочную массу добавляли бактериофаги, чтобы удалить посторонние бактерии, не сработала, продукты выходили испорченными. Такой результат получился оттого, что сотрудники компании регулярно применяли свои бактериофаги на одних и тех же штаммах бактерий, которые в конце концов приобрели устойчивость к данным вирусам, стали нечувствительны к ним. А это значит, что бактерии приобрели адаптивный иммунитет, но совершенно другим способом, чем человек, — без всяких антител.
Следующим важным открытием стало то, что система CRISPR/Cas9 уже известной нам бактерии Streptococcus thermophilus может эффективно работать в кишечной палочке Escherichia coli, то есть система универсальна и не видоспецифична на уровне микроорганизмов. Сообщение об этом открытии опубликовали в 2011 году коллеги из Вильнюсского института биотехнологий, который когда-то тоже входил в состав Главмикробиопрома СССР и занимался получением и очисткой различных ферментов для промышленности и научной работы.
Будущие нобелевские лауреаты 2020 года Эмманюэль Шарпантье и Дженнифер Дудна включились в изучение системы CRISPR в начале двухтысячных. Обе исследовательницы были специалистами по РНК и решили объединить свои усилия, чтобы экспериментально продемонстрировать молекулярные механизмы иммунитета бактерий на основе системы CRISPR/Cas9.
БОЛЬШАЯ РАЗНИЦА
Принципы распознавания чужеродных молекул, используемые иммунитетом многоклеточных (например, человека) и одноклеточных организмов (бактерий), совершенно различны. У людей главную роль в распознавании играют сложные белковые молекулы — антитела, а распознать они должны очень маленький, но значимый фрагмент того или иного белка — антиген. Он короткий, содержит порядка семи аминокислот и свернут в сложную трехмерную структуру. Антитело распознает не линейную последовательность и не отдельные аминокислоты, а антиген в целом, то есть и буквы, и то, в какую трехмерную структуру оказалась свернута эта линейная молекула.
А у бактерий система адаптивного иммунитета распознает не форму, а линейную структуру генетического текста. Есть последовательность вирусной ДНК, закодированная четырьмя нуклеотидами А, Г, Ц и Т, и есть направляющая РНК бактерии, которая должна просто распознать такую же последовательность в полтора десятка нуклеотидов, без всяких там форм, структур и сложного внешнего вида.
Коллеги из Вильнюса тоже продолжали работать в этом направлении и шестого апреля 2012 года отправили в авторитетнейший журнал Cell свою статью о роли CRISPR/Cas9 в иммунном ответе бактерий. Надо сказать, что процесс публикации научных данных в сегодняшней конкурентной среде очень сильно зависит от ненаучных обстоятельств. К сожалению, через шесть дней в публикации статьи было отказано даже без проведения внешней рецензии. Редактор журнала сразу написал авторам, что статья не представляет никакого научного интереса, и даже не обратился к своим коллегам-ученым с просьбой провести экспертизу представленных данных. Двадцать первого мая 2012 года авторы направили те же материалы в другой, как сейчас бы сказали, менее пафосный журнал Proceedings of the National Academy of Sciences (Труды национальной академии наук США), который опубликовал статью четвертого сентября. Увы, Шарпантье и Дудна опережают литовский коллектив на два месяца. Свою аналогичную статью они направили в журнал Science восьмого июня, а уже двадцать восьмого июня статья была не только принята, но и опубликована.
Сегодня нам известен целый ряд важнейших принципов устройства всего живого на нашей планете. Генетический код, то есть буквенный код нашего генома, одинаков — что у человека, что у бактерии. У всех живых существ ДНК состоит из одних и тех же четырех оснований. Принцип кодирования белков один и тот же. Этим универсальным генетическим кодом написаны индивидуальные (персональные, не одинаковые) тексты. Они отличаются последовательностями нуклеотидов, но основной принцип формирования у них одинаков.
И это не просто констатация неких научных фактов. На самом деле из них следует крайне важный для человечества практический вывод. Ученые предположили, что направляющая (guided) РНК, которая распознает генетический текст у бактерии и вируса, должна столь же успешно распознавать те самые полтора десятка букв генетического текста и внутри клетки человека. А если эта РНК так же, как в бактериальной клетке, связана с ферментом Cas9-нуклеазой, то как раз в том месте молекулы ДНК, где произошло распознавание, может быть сделан разрез. В целом ряде публикаций, вышедших в 2012 году, такая возможность подвергалась сомнению. Однако научные статьи, которые появились в самом начале 2013 года, экспериментально подтвердили ее для клеток млекопитающих, в том числе человека. Фермент Cas9-нуклеаза очень точно разрежет нить ДНК именно в том месте, на которое указала направляющая РНК. Это значит, что мы можем вносить разрыв в генетический текст человека, состоящий из трех миллиардов букв, внутри клетки с исключительно большой точностью, а главное — с удивительной простотой.
В начале этой главы мы говорили об инструментах для побуквенного редактирования генетического текста. Упоминали мегануклеазы, нуклеазы типа цинковых пальцев и т. д. Все это сложные белковые молекулы, которые обычно приходится подбирать в каждом случае отдельно и синтезировать искусственно. Для того чтобы создать подобную распознающую белковую молекулу и проверить ее действие, мы должны синтезировать определенную молекулу ДНК, потом синтезировать нужный белок, затем этот белок выделить, почистить, доказать его эффективность. Требования к правильности структуры распознающих белков очень велики, и их создание — достаточно трудоемкий процесс, который занимает до полугода.
ОЛИГОНУКЛЕОТИДНЫЙ СИНТЕЗАТОР
Уже больше тридцати лет ученые имеют возможность синтезировать короткие последовательности нуклеотидов с любым порядком букв на устройстве под названием олигонуклеотидный синтезатор. Я впервые познакомился с этим чудом в конце 1980-х годов, когда работал в лаборатории Университета Джона Хопкинса в США.
Синтезатор был размером с большую микроволновую печь. Туда подвешивались десятка полтора баночек, и надо было ввести нужную комбинацию букв генетического текста (А, Т, Г, Ц). Прибор начинал завораживающе щелкать, и через пару часов у меня уже был заказанный мною и введенный по буквам фрагмент генетического текста длиной в двадцать — двадцать пять нуклеотидов.
Совершенно иные возможности представило человеку открытие иммунной системы бактерий. Всего одна универсальная нуклеаза Cas9 и несколько букв генетического текста нужны для того, чтобы направить или, если хотите, запрограммировать эту нуклеазу на разрезание молекулы ДНК в определенном месте. Остальное делают природные механизмы. Сегодня можно просто, дешево и быстро химически синтезировать короткую последовательность нуклеотидов, необходимую в качестве направляющей РНК.
Сейчас скорость синтеза принципиально не изменилась, но в любом случае часа за два можно синтезировать нужную последовательность ДНК, которая будет кодировать направляющую РНК. Еще день-другой на несложные генно-инженерные манипуляции — и ваша направляющая РНК готова к работе: она находит на ДНК клетки определенный фрагмент генетического текста, который вы задали при ее синтезе, и в этом месте Cas9-нуклеаза производит разрыв ДНК.
В отличие от сложных белок-белковых трехмерных взаимодействий, у нас происходит простое уотсон-криковское взаимодействие двух линейных структур по принципу комплементарности, то есть взаимодополняемости (см. главу 1). Требуется всего-навсего определенная физиологическая концентрация поваренной соли — как в клетке и определенная температура — тридцать семь градусов Цельсия, поскольку именно при этой температуре живут наши клетки. Больше ничего не нужно. Поэтому длительность побуквенного редактирования генома сократилась от шести месяцев до десяти—четырнадцати дней. Просто, дешево и быстро! Благодаря этому, система CRISPR/Cas9 произвела революцию в современных технологиях генной инженерии.
После того как были открыты первые виды микроорганизмов, имеющих адаптивный иммунитет к бактериофагам, ученые стали искать и другие виды бактерий, тоже имеющих подобную систему защиты, и обнаружили их достаточно много. Отчасти эта активность была обусловлена стремлением запатентовать новые типы нуклеаз или принципы функционирования направляющей РНК для последующей возможной коммерциализации, но, как мы видели на примере йогуртов Danone, даже тот интерес, за который платят деньги, быстро приводит к новым научным открытиям и технологическим прорывам.
Системы CRISPR и ферменты, сходные с Cas9-нуклеазой, были обнаружены у очень многих видов бактерий. Оказалось, что они обладают несколько различающимися свойствами в плане распознавания коротких нуклеотидных последовательностей. Это важно, потому что, как мы помним, у человека в геноме три миллиарда букв, и если мы хотим как-то отредактировать генетический текст, резать надо очень точно и в строго определенном месте, то есть необходима специфичность разрезания. Например, если в случае использования CRISPR стрептококка для распознавания посредством направляющей РНК особенно важны только первые три нуклеотида, то в случае стафилококка уже требуется последовательность, в которой особенно важны первые шесть нуклеотидов. Среди трех миллиардов букв генома человека комбинация из трех нуклеотидов еще может найтись, но найти вторую такую же комбинацию из шести нуклеотидов направляющая РНК и фермент Cas9-нуклеаза едва ли сумеют, поэтому специфичность распознавания и точность разрезания будут намного выше.
Помимо поиска новых CRISPR-систем и Cas9-нуклеаз в различных бактериальных штаммах, люди, овладевшие навыками генной инженерии, сами пытаются тем или иным способом изменить, усовершенствовать эти ферменты под собственные нужды. И это на самом деле возможно, потому что если мы имеем какой-то фермент — скажем, нуклеазу, — то знаем, конечно, его структуру и можем постараться внести туда те или иные модификации, чтобы получить фермент с другими свойствами.
Например, первоначально Cas9-нуклеазы обладали такой активностью, что происходило разрезание обеих цепей ДНК. Это очень ценное качество, но исследователи решили попробовать сделать по-другому, и были получены модифицированные варианты этих ферментов, которые могли разрезать только одну нить ДНК. Почему это хорошо? Опять-таки, для повышения точности! Если мы в одной цепи ДНК делаем разрыв в одном месте, а в другой цепи — со сдвигом, скажем, на десять нуклеотидов в сторону, то направленность и точность распознавания сильно повышается, и единственный на весь геном разрез будет именно в этом месте. Бывают случаи, когда это совершенно необходимо.
Возможны и другие модификации. В частности, варьируя нуклеазную активность фермента, мы можем даже просто ее «убить», чтобы этот фермент совсем не имел нуклеазной активности. Тогда в клетке будет происходить высокоспецифичное распознавание, но никакого разрезания ДНК не произойдет вообще.
Конечно, надо честно признаться, что не все в обсуждаемом нами методе так идеально. Хотя исследователи исходят из того, что направляющая РНК осуществляет строго направленное воздействие и способна распознавать конкретные буквы генетического текста, всегда остается опасение, что случайным образом молекула ДНК может быть где-то разрезана еще и будет нарушена целостность генома. Это явление называется off-target, или внемишенный эффект. Поэтому для биомедицинских целей все усилия исследователей в использовании данного метода направлены на то, чтобы максимально повысить специфичность распознавания.
Это объясняет, зачем нужны модифицированные нуклеазы, которые распознают одну цепь. Чтобы с их помощью произвести двухцепочечный разрез, надо использовать две направляющие РНК к двум фрагментам генетического текста, и это повышает точность, а значит, уменьшает внемишенный эффект. Избегать таких эффектов — очень важная составляющая работы в области биологии и медицины, потому что главное — это все-таки безопасность для человека.
С тех пор как основным инструментом геномного редактирования стала система CRISPR/Cas9, в мире наблюдается взрывной интерес к ее применению в фундаментальной науке и множестве практических приложений. Создан целый ряд компаний, занятых редактированием геномов растений и модификацией животных. Существуют компании, работающие в области биомедицины, чтобы использовать эти же технологии в здравоохранении.
Во многих отношениях применение CRISPR/Cas9 сталкивается с теми же трудностями, что и другие сконструированные нуклеазы: это не всегда высокая эффективность разрезания ДНК, недостаточная специфичность есть проблемы с доставкой фермента в нужные клетки, а также возможность иммунной реакции (поскольку все нуклеазы содержат элементы, полученные от бактерий) и сложность оценки конечного результата. Но есть и одно громадное преимущество — простота использования по сравнению со всеми предшествующими инструментами редактирования генома.
Многие ученые внесли свой вклад в замечательные открытия, о которых мы говорили в этой главе. Но высшая награда, Нобелевская премия по химии за 2020 год, была присуждена двум выдающимся женщинам-исследователям — Дженнифер Дудна и Эмманюэль Шарпантье, которые сначала участвовали в открытии адаптивного иммунитета бактерий, а потом вместе с коллегами занимались разработкой технологии CRISPR/ Cas9.