Пусть это и произошло по воле случая, но момент оказался чрезвычайно удачным. Когда я начал переподготовку, было уже известно о разработке нового метода генетического тестирования. Через каких-то несколько лет наши чаяния сбылись и в этой области наступил переворот. По чистому везению я оказался в самой гуще событий.
Вспомним фантастическое падение стоимости полного секвенирования человеческого генома — от миллиардов долларов до тысячи с небольшим. На этом пути от казавшегося фантастическим проекта до рутинной процедуры было несколько знаменательных вех. Первыми известными по имени людьми, чей геном был прочитан полностью, были Крейг Вентер и Джеймс Уотсон. Третьим стал бизнесмен Дэн Стойческу
. Доктор Стойческу, сколотивший капитал на биотехнологиях, потратил часть его на полное секвенирование собственного генома, которое осуществила компания Knome. За это удовольствие с него взяли $350 000, что по тем временам, должно быть, казалось божеской ценой, учитывая, что всего годом ранее секвенирование генома Уотсона обошлось втрое дороже. На следующий год Knome запрашивала за секвенирование уже всего $100 000 — к тому времени нужно было либо быть совсем безбашенным, либо наплевательски относиться к своим деньгам, чтобы выбросить столько за технологию, дешевевшую на глазах.
Не столь эффектной, но куда более важной услугой, предложенной Knome, стало секвенирование экзома. Экзом — это те 1–2 % генома, которые кодируют белки: каждый экзон каждого гена плюс небольшие отрезки, прилегающие к их концам. Преимущество экзомного секвенирования в том, что прочитать последовательность 2 % генома намного дешевле, чем всего генома, и, так как почти вся значимая информация содержится в экзоме, возможности диагностики не особенно сужаются, если секвенировать только экзом.
Пятого октября 2009 г. ученый по имени Дэниел Мак-Артур в статье, опубликованной в журнале Wired, объявил о том, что компания Knome запускает услугу секвенирования экзома за $24 500
. Всего через пять лет Мак-Артур получил известность в мире генетики как руководитель проекта ExAC — базы данных по экзомам свыше 60 000 человек. Проект ExAC, впоследствии переросший в еще более обширную базу данных gnomAD, стал, пожалуй, важнейшим инструментом интерпретации результатов генетических анализов.
Однако в 2009 г. казалось, что секвенирование экзома еще не скоро придет в медицинскую практику. При таких расценках оно оставалось уделом богатых частных лиц и исследовательских лабораторий с основательным финансированием. Хотя и было очевидно, что рано или поздно его начнут применять для диагностики, никто и представить себе не мог, насколько быстро это произойдет.
Двигателем прогресса стали технологии. В проекте «Геном человека» использовался метод секвенирования по Сэнгеру, при котором клонируют короткие фрагменты ДНК и затем расшифровывают их — обычно по несколько сотен нуклеотидов за раз. Это успешно работает, если задача небольшого масштаба. Средний ген содержит 10–20 экзонов. Размножить от 10 до 20 коротких отрезков ДНК, секвенировать их и сравнить выявленную последовательность с ожидаемой — достаточно большой объем работы, но все же вполне осуществимый. Это как если бы корректору дали толстую книгу, но вычитать велели только оглавление. Таким способом можно даже секвенировать весь геном, то есть вычитать всю книгу. Именно так и поступили в первый раз — но понадобились миллиарды долларов и многолетний труд. И в наши дни будет так же, если у кого-нибудь хватит безумия повторить эту попытку. Даже подступиться к секвенированию экзома конкретного человека — неподъемная задача, если использовать старую технологию: понадобилось бы клонировать, секвенировать и прочесть 300 000 отдельных отрезков ДНК.
Таким образом, очевидно, что, если мы хотим сделать широкомасштабное секвенирование доступным видом анализа, нужен другой подход к проблеме. Уже сейчас существуют как минимум пять-шесть различных технологий, позволяющих это осуществить с помощью разнообразных химических хитростей. В их основе лежит одна общая идея — одновременно прочитывать очень много отдельных кусочков ДНК. Этот метод называется массивно-параллельным секвенированием
[56], и впервые его предложила компания 454 Life Sciences (ныне прекратившая существование). Название ее довольно загадочно; по слухам, это был номер дома, в котором первоначально располагалась компания, но также предполагали, что это температура горения денежной купюры (по Фаренгейту).
Компанию основал Джонатан Ротберг, один из великих изобретателей и предпринимателей современной эры генетики. Еще в студенческие годы Ротберг создал одну из первых компаний, занимающихся геномикой, — CuraGen, дочерней компанией которой затем стала 454 Life Sciences. Позже он основал, помимо многих других, еще две крупные компании по геномике — RainDance (с куда более удачным названием) и Ion Torrent.
Изначально ускорить процесс генетического секвенирования Ротберга побудил личный опыт: один из его детей родился тяжелобольным. Ротберг решил, что лечащие врачи должны располагать возможностями оперативно провести генетический анализ и убедиться, что у таких детей нет наследственных заболеваний. Надо отдать ему должное, этой цели он достиг: в нашей лаборатории используется секвенатор Proton производства Ion Torrent для срочного экзомного секвенирования в целях диагностики наследственных заболеваний у младенцев.
Компания 454 Life Sciences добилась ряда заметных успехов до того, как появление более новых, быстрых и дешевых секвенаторов списало их аппараты в утиль. Геном Джеймса Уотсона
был секвенирован усилиями 454 Life Sciences, а эволюционный генетик Сванте Паабо использовал технологию секвенирования этой компании при предварительной расшифровке генома неандертальца. В результате этого исследования он обнаружил, что неандертальцы в некотором роде не вымерли: благодаря межвидовому скрещиванию у большинства людей в геноме есть несколько процентов примеси неандертальских генов, а суммарно в геномах современного человечества сохраняется примерно одна пятая неандертальского генома
[57].
Чтобы секвенировать геном неандертальца, необходима возможность работать с очень малыми количествами ДНК — за тысячелетия ее сохранилось немного. Эта ДНК фрагментарная, разложившаяся, и даже микроскопические следы ДНК современных людей могут ее загрязнить. Секвенировать такой геном — совсем не то, что работать с геномом ныне здравствующего существа, от которого можно постоянно получать дополнительные образцы ДНК.
И здесь на сцену выходит один из великих невоспетых героев современной генетики — я имею в виду NA12878. Звучит не очень героически, но в лабораторной генетике данная аббревиатура пользуется заслуженной славой — это кодовое обозначение так называемого «Генома в бутылке» (Genome In A Bottle
[58]). На самом деле «Геномов в бутылке» не один, а множество, но NA12878, безусловно, самый знаменитый и широко используемый. Этим шифром обозначена ДНК женщины, жившей в 1980 г. в штате Юта. Известно, что на тот момент ее родители были живы и что у нее было 11 детей (6 сыновей и 5 дочерей). Она и ее родители дали согласие на использование их ДНК в самых широких научных целях; было также получено согласие от имени ее детей (неизвестно, насколько взрослыми они были на тот момент и могли ли дать согласие сами). Ее клетки размножили в лаборатории по методу, которым получают, по сути, бессмертные клеточные линии, и добыли из них огромное количество ДНК.