Существуют важные ограничения, связанные с секвенированием, о которых нужно знать. Когда человек проходит секвенирование (некоторые называют его «расшифровкой генома»), обычно примерно 3,5 млн вариантов основных пар сравниваются с эталонным человеческим геномом. Но, как мы уже говорили в связи с BRCA, компанией Myriad Genetics и постановлением Верховного суда, большинство вариантов окажутся так называемыми вариантами неопределенной значимости. О них узнают после того, как пройдут секвенирование миллионы людей с различной наследственностью, с самыми разнообразными множественными заболеваниями, а также члены их семей. Наконец, мы не только представляем собой непостижимые до конца мозаики из ДНК, но мы не все из них можем секвенировать. Хотя и принято использовать термин «полногеномное секвенирование», на самом деле примерно 900 генов из 19 000 недоступны из-за их местоположения или по другим техническим причинам. Так что нам предстоит еще многое узнать о нашем геноме в будущем, и гораздо больше, чем то, чего я коснулся в этом кратком обзоре.
Транскриптом
До того как наши клетки могут что-то сделать с нашей ДНК, они должны транскрибировать ее в РНК. Это известно уже несколько десятилетий, но наше уважение к роли РНК невероятно выросло за последние годы. Были не только обнаружены и охарактеризованы различные формы РНК, но также стало понятнее и их динамическое влияние на правила работы генома. Это и есть транскриптом, и технологии развивались быстро, от первых попыток выявления экспрессии генов по всему геному до секвенирования РНК, которое выявляет гибридные гены и большое количество разнообразных РНК. Многие из них имеют отношение к болезням или профилактике здоровья.
Протеом и метаболом
Мы уже давно оцениваем наличие белков (протеинов) при проведении самых обычных лабораторных процедур, например при исследовании функционирования печени или почек. Но теперь представления о белковой биологии человека заметно расширились, позволяя нам определять взаимодействия белок−белок у человека, а также присутствие аутоантител (антител, направленных против собственных белков человека). Точно так же, используя масс-спектрометрию, можно оценить целый ряд метаболитов (соединений, получающихся в результате нашего метаболизма), которые производит человек в определенный момент. Результат – это широкий обзор с большим охватом, в отличие от оценок одного или группы белков или метаболитов, которые выполняются во время обычных лабораторных исследований. Доступ к целому ряду транскриптов РНК отдельного человека, а также белкам и метаболитам в любой конкретный момент создает невероятные возможности для понимания текущих биологических процессов.
Микробиом
Большинству из нас трудно принять тот факт, что мы на девять десятых – микробы и только на одну десятую – люди, по крайней мере в том, что касается подсчета клеток. Эпоха секвенирования пролила свет на то, что внутри нас или на нашем теле живут триллионы микробов (бактерий, вирусов, грибков). Разнообразие ДНК внутри нас в результате существования микробов значительно превосходит разнородность нашей собственной ДНК – это 100 трлн клеток вместо 37 трлн, свыше 8 млн генов вместо всего примерно 19 000 и более 10 000 видов вместо одного18. Микробиом представляет собой интерфейс между человеком и его окружением. Например, питание человека сильно влияет на его микробиом. И медицинская важность этих микробов существенно выросла, причем так, что большинство из нас этого и предположить не могли, что они влияют на ожирение, рак, сердце, аллергические и автоиммунные заболевания, а также многие другие состояния, в которых особенно важен микробиом кишечника.
Эпигеном
Боковые цепочки и упаковка нашей ДНК в результате метилирования, модификации гистонов и хроматин представляют собой еще одну очень динамичную часть нашей геномной биологии. Например, метилирование основной пары в геноме может отключить ген. Доступ к определенному участку генома для эпигеномных маркеров сегодня технически несложен. Эпигеномические изменения могут передаваться по наследству независимо от последовательности нашей ДНК, и «перепрограммирование» влияет на целый ряд заболеваний, включая рак, диабет, а также аутоиммунные и сердечно-сосудистые заболевания. Как и РНК, и белки, эпигеном является очень специфическим для клетки – изменения в одном типе клетки в боковой цепочке ДНК могут полностью отличаться от изменений в других типах клеток. Учитывая, что в нашем теле свыше 200 типов клеток, понятно, насколько разнообразным может быть влияние на нашу биологию. Человеческий эпигеном можно представить в виде карты, но, в отличие от человеческого генома, это пока еще не удается сделать на должном уровне.
Экспосом
Окружающая среда, в том числе радиация, загрязнение воздуха, цветочная пыльца, пестициды, оказывает огромное влияние на наше здоровье. Уже существуют и активно совершенствуются специальные датчики – беспроводные или подключаемые к смартфонам, которые позволяют отслеживать такие воздействия и делать количественные измерения.
В целом эти десять «омов» предоставляют паноромный обзор человека с беспрецедентным объемом информации, которая по мере развития медицины будет становиться все более доступной и полезной. Ни у одного человека пока еще не было проведено полногеномного исследования, но ближе всего к этому подошел Майкл Снайдер, директор Центра геномики и персонализированной медицины Стэнфордского университета. У Снайдера секвенировали весь геном, а также в различное время – транскриптом, протеом и метаболом19. Польза этого стала очевидна после того, как вскоре после перенесенной инфекции верхних дыхательных путей ему диагностировали сахарный диабет. Данные «омик» могут показаться не связанными, но, похоже, они образуют общую картину, несмотря на то что никто раньше не заявлял о подобной связи. Диагноз привел к тому, что Снайдер изменил образ жизни и восстановил гомеостаз глюкозы, а кроме того, отправил на проверку нескольких родственников, и оказалось, что у них есть не выявленное нарушение толерантности к глюкозе. Диета и физические упражнения помогли и им. В дальнейшем исследовательская группа Снайдера в Стэнфордском университете, в которую входит 40 человек, расширила первоначальную программу секвенирования эпигенома Снайдера, микробиома кишечника и использования многочисленных биодатчиков. Получение этой информации, сопоставимой с ГИС, породило огромное количество данных: 1 терабайт (Тбайт, триллион байтов) для цепочки ДНК, 2 Тбайта для данных эпигенома, 1 Тбайт для транскриптома и 3 Тбайта для микробиома5. Для сравнения: 1 Тбайт информации содержится в 1000 экземпляров Британской энциклопедии, а 10 Тбайт – столько примерно насчитывается в паноромном проекте Снайдера – отражает информационный масштаб всей Библиотеки Конгресса. Каждый год в мире генерируется примерно 5 зеттабайтов данных, или 40 секстильонов байтов20. Если мы разделим это количество на 7 млрд человек, живущих на Земле, то получится, что в среднем на одного человека генерируется почти 1 Тбайт данных в год. Хотя такого понятия, как средний человек, не существует, этот расчет дает представление о том объеме данных, которых можно ожидать от человеческой ГИС.