Однако это едва ли вам сильно поможет. Прежде всего, может оказаться, что сама по себе данная генетическая вариация не имеет прямого отношения к риску инсульта. Она может быть безвинной попутчицей, которая просто сидит и никого не трогает где-то поблизости от другой мутации — истинной виновницы. А значит, обнаружение подобной вариации зачастую всего лишь начало долгого и утомительного поиска настоящего злодея. Вторая проблема заключается в том, что полученные данные, по сути, ничего не говорят нам о конкретном человеке. Если у половины популяции в определенном месте ДНК стоит Ц и этот вариант лишь ненамного повышает риск инсульта, незачем особенно беспокоиться, обнаружив его у себя. Данные могут оказаться неприменимыми к другой популяции: например, связь между наличием варианта с Ц и инсультом достоверна только для европейцев. К сожалению, у нас наблюдается переизбыток исследований на европейском материале (я говорю «к сожалению», так как аналогичных исследований на материале других популяций нам отчаянно не хватает).
Существует довольно высокая вероятность того, что предмет ваших поисков с помощью GWAS не находится в данном гене. Чаще всего так и бывает. Иногда это происходит в силу пресловутого феномена безвинного попутчика — есть изменения в значимом гене, а Ц (вместо Т) расположен по соседству с этой мутацией. Однако чаще всего, когда удается установить причинно-следственную связь между данным вариантом и интересующим нас заболеванием, оказывается, что дело в управлении генами, а не в том, что мутация гена как-то изменяет кодируемый им белок. Геном изобилует последовательностями, которые играют важную роль при регуляции активности в клеточном ядре. Обычно это осуществляется с помощью сигналов в форме РНК — молекулы, очень похожей на ДНК, но все же отличающейся от нее. Она активирует нечто, что подавляет что-то другое, а то, в свою очередь, изменяет активность гена, чтобы он производил больше или меньше белка… и все это может иметь отношение к изначально интересующему вас вопросу. Мы еще далеко не полностью разобрались в этой сигнальной сети, но, по-видимому, многие совпадения, выявленные с помощью GWAS, связаны с тонкими сдвигами равновесия в весьма запутанной информационной паутине — и это не то, что можно выяснить с наскока.
В идеале, конечно, хотелось бы выявить все генетические вариации, обусловливающие болезни у человека
[114], а также различные признаки, такие как рост. Если бы мы смогли окончательно разобраться в генетических факторах, определяющих, например, случится ли у данного человека сердечный приступ, возможно, у нас бы появились новые способы его предотвратить.
Задолго до секвенирования генома человека имели место попытки выяснить, насколько гены определяют различные заболевания и признаки. В ходе пресловутого спора «природа или среда» (nature vs nurture) пытались на практике измерить роль «природы». В этой области широко применяется такой параметр, как наследуемость — то, насколько изменчивость данного признака в популяции обусловлена генами, а не средой. Название «наследуемость» внушает мысль, будто речь идет о непосредственном измерении вклада «природы» в данное уравнение, но это не совсем так: в действительности речь идет об изменчивости в пределах популяции. Для наглядности представим, что вы изучаете цвет волос у двух разных групп. Одна группа состоит исключительно из нигерийцев, другая представляет собой случайную выборку бразильцев. У всех нигерийцев черные волосы, поэтому отсутствует изменчивость по цвету волос, которую можно измерить, а потому наследуемость будет равна нулю. Это отнюдь не значит, что гены не играют роли в определении цвета волос нигерийцев — очень даже играют. В то же время у бразильцев встречаются все оттенки — от черного до белокурого. Эта изменчивость по большей части объясняется генетически, так что наследуемость будет высокой.
Существует несколько способов рассчитать наследуемость. Распространенный и относительно простой метод — сравнить, насколько отличаются однояйцевые и разнояйцевые близнецы. Предполагается, что пара близнецов растет в одной и той же среде, вплоть до условий внутриутробного развития, и что воздействие внешней среды на однояйцевых и разнояйцевых близнецов одинаково. Так как у однояйцевых близнецов все гены общие
[115], тогда как у разнояйцевых в среднем лишь половина общих генов, можно ожидать (обычно так и бывает), что однояйцевые близнецы похожи друг на друга больше, чем разнояйцевые, не только внешне, но и по таким параметрам, как рост, кровяное давление и пр. Достаточно простые — по математическим меркам — расчеты позволяют измерить это различие в пределах группы близнецов и использовать для оценки наследуемости. Показатели наследуемости, независимо от метода расчета, варьируют от нуля (вклад генов в изменчивость данной популяции отсутствует) до единицы (изменчивость полностью обусловлена генами), а могут также выражаться в процентах.
Оценки наследуемости различных признаков неодинаковы в разных исследованиях и для разных популяций. Один из параметров, данные по которому довольно хорошо согласуются в целом ряде исследований, — рост: в популяциях, где люди хорошо питаются, наследуемость роста 0,8. Большая часть изменчивости роста обусловлена генетически. Китайские исследования показали более низкую наследуемость роста — около 0,65. Это не отменяет важной роли генов, но говорит о том, что среда в Китае может играть более значимую роль, чем, например, в США. Возможное объяснение связано с тем, что если мать голодала, вынашивая вас, а в детстве вы также недоедали, то вы можете не достичь того роста, до которого доросли бы в нормальных условиях. При изучении людей, чье детство выпало на тяжелые времена, наблюдается более сильное влияние среды, снижающее значение генов.
Использование GWAS стало возможным в середине 2000-х гг., а широко применяться этот метод стал примерно с 2007 г. Очень скоро специалисты по GWAS столкнулись с обескураживающей проблемой: наследуемость не обнаруживалась. К 2010 г. после немалых усилий с помощью метода GWAS удалось объяснить лишь 5 % изменчивости роста, что весьма далеко до 80 %, предсказанных расчетами наследуемости! За прошедшие десять с лишним лет этот разрыв постепенно уменьшался, но при этом никуда не делся и не получил полноценного объяснения. В самом масштабном на данный момент исследовании генетики роста использовались данные почти полумиллиона жителей Великобритании, добровольно предоставивших ДНК и подробные личные и медицинские сведения в рамках проекта «Биобанк Великобритании» (UK Biobank). Группа под руководством Стивена Сюя (это другой Сюй, о нем мы поговорим позже) сумела использовать этот кладезь данных для объяснения 40 % изменчивости роста — впечатляющий прорыв, однако до точного предсказания роста конкретного человека лишь по ДНК нам еще далеко. Разработанный ими прогностический метод позволил предсказать рост большинства людей в группе (в нее входили не те, у кого собирали первоначальные данные) с точностью до нескольких сантиметров. Звучит впечатляюще, однако разброс возможных реальных значений роста для каждого предсказанного значения роста был достаточно велик. Вообразите себе показания свидетеля в суде: «Думаю, что преступник был ростом 173 см плюс-минус несколько сантиметров, но возможно, его рост был 158 или 188 см».