Но насколько он высок? Учитывая, что 23andMe обнаружили, что я обладаю определенным генотипом, каков мой прогнозируемый риск – вероятность развития болезни? Прежде чем делать какие-то выводы, я должен был убедиться, что их математический анализ проведен на надежной основе.
•
Лучший способ разобраться с прогнозируемым риском болезни Альцгеймера – продольное исследование, для которого отбирается огромное количество лиц, представляющих население в целом, устанавливается их генотип, а затем их регулярно проверяют, чтобы узнать, у кого развивается эта болезнь. С помощью этих репрезентативных данных можно сравнить риск получить болезнь Альцгеймера для данного генотипа с риском по популяции в целом – так называемым относительным риском. Обычно, однако, такое масштабное исследование обходится непомерно дорого из-за большого количества участников (особенно при редких заболеваниях), которых надо обследовать, и сроков, в течение которых их необходимо наблюдать.
Более распространенным, но менее надежным является метод анализа серии контролируемых случаев. Для такого анализа отбираются несколько человек, уже страдающих болезнью Альцгеймера, а также ряд «контрольных случаев» – людей со сходными жизненными обстоятельствами, но не больных. (В третьей главе мы увидим, почему тщательный контроль жизненных обстоятельств имеет большое значение). В отличие от продольного исследования, в котором участники отбираются независимо от статуса заболевания, в этом случае внимание исследователей сосредоточено на носителях заболевания, поэтому такой анализ не дает оценку заболеваемости среди населения в целом. В результате прогноз относительного риска получается искаженным. Тем не менее эти испытания позволяют точно рассчитать соотношения рисков, которые не требуют знать общую распространенность заболевания среди населения.
Те, кто бывал на собачьих бегах или скачках, могут вспомнить, что вероятность победы в забеге часто выражается в коэффициентах. Аутсайдер может иметь коэффициент 5 к 1. Это означает, что в пяти из шести идентичных забегов это животное, скорее всего, проиграет, а выиграет лишь в одном. Вероятность его победы составляет 1 к 6. Естественный способ описывать шансы против – задавать соотношение вероятности того, что событие не произойдет, и вероятности того, что оно произойдет (в данном случае 5/6 к 1/6, или, проще, 5 к 1). Фаворит гонки, напротив, может иметь коэффициент 2 к 1. В спортивном тотализаторе принято всегда ставить на первое место большее число, поэтому необходимо различать коэффициенты «на» и «против». Коэффициент «на», обратный коэффициенту «против», выражает отношение вероятности того, что событие произойдет, к вероятности того, что оно не произойдет. При коэффициенте 2 к 1 можно ожидать, что фаворит в трех забегах выиграет два раза и проиграет один. Таким образом, вероятность того, что фаворит выиграет, составляет 2 из 3 или 2/3, а вероятность того, что он проиграет, составляет 1/3, что и дает коэффициент 2/3 к 1/3 или, проще, 2 к 1.
Комментаторы и букмекеры порой говорят о «фаворите с высокой котировкой» – как правило, когда речь идет о забегах с небольшим количеством лошадей. Этот жаргонизм – тавтология. Любая лошадь с положительным коэффициентом (выше единицы) котировок является фаворитом по определению, поскольку в любом забеге математически может быть только одна лошадь, которая с большей вероятностью выиграет, чем проиграет. В забеге же с большим количеством лошадей вероятность выиграть ниже. Так, в самых известных скачках Великобритании Grand National участвуют 40 лошадей. Даже победитель 2018 года, Tiger Roll, считавшийся неоспоримым фаворитом в 2019 году (в конце концов он и выиграл), имел шансы 4 к 1 «против». Поскольку большинство лошадей вряд ли выиграют большинство забегов, коэффициенты на лошадей, начинающиеся с высокого числа, как правило, это коэффициенты «против» – если прямо не указано иное.
В медицинских сценариях все наоборот. Шансы обычно выражаются в виде коэффициента «за» – вероятности того, что событие произойдет, относительно вероятности того, что оно не произойдет, а поскольку мы обычно говорим о заболеваниях с уровнем распространения среди популяции ниже 50 %, первым обычно называется меньшее число.
Чтобы посмотреть, как вычислить медицинские шансы и желаемое соотношение шансов, рассмотрим гипотетическое исследование конкретного контролируемого случая о влиянии единственного варианта Е4 (как в моем профиле ДНК) на вероятность развития болезни Альцгеймера к 85 годам. Результаты представим в табл. 1. Шансы развития болезни Альцгеймера к 85 годам в случае с одной копией варианта Е4 в генотипе (как и у меня) представляют собой количество людей с болезнью (100), деленное на количество людей без болезни (335), то есть 100 к 335 или, в виде дроби, 100/335. По той же логике, с учетом данных из второй строки таблицы, шансы развития болезни к 85 годам у обладающих распространенным генотипом с двумя копиями варианта Е3 составляют 79 к 956, или 79/956. Таким образом, соотношение шансов – это сравнение шансов на развитие болезни у человека с заданным генотипом (например, одна копия варианта Е4 и одна копия варианта Е3) с шансами развития болезни у человека с наиболее распространенным генотипом (две копии варианта Е3). Для гипотетических показателей, приведенных в табл. 1, соотношение шансов составляет 100/335, деленное на 79/956, что дает 3,61. Крайне важно, что соотношение шансов не требует от нас знать уровень распространения болезни в популяции в целом, поэтому его можно легко вычислить на основе анализа конкретных случаев.
Табл. 1. Результаты гипотетического тематического исследования о влиянии варианта одной копии Е4 на развитие болезни Альцгеймера к 85 годам
Показатель соотношения шансов сам по себе не дает информации о значении относительного риска (вероятности получения заболевания для генотипа Е3/Е4 относительно вероятности получения заболевания для генотипа Е3/Е3), но, объединив его с общим популяционным риском заболевания и известными частотами генотипов
[56], можно определить вероятность заболевания для данного генотипа. Этот расчет очень непрост. Более того, не существует даже однозначно определенного способа его сделать. Я попытался воспроизвести тот же показатель риска развития поздней болезни Альцгеймера, что обнаружил в присланном отчете, используя тот же метод, что и в 23andMe, и данные, взятые непосредственно из отчета или из документов, которые они цитировали
[57]. (Если вам интересно, при расчете мне предстояло найти вероятность развития заболевания, решив систему из трех взаимосвязанных уравнений для трех неизвестных условных вероятностей при помощи нелинейной программы поиска решений – как раз в таких задачках я люблю покопаться в процессе своей повседневной работы). Я обнаружил небольшие, но потенциально очень значимые расхождения между моими результатами и результатами 23andMe. Мои расчеты подсказывали, что к выкладкам 23andMe стоит отнестись с некоторым скептицизмом.