Обратите внимание, что мы начали говорить о причинных и непричинных направлениях. Мы не сделали этого в примере с чайной, потому что там было не важно, что делали в первую очередь — заказывали чай или просили пирожные. Было важно одно: какую условную вероятность можно оценить. Но причинно-следственный контекст проясняет, почему мы чувствуем себя менее уверенно, оценивая обратную вероятность, а в эссе Байеса прямо говорится, что его интересовала именно эта задача.
Предположим, 40-летней женщине сделали маммографию, чтобы проверить, нет ли у нее рака груди, и результаты оказались положительными. Гипотеза D (от англ. disease — «болезнь») состоит в том, что у нее рак. Доказательство, T (от англ. test — «анализ, обследование») представляет собой результат маммографии. Насколько стоит верить этой гипотезе? Следует ли делать операцию?
Мы можем ответить на эти вопросы, переписав правило Байеса следующим образом:
Обновленная вероятность D = P (D | T) = Отношение правдоподобия × Априорная вероятность D (1),
где новый термин «отношение правдоподобия» определяется как P (T | D) /P (T). Он измеряет, насколько вероятнее положительный результат обследования у людей с этим заболеванием, чем у населения в целом. Таким образом, уравнение (1) говорит, что новые данные T увеличивают вероятность D на фиксированную пропорцию независимо от того, какой была априорная вероятность.
Приведем пример, чтобы увидеть, как работает эта важная концепция. У обычной 40-летней женщины вероятность заболеть раком груди в следующем году — приблизительно 1:700, поэтому мы будем использовать ее в качестве априорной вероятности.
Чтобы вычислить отношение правдоподобия, нам нужно знать P (T | D) и P (T). В медицинском контексте P (T | D) — это чувствительность маммограммы, т. е. вероятность положительного результата, если у пациентки рак. По данным Консорциума по надзору за раком груди (Breast Cancer SUrveillance ConsortiUm; BCSC), чувствительность маммограммы для 40-летних женщин составляет 73 %.
Со знаменателем P (T) дело обстоит немного сложнее. Положительный результат T может быть получен как от пациенток, у которых есть эта болезнь, так и от пациенток, у которых ее нет. Таким образом, P (T) должно быть средневзвешенным значением P (T | D) (вероятность положительного результата у тех, кто болеет) и P (T | ~D) (вероятность положительного результата у тех, кто этим не болеет). Второй называют уровнем ложноположительных результатов. Согласно BCSC, уровень ложноположительных результатов для 40-летних женщин составляет около 12 %.
Почему средневзвешенная? Потому что здоровых женщин (~D) намного больше, чем женщин, больных раком (D). Фактически только 1 из 700 женщин страдает этим недугом, а остальные 699 — нет, поэтому вероятность положительного результата теста для случайно выбранной женщины должна гораздо сильнее зависеть от 699 женщин, у которых нет рака, чем от одной женщины, у которой он есть.
Получить средневзвешенное значение можно с помощью следующих вычислений: P (T) = 1/700 ∙ 73 % + 699/700 ∙ 12 % a 12,1 %. Коэффициенты обусловлены тем, что только у 1 из 700 женщин вероятность положительного результата составляет 73 %, а у остальных 699–12 %. Как и следовало ожидать, P (T) оказался очень близок к уровню ложноположительных результатов.
Теперь, когда мы знаем P (T), наконец-то можно вычислить обновленную вероятность — шанс женщины заболеть раком груди после того, как результат окажется положительным. Отношение правдоподобия составляет 73 % / 12,1 % ≈ 6. Как я уже говорил, это фактор, на который мы увеличиваем ее априорную вероятность, чтобы вычислить обновленную вероятность рака. Поскольку ее априорная вероятность была равна 1 из 700, ее обновленная вероятность составляет 6 ∙ 1/700 a 1/116. Другими словами, у нее все еще есть вероятность заболеть раком и она составляет менее 1 %.
Вывод поразительный. Я думаю, большинство 40-летних женщин с положительным результатом маммографии были бы изумлены, узнав, что шанс заболеть раком груди у них составляет менее 1 %. Рис. 14 поможет понять причины: крошечное число истинно положительных результатов (т. е. женщин с раком груди) несоизмеримо с огромным числом ложноположительных результатов. Наше удивление по поводу этого явления объясняется общей когнитивной путаницей между прямой вероятностью, которая хорошо изучена и тщательно задокументирована, и обратной вероятностью, необходимой для принятия личного решения.
Конфликт между нашим восприятием и реальностью частично объясняет протесты, возникшие, когда рабочая группа по профилактике болезней (Preventive Services Task Force) в США в 2009 году рекомендовала 40-летним женщинам не проходить ежегодную маммографию. Рабочая группа понимала то, чего не осознавали многие женщины: положительный результат обследования в этом возрасте с большей вероятностью будет ложной тревогой и многие женщины в таких случаях испугаются зря (и получат ненужное лечение).
Рис. 14. В этом примере, основанном на количестве ложноположительных и ложноотрицательных результатов, предоставленных Консорциумом по надзору за раком молочной железы, только 3 из 363 40-летних женщин с положительным результатом обследования на рак груди действительно оказались больны (пропорции не совсем соответствуют тексту из-за округления) (источник: инфографика Маян Харел)
Но все было бы иначе, если бы у нашей пациентки был ген, который подвергал бы ее высокому риску рака груди, скажем с одним шансом из 20 в течение следующего года. Тогда положительный результат повысил бы вероятность почти до одного из трех. Для женщины в этой ситуации шансы, что обследование даст жизненно важную информацию, намного выше. Вот почему рабочая группа рекомендует женщинам из группы высокого риска делать маммограммы ежегодно.
Этот пример показывает, что P (болезнь | обследование) неодинаков для всех; вероятность зависит от контекста. Если вы знаете, что изначально подвержены высокому риску заболевания, правило Байеса позволяет вам учесть эту информацию. Или, если вы знаете, что риска нет, обследование просто не нужно. Напротив, P (обследование | болезнь) не зависит от того, находитесь вы в группе риска или нет. Вероятность устойчива к таким вариациям, что до некоторой степени объясняет, почему врачи систематизируют и передают свои знания с помощью прямых вероятностей. Вариации — это свойства самой болезни, ее стадии развития или чувствительности детекторов; следовательно, они остаются относительно инвариантными к причинам заболевания (эпидемия, диета, гигиена, социально-экономический статус, семейный анамнез). Обратная вероятность P (болезнь | обследование) чувствительна к этим условиям.