
Онлайн книга «Путеводитель для влюблённых в математику»
Ответ выглядит очевидным. Мы указали, что тест дает верные результаты в 98 % случаев. Таким образом, вы больны с вероятностью 98 %. Верно? Вообразим город с миллионом жителей. Один из тысячи болен. Другими словами, 1000 жителей больны и 999 000 здоровы. Все жители проходят медицинское тестирование. Посмотрим, сколько будет положительных результатов, если тест эффективен на 98 %. • Среди тысячи больных жителей положительный результат получит большинство, но не все. Их количество 1000 × 0,98 = 980. • Среди 999 000 здоровых жителей большинство покинет поликлинику с радостной новостью об отсутствии болезни, но 2 % получат ложный результат. Это дает еще 999 000 × 0,02 = 19 980 положительных результатов. В общей сложности 980 + 19 980 = 20 960 жителей получат положительный результат. Теперь мы можем правильно ответить на поставленный вопрос: какова вероятность того, что вы больны, если ваш результат тестирования положительный? Среди двадцати с лишним тысяч людей с положительным результатом всего лишь меньше тысячи действительно больны. Точная вероятность правильности теста в этом случае равна ![]() Вероятность того, что вам стоит беспокоиться, не равна 98 %! На самом деле вероятность того, что вы заражены этой редкой болезнью, меньше 5 %! Стало быть, тесту грош цена? Не совсем. Во-первых, если ваш лечащий врач имеет веские причины предполагать у вас наличие этого редкого заболевания, вы больше не «случайный» пациент. И если у вас действительно прослеживаются определенные симптомы, вероятность того, что вы заражены, уже не одна тысячная, а скажем, одна четвертая [204]. В этом случае положительный результат тестирования имеет гораздо больший смысл, чем нестрого обоснованные выводы. Во-вторых, если болезнь действительно опасна, тест, эффективный на 98 %, позволяет хорошо просеять большие массы населения на предмет наличия или отсутствия болезни. Пациенты с положительным результатом могут пройти вторую диагностику, дающую еще более точные результаты. Разумеется, отрицательный результат – не повод успокаиваться полностью. Какова вероятность того, что он верен? (Ответ я дам в конце главы.) Интуиция отказывается принимать тот факт, что тест, надежный на 98 %, может быть настолько несовершенным, но вычисления говорят сами за себя. Впрочем, голые цифры могут обманывать нашу интуицию. Попробуем нарисовать картинку. ![]() Заметим: диаграмма не соблюдает пропорции (0,1 % больных, эффективность теста 98 %). На чертеже большой прямоугольник изображает все население. Фрагмент прямоугольника слева вверху обозначает группу больных жителей, оставшаяся часть – группу здоровых жителей. Серая полоса сверху – это все жители (из обеих групп) с положительным результатом. Белая область внизу – все жители (опять-таки из обеих групп) с отрицательным результатом Чертеж иллюстрирует основные детали вышеописанной ситуации: • болезнь редкая – крохотный фрагмент большого прямоугольника символизирует больную часть населения; • тест верно диагностирует наличие болезни у подавляющей части больных – почти весь прямоугольник слева вверху закрашен серым; • тест верно диагностирует отсутствие болезни у подавляющего большинства здоровых людей – огромная область большого прямоугольника остается белой; • ключевой момент: большая часть серой полосы приходится на здоровых людей, поэтому вы, скорее всего, здоровы, если получили отрицательный результат, но не обязательно больны, если получили положительный. Условная вероятность [205] Мы вычислили вероятность того, что пациент с положительными результатами медицинского тестирования действительно болен. Мы вообразили гипотетический город, где живет миллион человек, и посчитали численность разных категорий населения. Это был способ ad hoc [206]. В общем случае мы должны руководствоваться языком теории вероятностей, и я завершу главу разъяснениями по этому поводу. Для события A мы обозначаем P (A) вероятность того, что событие A произойдет, и
Для событий A и B мы обозначаем P (A∧B) вероятность того, что произойдут оба события – и A, и B. Запись P (A|B) означает вероятность того, что из события A следует событие B; это условная вероятность того, что A влечет за собой B. Формула Байеса [207] говорит нам: ![]() Надежность диагноза, вынесенного на основе упомянутого медицинского теста, может быть выражена на языке математики следующим образом. Пусть S означает, что некто заражен редкой болезнью, а T означает положительный результат тестирования. Таким образом: • болезнь поразила 0,1 % населения, откуда следует, что P(S) = 0,001; • тест дает верную информацию о наличии или отсутствии заболевания в 98 % случаев, откуда следует, что P (T|S) = 0,98; • тест дает верную информацию о том, что человек здоров, в 98 % случаев, откуда следует, что
|