Глава 30
Кое-что известно заранее
Мы уже в игре. – Звезды или песчинки? – Казнить нельзя помиловать. – Снова белочка и колдун. – Не цепляйтесь за картину.
Я хотел много написать про теорему Байеса, а потом расхотел. У математика это получится лучше, и про это уже есть много хороших текстов. Пусть эта книжка останется налегке, без формул, гуманитарной (надеюсь, не в худшем смысле этого слова). На всякий случай, считайте этот абзац указателем в сторону тех самых текстов. Формула, о которой речь, действительно одна из главных для человечества (если вообще не самая главная), и если ее нет в школе, это говорит лишь о школе.
Но все-таки скажем пару слов, причем так, что обойдемся даже без пары цифр. Самые простые ошибки, связанные с применением теоремы (точнее, неприменением) в практической жизни.
Как правило, люди недооценивают априорные вероятности. Это как бы подводная часть айсберга реальности, она не лезет в глаза. Но если понять, что она есть, мир предстанет по-другому.
Собственно, что мы делаем, познавая что-либо? У нас всегда есть две вещи. Во-первых, некие априорные представления о предмете еще до знакомства с ним. В каком-то виде они есть всегда, мы знаем что-то даже про то, о чем ничего не знаем. О каком бы новом знании ни зашла речь, одни варианты, как правило, удивят нас больше других. Но что значит – удивят? Значит, у нас уже были какие-то смутные ожидания на их счет.
Дальше мы получаем новую информацию, это свидетельства, призванные как-то поменять картину мира. Она поменяется в любом случае, даже если не поменяется, такой вот парадокс. Допустим, мы получили сугубо положительные свидетельства, подтверждающие наши представления. Сами представления не поменялись, но поменялось то, насколько мы в них уверены. Любое наше утверждение, если мы не фанатики, всего лишь вероятностно. Например, мы были уверены на 90 %, что политик Икс – вор и жулик, пришли новые свидетельства, они за нас – и теперь мы уверены в этом на 99 %. Можно сказать, что в картине мира ничего не поменялось, но это не так. Сомнения стали меньше на порядок, это довольно серьезное изменение.
Но допустим, пришли какие-то отрицательные свидетельства. Не то чтобы Икс полностью оправдан в наших глазах, но после них он вор и жулик только с вероятностью 50 %. И во втором случае, в отличие от первого, мы будем удивлены. В первом случае мы дожимали нашу уверенность, картина мира смещалась туда, куда и так была смещена – это процесс, который люди подсознательно ждут и хотят. Во втором случае мы можем порадоваться, ибо честности в мире стало больше (в том мире, который есть, то есть в вероятностном), но мы как бы признаем свою ошибку, смещая вероятность против априорной гипотезы. И вот что бы мы ни узнали, это удивит нас по-разному. Потому что будет разное отношение к версии номер ноль.
А какая-то версия номер ноль мерцает всегда. Допустим, вопрос: «Чего больше – песчинок на Земле или звезд на небе?» Или лучше уточнить «…звезд во Вселенной» (чтобы не ссылались на плохие телескопы). Это не риторический вопрос, он имеет ответ, хотя без 100 % уверенности. Это две цифры, о которых наука имеет примерное представление, их можно сравнить, хотя можно при этом спорить. Цифры вряд ли ведомы обычному человеку, если его попросить их прикинуть – он легко может ошибиться в миллиард раз, может и больше. Это нормально, мы не физики, и даже физики не обязаны это знать. Но какой-то из ответов все равно будет казаться вероятнее, то есть какое-то знание у нас как бы есть, даже несмотря на полное, казалось бы, незнание. Допустим, человеку предлагают приз, если он правильно ответит на этот вопрос, или приз, если монетка упадет орлом. Любой, кто откажется от орлянки в пользу любой идеи, этим уже признает наличие какой-то априорной гипотезы. И неважно, откуда она взялась: «Я так чувствую».
Но часто мы знаем, какие у нас априорные гипотезы, откуда и почему. Отлично знаем, но… отлично и забываем. Пример: ответьте на вопрос, кем, скорее всего, является молодой человек – солдатом или аспирантом кафедры филологии? Информация про него: вежливый, немного испорчено зрение, ай-кью выше 100. Почти любая неподготовленная аудитория ставит на филолога, и зря делает. Солдат в любой стране гораздо больше, чем аспирантов-филологов. Вот если бы их было поровну – тогда да, все улики за аспиранта. Но солдат настолько больше, что свидетельства тянут за филологию, но все равно недотягивают. Неглупых солдат с плохим зрением все равно будет больше, чем конкретно аспирантов на конкретных кафедрах.
На чем построена ошибка? На том, что аналоговое мышление покупается на картинку. Оно сразу рисует этого человека и дальше думает лишь о том, куда скорее положить этот рисунок. И явно полка ближе к науке, чем к армии. Цифровое мышление считает. Оно начинает с того, что фиксирует априорные вероятности. Допустим, мы ничего не знаем о человеке, давайте просто прикинем численность групп. Хотя бы примерно. На миллион человек приходится несколько тысяч солдат. Прикинуть по аспирантам сложнее. Но можно от балды, ошибиться в три раза не страшно. Сколько кафедр филологии в миллионном городе? Сколько аспирантов на каждой? Если два числа перемножить, больше, чем несколько десятков мы не получим, и то если город культурный. Различие априорных вероятностей на два порядка. Если мы ничего не знаем о человеке, ставка 100 к 1, что это солдат, а может, еще выше. Свидетельства понижают вероятность, но не меняют ответ, они даже не прогибают шансы до 1 к 1. Сильным свидетельством было бы «в настоящий момент он пишет диссертацию по Набокову», оно бы разбило априорные шансы – в армии не пишут таких диссертаций.
Зачем нам видеть такие вещи? Вот классический пример почти о том же, когда учет априорных вероятностей мог бы сберечь спокойствие, деньги и даже жизнь. Его часто приводят, так что просим прощения, если вы уже знаете отгадку на эту загадку.
Представьте, что есть опасная, потенциально смертельная болезнь. Встречается у 0,5 % населения. Явных симптомов нет, но человек решает провериться на всякий случай. Есть метод диагностики с точностью 90 %. То есть он назовет больного здоровым и наоборот в 90 % случаев. Тест пройден. Врач говорит: «Анализы показали, что вы больны». Но немного поправляется: «Вероятно, вы больны». Есть метод лечения – болезненный, дорогой, с кучей побочных эффектов. Но речь о жизни и смерти, и вроде бы надо влезать в долги, мучиться и становиться инвалидом уже от лечения. Скорее всего, нормальный человек так и поступит – аналоговое мышление велит так. Раз доктор сказал, значит так и есть. Максимум, что оно готово уступить, вспомнить слово вероятность. Какая там точность, 90 %? Ну мы же не будем надеяться на жалкие 10 %, что все обойдется…
Теперь вопрос: какова вероятность, что человек, получивший по итогам этого теста заключение, что он болен, действительно болен? Если вам не противна эта задачка, подумайте сначала сами. Можно ответить два раза: сперва следуя интуиции, а затем просто посчитав.
Давайте на конкретных цифрах. Допустим, множество 10 000 человек. Если больных всего 0,5 %, то это лишь 50 человек. Предположим, через этот тест прошли все. 50 больных поделились на 45 настоящих больных и 5 ложно здоровых. 9950 здоровых тоже поделились на 8955 здоровых, признанных здоровыми, и 995 ложно больных. Нашего пациента признали больным, но это значит, что он попал в одну из двух групп – либо настоящих больных, либо ложно больных. В сумме тех и других 995 + 45 = 1040. Делим подлинно больных на всех, кого признали больными. Получаем всего примерно 4,3 %, что человек действительно болен.