Помимо этого неинформативного априорного распределения, единственная информация, которую мы используем для правила Байеса, – тот факт, что на момент нашей первой «встречи» с Берлинской стеной она стояла уже восемь лет. То есть любая гипотеза, предсказывающая стене менее восьми лет существования в общей сложности, может быть исключена сразу же. (Аналогичным образом наличие двух орлов на одной монете исключается при появлении решки.) Любой период длиннее восьми лет вполне возможен, но, если бы стена в итоге простояла миллион лет, было бы удивительным стечением обстоятельств, что мы наткнулись на нее почти в самом начале ее существования. Таким образом, хоть мы и не можем исключить слишком длинные временные интервалы, вероятность их все же не очень высока. Когда правило Байеса комбинирует все эти вероятности (наиболее вероятный короткий отрезок уменьшает средний прогнозируемый показатель, а наименее вероятный, но все же возможный интервал увеличивает показатель), начинает действовать принцип Коперника: если мы хотим предсказать, как долго просуществует какое-то явление, и другой информации о явлении у нас нет, то лучшим предположением с нашей стороны будет следующее: явление будет существовать еще столько же, сколько существует на данный момент.
По сути, Готт не был первым, предложившим правило вроде принципа Коперника. В середине ХХ века последователь Байеса математик Гарольд Джеффрис пытался определить количество трамваев в городе, имея в качестве вводной информации серийный номер только одного трамвая, и ответ его был таким же: надо просто умножить серийный номер на два. Еще одна похожая задача появилась раньше, во время Второй мировой войны, когда страны Антанты хотели подсчитать количество танков, производимых Германией. Чисто математические подсчеты на основании серийных номеров захваченных танков показали, что немцы производили 246 танков в месяц, в то время как, по оценкам обширной (и крайне опасной) воздушной разведки, количество ежемесячно производимых за этот период танков составляло примерно 1400 единиц. После окончания войны немецкие архивы раскрыли истинную цифру: 245 танков в месяц.
Понимание того факта, что принцип Коперника – всего лишь правило Байеса с неинформативным априорным распределением, дает ответ на многие вопросы о его пригодности. Принцип Коперника кажется разумным как раз в тех ситуациях, когда нам не известно абсолютно ничего (разглядывая Берлинскую стену в 1969 году, мы даже не были уверены в том, какая временнáя шкала подойдет). А в тех случаях, когда мы знаем что-то об объекте, этот принцип в корне неверен. Предсказывать 90-летнему человеку жизнь до 180 кажется неразумным именно потому, что нам многое известно о продолжительности жизни человека, поэтому здесь нам виднее. Чем больше априорной информации мы берем для правила Байеса, тем более полезными могут оказаться предсказания, сделанные на его основе.
Априорные предположения реального мира…
В широком смысле в мире есть две категории явлений: те, которые стремятся к (или группируются вокруг) некоему естественному значению, и те, которые к ней не стремятся.
Продолжительность жизни человека, очевидно, находится в первой категории. Она попадает под нормальное распределение, также известное как гауссово распределение, названное так в честь немецкого математика Карла Фридриха Гаусса, а в быту иногда называемое колоколообразной кривой благодаря характерной форме графика. График действительно адекватно характеризует отрезок жизни человека. В США средняя продолжительность жизни мужчин, например, составляет примерно 76 лет, и вероятности не слишком отклоняются от этого показателя. Нормальное распределение обычно имеет одну применимую шкалу: продолжительность жизни, выраженная одной цифрой, считается трагично короткой, а тремя – удивительно длинной. Многие другие вещи в природе тоже попадают под нормальное распределение – от роста, веса и давления человека до дневной температуры воздуха в городе и диаметра фруктов в саду. Однако есть в мире и ряд значений, которые не выглядят нормально распределенными. Средняя численность населения в небольшом городе в США, например, составляет 8226 человек. Но, если вы подготовите таблицу с указанием городов и численности их жителей и построите по ней график, вы даже близко не увидите никакого колокола. Вы обнаружите, что городов с численностью меньше 8226 человек гораздо больше, чем тех, где численность выше этой отметки. В то же время в более крупных городах численность населения будет гораздо выше средней. Такая модель определяется так называемым экспоненциальным распределением. Оно также известно как безмасштабное распределение, поскольку характеризует количественные показатели, которые, вполне возможно, могут иметь различные масштабы: например, население города может насчитывать десять, сто, тысяча, десятки тысяч, сотни тысяч или миллионы жителей, и таким образом мы не можем отметить единственный критерий для определения размера «нормального» города.
Экспоненциальное распределение характеризует множество явлений в нашей повседневной жизни, у которых есть такое же базовое качество, как и у городов с их населением: огромное количество элементов имеет показатели ниже среднего, и лишь несколько – выше среднего. Суммы кассовых сборов от продаж билетов, которые могут выражаться десятизначными числами, – это другой пример. Большинство фильмов не собирают много денег, но какой-нибудь редкий «Титаник» может принести поистине гигантские суммы.
По сути, деньги – область, где почти повсеместно действует экспоненциальное распределение. Оно характеризует и уровень материального благосостояния людей, и их доходы. Средний уровень дохода в США, например, составляет 55 688 долларов, но, поскольку доход можно распределить очень приблизительно, мы снова обнаружим, что большее количество человек будет иметь доход ниже среднего, зато у тех, кто окажется выше средней отметки, сумма дохода будет просто фантастической. Ситуация такова: две трети населения США имеют доход ниже среднего, но 1 % на самом верху зарабатывает в 10 раз больше среднего показателя. А самая высшая категория, составляющая 1 % от этого 1 %, получает еще в 10 раз больше. Мы часто сокрушаемся, что богатые становятся еще богаче, и в самом деле процесс предпочтительного присоединения – один из самых надежных способов создать экспоненциальное распределение. Крайне вероятно, что на самые популярные интернет-сайты будут заходить новые люди; у самых популярных онлайн-знаменитостей, с высокой степенью вероятности, будут появляться новые поклонники; наиболее престижные фирмы, скорее всего, будут привлекать новых клиентов; в крупнейшие города, крайне вероятно, будут прибывать новые жители. В каждом случае экспоненциальное распределение будет работать.
Правило Байеса подсказывает, что, когда нам приходится оценивать вероятность исходя из ограниченного количества фактов, только один фактор так же важен, как правильные априорные предположения. Это характер распределения, из которого мы получили эти факты. Хорошие предсказания начинаются с правильного понимания, с чем мы имеем дело – с нормальным распределением или экспоненциальным. Как оказалось, правило Байеса предлагает нам абсолютное иное, очень простое проверенное средство для обоих случаев.