Все во́роны черные, гласит теория. Каждый раз, когда мы видим ворона черного, а не какого-нибудь другого цвета (существование воронов-альбиносов при этом игнорируем!), наша уверенность в верности теории “все вороны черные” растет. Но вот в чем загвоздка: утверждение “все вороны черные” логически эквивалентно утверждению “все, что не черное, – не вороны”. Поэтому, увидев желтый банан – нечерный объект, не являющийся к тому же вороном, – мы должны были бы еще больше укрепиться в своем убеждении, что все вороны черные. Пытаясь обойти этот в высшей степени контринтуитивный результат, некоторые философы настаивают на том, что нельзя считать оба утверждения имеющими равную силу. Другими словами, желтизна бананов должна убеждать нас только в верности теории, что все нечерное – не вороны (второе утверждение), но никак не в том, что все вороны черные (первое утверждение). Это вполне соответствует здравому смыслу: банан – не ворон, поэтому, смотря на него, мы можем узнать что-то о том, что вороном не является, но никак не о самих воронах. Однако это предложение подвергли критике на том основании, что нельзя быть в разной степени уверенным в верности двух логически эквивалентных утверждений, если совершенно ясно, что они либо оба истинны, либо оба ложны. Возможно, просто наша интуиция в этом вопросе нас подводит и вид желтого банана действительно должен еще больше убеждать нас в черноте всех воронов. А вот если рассматривать проблему с байесовской точки зрения, никакого парадокса не возникает. Согласно Байесу, вероятность гипотезы Г следует умножить на следующее отношение:
где X – это нечерный объект, не являющийся вороном, а Г – гипотеза, что все вороны черные.
Если попросить кого-нибудь выбрать любой случайный банан и показать его вам, то вероятность, что увиденный вами банан будет желтым, никак не зависит от окраса оперения воронов. Вы уже заранее знаете, что увидите нечто, что вороном не является. Числитель дроби (то, что поверх черты) будет равен знаменателю (тому, что под чертой), отношение будет равно единице, а вероятность останется неизменной. Желтизна увиденного банана никак не повлияет на вашу уверенность в том, что все вороны черные. Если попросить кого-нибудь взять любой случайный нечерный предмет и вам покажут желтый банан, то числитель станет больше знаменателя на какую-то ничтожную величину. Вид желтого банана очень незначительно увеличит вашу уверенность в том, что все вороны черные. Чтобы всерьез укрепиться в верности этого утверждения, вам нужно будет увидеть почти все нечерные объекты, существующие во вселенной, плюс убедиться, что все они – не вороны. И в том и в другом случае результат будет соответствовать тому, что говорит ваша интуиция.
Может показаться странным, что информация имеет какое-то отношение к случайности, но на самом деле они очень тесно связаны. Представьте себе цепочку цифр, составленную только из нулей и единиц. Цепочка 1111111111 абсолютно упорядоченна, а потому не содержит практически никакой информации (разве что “десятикратное повторение цифры 1”), так же как чистый холст, на котором все точки имеют белый цвет, почти ни о чем нам не говорит. С другой стороны, сгенерированная случайно последовательность 0001100110 содержит максимальный объем информации, возможный для цепочки такой длины. Дело в том, что один из способов дать количественную оценку информации – это определить, насколько сильно можно сжать данные. Истинно случайный набор цифр невозможно укоротить, сохранив при этом всю содержащуюся в нем информацию. А вот длинную цепочку, состоящую, например, из одних единиц, можно сжать во много раз – просто указав, сколько в ней единиц. Информация и беспорядок теснейшим образом связаны друг с другом. Чем более беспорядочна и случайна цепочка, тем больше информации она содержит.
Можно посмотреть на это по-другому: открывая каждую последующую цифру случайной цепочки, мы получаем максимум возможной информации. С другой стороны, если мы видим цепочку 1111111111, ничего не стоит догадаться, какой будет следующая цифра. (Это касается только законченных цепочек, а не кусочков более длинных последовательностей. Произвольно длинная случайная цепочка цифр будет содержать сочетание 1111111111 бесконечное количество раз.) Объем информации, который можно считать полезным, – всегда компромисс между этими двумя крайностями. Например, фотография с минимумом информации – это просто одноцветный фон, а содержащая минимум информации книга – это листы, заполненные строчками из одной-единственной буквы. Ни то ни другое не представляет никакого интереса с точки зрения объема информации. Фотография же с максимумом информации будет беспорядочным, хаотичным скоплением пикселей, а книга – бессмысленным нагромождением случайных букв. Такое нас тоже вряд ли заинтересует. Самая полезная и нужная нам информация находится где-то посередине. Обычное фото содержит информацию, но в понятном нам виде и объеме. Если один из пикселей изображения окрашен в какой-то цвет, то непосредственные его соседи, скорее всего, будут похожего цвета. Мы это знаем и можем использовать для того, чтобы сжать изображение без потери информации. Книга, которую вы сейчас читаете, по большей части представляет собой лишь цепочки букв и пробелов, перемежающиеся знаками пунктуации. В отличие от описанных выше крайностей – абракадабры из символов либо бесконечных повторений одной буквы – в этой книге буквы структурированы в цепочки, называемые словами. Одни слова встречаются редко; другие, как, например, “и”, повторяются очень часто. Кроме того, слова объединены в предложения в соответствии со сводом правил, именуемым грамматикой, и так далее – а все для того, чтобы в итоге читатель сумел понять представленную ему информацию. С мешаниной из случайных знаков такое просто невозможно.
В своем рассказе “Вавилонская библиотека” аргентинский писатель Хорхе Луис Борхес рассказывает о библиотеке огромного, возможно бесконечного, размера с невообразимым количеством книг. Все книги имеют одинаковый формат: “в каждой книге четыреста страниц, на каждой странице сорок строчек, в каждой строке около восьмидесяти букв черного цвета”
[14]. Все тексты написаны на экзотическом языке, использующем только 22 буквенных символа, запятую, точку и пробел, но в книгах на полках библиотеки можно обнаружить все возможные комбинации этих знаков. Большинство книг содержат лишь бессмысленный набор букв; в других сочетания упорядоченны, но все равно лишены какого-либо смысла. Например, одна из книг целиком состоит из повторяющейся буквы M. В другой – все то же самое, кроме второй буквы, вместо которой стоит N. Есть книги со словами, предложениями и целыми абзацами, построенными по правилам грамматики того или иного языка, но абсолютно нелогичными. Есть исторические труды. Есть такие, в которых утверждается, что они содержат подлинную историю, но на деле они являются вымыслом. В некоторых даны описания еще не изобретенных машин и не сделанных открытий. Где-то на полках есть книга, содержащая все сочетания используемых 25 знаков, которые только можно себе представить или записать. И однако же все это гигантское хранилище книг совершенно бесполезно, поскольку, не зная заранее, что правда, а что ложь, что истина, а что вымысел, какая информация значима, а какая бессмысленна, невозможно извлечь из этого всеобъемлющего собрания символов никакой пользы. То же касается и старой идеи о том, что армия обезьян, беспорядочно стучащих по клавишам пишущих машинок, способна в конце концов произвести на свет собрание сочинений Шекспира. Они напечатают и решения всех научных проблем современности (хоть на это и потребуются триллионы лет). Проблема лишь в том, что они также напечатают и все неправильные решения, а вместе с ними убедительные опровержения всех правильных решений – и все это не считая умопомрачительных объемов абсолютной белиберды. Нет никакого смысла иметь перед глазами ответ на вопрос, если в одну кучу с ним свалены все возможные комбинации символов, из которых он состоит, а вы не имеете представления, какая из них верная.