Преднамеренное манипулирование людьми с помощью статистической базы
Умные мошенники ловко используют пренебрежение статистической базой или, в данном конкретном примере, недоступность статистической информации для жертв. Группа мошенников разослала 100 000 писем от фиктивной фирмы по управлению активами. Около 50 000 человек получают письма с предсказанием роста фондовой биржи в следующем квартале, тогда как другая группа из 50 000 человек получает письма с предсказанием падения рынка. Значит, для половины получателей предсказание сбудется. В следующем квартале группа разошлет вторую рассылку 50 000 человек, которые ранее получили письмо с верным прогнозом. На этот раз 25 000 человек получат письмо с предсказанием, что рынок снова пойдет вверх, а остальные 25 000 получат противоположное предсказание. В третьем квартале это повторяется для 25 000 человек, которые получили правильный прогноз на второй квартал (две группы по 12 500 человек получили прогноз либо роста, либо падения), и так далее для четвертого и пятого кварталов. На этом этапе мошенники могут обоснованно заявить 3125 получателям писем, что они продемонстрировали свою способность предсказывать поведение рынка в течение 5 кварталов подряд. Затем они предлагают этим людям купить у них прогноз на следующий квартал по высокой цене. Многие люди охотно платят эту цену, будучи уверенными в достигнутых результатах. Но данные убедительны именно потому, что эти люди не видят статистическую базу — не потому, что неправильно ее поняли, а потому, что мошенники преднамеренно скрыли ее. Если бы получатели писем знали всю историю, они не были бы впечатлены способностями экономических советников; однако если не знать подробности «предсказания», то экономические советники действительно выглядят очень впечатляюще.
На что случайность похожа на самом деле
23 мая 2009 года Патрисия Демауро, бабушка из Нью-Джерси, решила поиграть в кости в отеле Borgata в Атлантик-Сити. В крэпсе (игра в кости), когда игрок бросает пару кубиков в первый раз, это называется «бросок на выбывание». Если выпало 7 или 11, игрок побеждает. Если выпало 2, 3 или 12, игрок выбывает. Однако если выпадает любое другое число (4, 5, 6, 8, 9 или 10), его записывают как «число ставки». После того как количество очков записано, игрок забирает ставку и выходит из игры, если он снова выбрасывает такое же количество очков до того, как выпадет 7 или 11. Однако любое другое выпавшее число (кроме числа 7 или 11) приносит деньги людям, сделавшим ставку на это число, а игрок продолжает бросать. Таким образом, игрок может продолжать бросать кубики и выигрывать деньги для себя или других игроков (в зависимости от того, на какие числа была сделана ставка), пока не выпадет число ставки, 7 или 11. В случае с Патрисией Демауро первый бросок дал число 8. Затем она продолжила бросать кости, и при этом не выпадало 8, 7 или 11 в течение 154 бросков, что заняло целых 4 часа 18 минут. Было ли что-то особенное в Патрисии? Она обманывала, это произошло случайно или есть какое-то другое объяснение? Стоит ли вообще искать объяснение?
Для простоты давайте воспользуемся символическим примером монеты, у которой орел с одной стороны и решка с другой. Кроме того, мы сделаем предположение, что монета является «честной монетой», то есть в любом броске с вероятностью 50 % выпадет орел (О) и с вероятностью 50 % выпадет решка (Р). Какой из следующих исходов наиболее вероятен в серии из 10 бросков? Пожалуйста, хорошенько подумайте над этим вопросом, прежде чем давать ответ.
1. ОРОРОРОРОР
2. ОРРОРОРООР
3. ОООООРРРРР
4. ОООООООООО
Для многих людей вариант 3 и особенно вариант 4 кажутся маловероятными для честной монеты. Вариант 1 выглядит более реальным, хотя чередование орла и решки больше похоже на упорядоченную систему, чем на случайность. Действительно, вариант 2 — единственный вариант, который не имеет очевидной закономерности и, следовательно, кажется наиболее вероятным вариантом при подбрасывании справедливой монеты.
На самом деле все перечисленные последовательности имеют одинаковый шанс выпасть, когда вы подбрасываете честную монету. Вероятность выпадения орла или решки — 1 к 2. Полная вероятность двух событий получается путем перемножения их вероятностей; другими словами, шанс выпадения двух орлов равен ½ × ½ = ¼. Таким образом, шанс получить 10 орлов подряд равен ½ × ½ × ½ × ½ × ½ × ½ × ½ × ½ × ½ × ½ = 1⁄1024. То есть, если вы делаете серии из 10 бросков, то в среднем одна из каждых 1024 серий будет представлять собой ОООООООООО. Это не означает, что это обязательно произойдет, но есть вероятность, что это произойдет. Важно понимать, что новое выпадение монеты не зависит от всех предыдущих выпадений. Это означает, что вероятность выпадения любой из последовательностей составляет 1 к 1024, и каждая из них имеет равный шанс.
Причина, по которой вариант 2 выглядит лучше всего, заключается в том, что при подбрасывании монеты существует огромное количество различных сочетаний О и Р, которые примерно похожи на вариант 2, тогда как есть только два сочетания, которые выглядят как вариант 3 (сначала 5 О, далее 5 Р; или сначала 5 Р, далее 5 О). Точно так же есть только два исхода, которые выглядят как номер 4 (все О или все Р). Таким образом, исход подбрасывания монеты, который выглядит похожим на вариант 2, будет случаться гораздо чаще, чем точные исходы 3 или 4, и количество комбинаций, которые складываются в то, что выглядит как случайная выборка, намного превышает количество комбинаций, которые кажутся нам упорядоченной последовательностью; однако любая конкретная комбинация встречается в среднем 1 раз из каждых 1024 испытаний, когда монету подбрасывают 10 раз.
Абсолютно принципиальное значение для нашего рассуждения имеет осознание того, что хотя последовательности, которые кажутся неслучайными, встречаются реже, на самом деле они встречаются с одинаковой вероятностью. С точки зрения вероятности все последовательности рано или поздно выпадут, и это неизбежно. Предположим, вам дали 32 монеты и попросили оценить, являются ли они честными. В этом конкретном примере давайте предположим, что все монеты действительно честные. Каждая монета оценивается при помощи пяти подбрасываний. Даже если все монеты честные, шанс выпадения одной стороны 5 раз подряд составляет ½ × ½ × ½ × ½ × ½ = 1⁄₃₂. Поскольку существует 32 монеты, это означает, что для одной из протестированных монет все пять подбрасываний приведут к выпадению орла, а для одной из протестированных монет все пять подбрасываний приведут к выпадению решки. Таким образом, две из протестированных монет, хотя и являются нормальными, честными монетами, дадут (совершенно случайно) тот же результат, что и при использовании крайне нечестной монеты, которая была сбалансирована так, чтобы всегда выпадал орел или решка.
В предыдущем примере человек с разумным пониманием вероятности не заподозрил бы жульничество, если бы одна монета дала подряд 5 выпадений орла, а другая — 5 выпадений решки, учитывая количество проверенных монет и вышеуказанные распределения вероятностей. Однако теперь рассмотрим сценарий, в котором 32 разных человека получили по одной монете для оценки, не зная о других участниках исследования. Исходя из расчета вероятности, можно предположить, что двое из этих участников получат пять последовательных орлов или пять последовательных решек после пяти подбрасываний. Этим участникам такой исход покажется маловероятным, и они могут заподозрить, что у них нечестная монета. Если бы при этом они теряли реальные деньги на каждой ставке и не имели бы возможности протестировать монету дальше, они, вероятно, подумали бы, что их обманули жулики. Этот сценарий аналогичен тому, как большинство из нас воспринимают ситуации в реальной жизни — мы видим только результаты одной ограниченной серии событий и не осознаем, как часто они происходят в более широком контексте, то есть сколько еще существует «бросков монеты».