Идею проверки выборов посредством анализа цифр приписывают Александру Собянину. Он изучил коррупционные парламентские выборы 1993 г. в России, получившие печальную известность. Собянин предложил несколько статистических тестов. Один из них основывался на законе Бенфорда и все строились на допущении, что придуманные числа будут отличаться от аутентичных. Собянин утверждал: проверка выборов 1993 г. выявила подтасовки. Вывод этот по меньшей мере неопровержим. За этим последовали и другие подобные заявления. После выборов 2009 г. в Иране, когда президентом на второй срок был избран Махмуд Ахмадинеджад, Нигрини проанализировал результаты по участкам и обнаружил свидетельства фальсификации.
Недавняя статья Джозефа Декерта, Михаила Мягкова и Питера С. Ордешука называется «Неприменимость закона Бенфорда для выявления мошенничества на выборах» (The Irrelevance of Benford’s Law for Detecting Fraud in Elections). Авторы предупреждают, что у нас нет достаточного количества исследований, показывающих, насколько хорошо результаты честных выборов согласуются с законом Бенфорда. Один из неизвестных факторов – разница в размерах округов. Обычно предполагается, что избирательные комиссии делают округа приблизительно равными, избегая существенных различий. Если только нет тайных причин для манипуляций избирательными участками… Кто знает?
Представьте себе сельскую местность в штате Айова, где избирательные участки одинаковые – по 5000 избирателей на каждом. Это консервативный регион, предпочитающий Митта Ромни Бараку Обаме в соотношении 70 на 30 процентов. Ромни набирает в среднем 3500 голосов на каждом участке, а Обама 1500 – с небольшими вариациями. Первые цифры количества голосов на участке у Ромни будут 3, а у Обамы 1. Волшебный черный ящик зажигает красный сигнал! Но все в порядке. Просто мы анализируем регион, где распределение участков и политических предпочтений ровное, как кукурузное поле.
В этой ситуации результаты обоих кандидатов могут вызвать ложную тревогу. Еще большее беспокойство вызывают случаи, когда подозрения связаны только с одним из кандидатов. Довольно часто какой-либо кандидат в городских районах пользуется большей популярностью, чем в сельских (или наоборот). В таких ситуациях результаты одного из кандидатов лучше согласуются с законом Бенфорда, чем у другого.
Чтобы использовать распределение цифр для выявления мошенничества на выборах, необходимо понимать, как происходит мошенничество. В некоторых странах коррумпированные аппаратчики садятся и придумывают числа, а затем выдают их за результаты голосования на участках. В российских выборах результаты на многих участках бесстыдно круглые (оканчиваются на 0) – без каких-либо попыток скрыть обман. «Разумеется, мошенничество было, – говорит Владимир Шевчук, член избирательной комиссии Татарстана, о российских выборах 2000 г., – но одна из его причин – неэффективный механизм подсчета бюллетеней… Чтобы соблюсти процедуру, требуется не одна ночь, а больше. Люди смертельно устают и поэтому прибегают к уловкам».
В Америке мошенники могут зарегистрировать избирателей, взяв фамилии с местного кладбища, и этими голосами заполнить избирательные урны в пользу своего кандидата, или просто «потерять» бюллетени, поданные за соперника. Суммарное воздействие большинства фальсификаций определяется умножением результатов кандидата на коэффициент, зависящий от того, сколько голосов, по мнению фальсификаторов, нужно для победы. Это сложно определить с помощью закона Бенфорда. Одно из свойств закона в том, что можно умножить весь массив данных на любой коэффициент, и при этом числа по-прежнему будут соответствовать распределению Бенфорда.
Для выявления сфальсифицированных общих результатов больше подходят тесты последних цифр. Хотя маловероятно, что придумывать числа будет один человек. Если целая армия нечестных сотрудников избирательных комиссий придумает по одному числу каждый, то групповой эффект нивелирует любые персональные особенности. Придется оперировать лишь относительно универсальными характеристиками придуманных чисел.
Анализируя выборы 2012 г. в Нигерии, Бернд Бербер и Александра Скакко предложили исследовать сдвоенные последние цифры (00, 11, 22… 99). Как мы уже видели, они реже всего встречаются среди придуманных чисел, и это обстоятельство может послужить сигналом, предупреждающим о необходимости дальнейшей проверки.
Трудность анализа цифровых результатов выборов в том, что фанатиков зачастую не интересуют поиски истины. Они хотят, чтобы любая аномалия воспринималась как неопровержимое доказательство нечестности. Если последующее расследование не выявляет мошенничества, они все равно могут заявить о фальсификации, опираясь только на анализ цифр. К таким заявлениям следует относиться скептически.
Любой анализ цифр основан на допущении, что «плохие парни» о нем не знают. Пока это верно, но когда-нибудь ситуация изменится.
В прошлом лишь немногие криминалисты знали об отпечатках пальцев. Теперь даже самые тупые взломщики пользуются резиновыми перчатками. Есть множество способов противостоять анализу цифр, и они не очень сложны.
Нигрини оптимистично предположил: распространение знаний о законе Бенфорда может стать средством устрашения, подобно знанию об отпечатках пальцев и анализе ДНК. Тот, кто решится на мошенничество, должен будет спланировать искажение данных, а затем скорректировать числа так, чтобы они соответствовали распределению Бенфорда. Это дополнительная работа. Кроме того, корректировка данных уменьшит степень фальсификации или потребует дополнительных действий, а они-то выдадут мошенника – или то и другое вместе.
Проблема в том, что преступников не так просто испугать – на то они и преступники. Такие люди плохо представляют отдаленные последствия своих действий. Это палка о двух концах. Все видели полицейские сериалы, однако криминалистические методы остаются эффективными, поскольку большинство преступлений совершаются под влиянием эмоций, без планирования. Это справедливо и для многих финансовых и электоральных преступлений. Растратчик начинает красть потому, что проигрывает в Лас-Вегасе. Предприниматель «улучшает» бухгалтерский баланс перед встречей с инвестором. Правящая партия начинает жульничать в последнюю минуту, когда выясняется, что проигрыш возможен.
При любом применении анализа цифр полезно задать себе вопрос: какова вероятность, что лицо, предоставляющее данные, знает о законе Бенфорда, предполагает, что числа могут быть подвергнуты криминалистическому анализу, и обладает достаточной математической подготовкой, чтобы принять контрмеры.
Резюме: Как распознать числа, которыми манипулировали
• Вторые цифры финансовых данных могут помочь в выявлении манипуляции. Переходя границу круглого числа, манипулятор в качестве второй цифры относительно часто выбирает 0 и относительно редко 9.
• Если цель – не превысить круглое число, манипулятор в качестве второй цифры относительно часто выбирает 9 и относительно редко 0. Такое часто встречается в затратах на представительские расходы.
• Сам по себе анализ цифр не может ничего «доказать». Его ценность состоит в том, что он выявляет данные, заслуживающие дополнительной проверки опытным аудитором. Следует скептически относиться к заявлениям (например, о фальсификациях на выборах), основанным на проверке первых цифр с помощью закона Бенфорда.