Книга Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных, страница 44. Автор книги Дэвид Хэнд

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных»

Cтраница 44

Мы уже рассматривали инсайдерскую торговлю, а теперь давайте познакомимся с более общей формой этого мошенничества – инсайдерским хищением. Труднообнаружимые инсайдерские хищения заключаются в том, что сотрудники, имея доступ к счетам, откачивают деньги для собственных нужд. Зачастую это люди, которые не могут противостоять искушению, контролируя большие суммы. Обычно все начинается, когда такой сотрудник попадает в затруднительное финансовое положение и решает втайне взять «в долг» из подконтрольных ему чужих средств, искренне намереваясь вернуть взятую сумму, как только ситуация нормализуется. Но дела, как правило, не торопятся идти в гору, и объем хищений нарастает, пока все не заканчивается тюремной камерой.

Иногда, впрочем, инсайдерские хищения могут осуществляться с размахом и длиться годами, особенно если речь идет об организованной преступности. Мне попался один очень тщательно спланированный и довольно печальный случай такого рода. Небольшой фонд поддержал студента, не имевшего собственных средств, и финансировал его обучение, а также предоставил ему стипендию. После получения диплома фонд помог ему найти работу в банке. Трудолюбивый и честный молодой человек работал, пока не получил должность, позволявшую ему контролировать значительные суммы. Тогда представитель фонда связался с ним и попросил перевести большую сумму денег на именной счет, что выглядело как вполне законная транзакция. Фонд, равно как и деньги, тут же словно растворился в воздухе, оставив несчастную жертву расхлебывать заваренную им кашу.

Можно бесконечно перечислять виды финансового мошенничества, замешенного на темных данных, и конкретные формы, которые он может принимать. Помимо уже рассмотренных, сюда входит уклонение от уплаты налогов путем сокрытия декларируемых доходов (в отличие от законных способов уклонения от уплаты налогов, о которых мы говорили в главе 5), а также мошенничество с ценными бумагами, когда по завышенным ценам инвесторам «впаривают макулатуру».

Все эти виды мошенничества объединяет одно – сокрытие информации. Такое многообразие требует столь же разнообразных решений по выявлению мошеннических действий. Они варьируют от обычной тщательной проверки регистрационных записей до сложных статистических методов, от моделирования типичного поведения клиентов с помощью машинного обучения и интеллектуального анализа данных до специальных программных фильтров, которые обнаруживают определенные виды транзакций со сложной структурой. Что касается темных данных, мораль очевидна: если что-то выглядит слишком хорошо, чтобы быть правдой, вероятно, с этим «что-то» не все в порядке. Скорее всего, оно призвано скрыть какую-то правду.

Глава 7
Наука и темные данные
Природа познания
Сущность науки

Наука занята выяснением природы вещей и того, как они работают. Она проливает свет на то, что находится в темноте. Но темные данные лежат в основе самой науки, причем в очень конкретном смысле. Наука становится таковой, если к ней применим критерий Поппера (в честь Карла Поппера), или фальсифицируемость. Основная идея заключается в том, что вы выдвигаете некое потенциальное объяснение изучаемого явления (теорию, догадку или гипотезу), а затем проверяете его, наблюдая, насколько прогнозируемые вашим объяснением последствия соответствуют тому, что происходит на самом деле. Если перевести на язык этой книги, то для подтверждения или опровержения нашей теории, мы должны сопоставить данные, которые она прогнозирует, с полученными экспериментальными данными. Если прогнозные данные не соответствуют действительности, то теория заменяется на другую, модифицируется или расширяется, пока не станет не только успешно подтверждать прошлое, но и предсказывать будущее. В некотором смысле это пример DD-типа 15: экстраполяция за пределы ваших данных. Разница в том, что такая экстраполяция является преднамеренной и осуществляется с целью тестирования теории.

До победы научной революции (да и после нее, хотя это не всегда признается) успехи познания сдерживались (как правило, подсознательным) нежеланием собирать данные, которые могли бы опровергнуть теорию, – такова уже упоминавшаяся выше предвзятость подтверждения. Проще говоря, развитию науки препятствовало нежелание сделать темные данные видимыми. В конце концов, если у вас имеется солидная теория, которой уже несколько веков, зачем искать данные, которые противоречат ей? Вспомнить хотя бы миазматическую теорию, господствовавшую в Европе, Индии и Китае с древнейших времен вплоть до XIX в., которая гласила, что эпидемии вызваны ядовитыми парами гниющей материи.

Вот мой любимый исторический пример того, как обнаружили подобную проблему. Философ Фрэнсис Бэкон писал: «Человеческое понимание, единожды утвердившись во мнении… начинает выискивать все, что согласуется с ним и подтверждает его. И хотя на другой чаше весов фактов может быть куда больше, тем не менее оно либо просто пренебрегает ими, выражая свое презрение, либо отклоняет их каким-то иным способом». Бэкон проиллюстрировал опасность игнорирования данных на примере человека, который проповедовал, подтверждая свои слова изображениями людей, спасшихся после кораблекрушения благодаря молитве. Бэкон спросил его, где портреты людей, которые, несмотря на свои молитвы, все же утонули?

Классическим примером сбора данных для проверки теории являются наблюдения сэра Артура Эддингтона и Фрэнка Дайсона, целью которых было подтвердить или опровергнуть общую теорию относительности Эйнштейна. Теория предсказывала, что траектория световых лучей будет изгибаться при прохождении света вблизи массивных объектов. Идеальным массивным объектом для наблюдений могло бы стать Солнце, поскольку кривизну светового потока легко обнаружить благодаря видимому смещению положений звезд, чьи лучи на пути к Земле проходят вблизи нашего светила. Но дело в том, что Солнце своим излучением перебивает свет других звезд, за исключением тех случаев, когда его закрывает Луна. По этой причине в 1919 г. сэр Артур Эддингтон возглавил экспедицию на Принсипи, остров у западного побережья Африки, а Фрэнк Дайсон – в Бразилию, чтобы из разных точек наблюдать солнечное затмение, происходившее 29 мая. Их фотографии и измерения видимых положений звезд во время затмения подтвердили предсказания общей теории относительности. Это показало, что ньютоновская механика является упрощением и приближением по сравнению с новой теорией Эйнштейна, которая дает лучшее описание реальности. Свет воссиял не только в буквальном, но и в метафорическом смысле!

Это описание того, как работает наука, позволяет понять одну очень важную вещь: никогда нельзя быть уверенным, что вы обнаружили «реальный» механизм явления. Наука дает объяснения, каждое из которых становится все более точным по мере углубления познания, но всегда остается возможность опровержения любого из этих объяснений новыми экспериментальными данными (хотя чем больше экспериментальных данных будет предсказано новой теорией, тем сложнее это сделать). Такая вероятностная природа теорий, допускающая их изменение по мере поступления новых данных, – это то, что отличает науку, например, от религии, которая никак не связана с доказательствами. Поэтому имейте в виду, что, когда для удобства я буду называть ту или иную научную теорию истинной или верной, это не значит, что новые данные не смогут ее изменить.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация