Но эта корреляция не подразумевает причинно-следственной связи.
Два экономиста, Стейси Дейл и Алан Крюгер, нашли гениальный способ проверить причинно-следственную связь влияния элитных вузов на будущий заработок своих выпускников. У ученых был большой набор данных о старшеклассниках, в том числе такие, где они подавали документы в колледж, где они были приняты в колледж, учились в колледже, их семьи, их доходы во взрослом возрасте.
Чтобы собрать рабочую и контрольную группы, Дэйл и Крюгер сравнили студентов с похожими историями, которые были приняты одной и той же высшей школой, но выбрали другие. Некоторые студенты, которых готовы были принять в Гарвард, отправились в университет Пенсильвании. Возможно, чтобы быть ближе к девушке или к парню. Или потому, что там работал преподаватель, у которого они хотели учиться. Другими словами, эти студенты, по данным приемных комиссий, были столь же талантливы, как и те, кто учился в Гарварде. Но в итоге у них оказался разный опыт обучения.
Итак, нашлись два студента с похожими историями, но один поступил в Гарвард, а другой выбрал университет штата Пенсильвания. Что было дальше? Результаты исследователей оказались столь же впечатляющими, как и данные исследования о средней школе «Стайвесант». Эти студенты закончили карьеру с более или менее одинаковым достатком. Если будущая зарплата – это мерило, то похожие студенты, принятые в престижные школы, но желающие учиться в разных университетах, заканчивают на примерно одинаковых ступенях карьерной лестницы.
Наши газеты пестрят статьями о чрезвычайно успешных людях, учившихся в вузах Лиги плюща. Это, например, основатель Microsoft Билл Гейтс и основатели Facebook Марк Цукерберг и Дастин Московиц – они все учились в Гарварде. (Кстати, все они бросили учебу, что ставит дополнительные вопросы о ценности образования в Лиге плюща).
Есть также истории людей, которые были достаточно талантливы для поступления в университет Лиги плюща, но решили пойти в менее престижный вуз
{170} и позже стали крайне успешны в жизни. Это, например, Уоррен Баффет
{171}, начавший карьеру в Уортонской школе бизнеса Пенсильванского университета, входящего в Лигу плюща, но переведшийся в университет Небраска-Линкольн, потому что тот был дешевле. Кроме того, он ненавидел Филадельфию и считал занятия в Уортоне скучными. Исследования показывают, что с точки зрения заработка выбор менее престижного учебного заведения – это прекрасное решение. По крайней мере для Баффета и ему подобных.
Эта книга называется «Все лгут». Это означает, что все люди врут – друзьям, в опросах и самим себе, – чтобы выглядеть как можно лучше.
Но и мир обманывает нас, предоставляя неверные, вводящие в заблуждение сведения. Мир показывает нам огромное количество успешных выпускников Гарварда, но меньше успешных выпускников государственных вузов вроде университета штата Пенсильвания. В результате мы верим, что поступление в Гарвард дает огромное преимущество.
Придумав правильный натурный эксперимент, мы можем верно интерпретировать данные, предоставляемые миром, и разобраться, что действительно полезно, а что – нет.
{172}
Натурные эксперименты также применимы к задачам, о которых говорилось в предыдущей главе. Они часто требуют большей детализации, разделения на рабочую и контрольную группы: на города в случае с Суперкубком; на графства при исследовании цен на медицинские процедуры; на учеников, немного не дотянувших до проходного балла и набравших чуть больше, в эксперименте со школой «Стайвесант». И детализация, как обсуждалось в предыдущей главе, часто требует намного больших – всеобъемлющих – наборов данных, которые становятся все более доступными по мере того, как мир оцифровывается. Поскольку мы не знаем, когда природа намерена провести очередные натурные эксперименты, то не можем устроить небольшой опрос, чтобы измерить результаты. Для вычленения того, что нас интересует, нам нужно много уже существующих данных. Нам нужны большие данные.
Есть еще один важный момент, о котором следует упомянуть, говоря о натурных экспериментах (либо наших собственных, либо тех, которые устроила сама природа), подробно описанных в этой главе. Большая часть этой книги была сосредоточена на обучении пониманию окружающего мира – с каким количеством расизма пришлось столкнуться Обаме, сколько человек действительно являются геями, насколько мужчины и женщины не уверены в своем теле. Но эти контролируемые или натурные эксперименты имеют и практическое применение. Они нацелены на улучшение процесса принятия решений, на помощь в понимании, какие действия полезны, а какие – нет.
Компании могут узнать, как заполучить больше клиентов. Правительства могут узнать, как использовать компенсацию для лучшей мотивации врачей. Студенты могут узнать, какие школы окажутся наиболее полезными. Эти эксперименты демонстрируют потенциал больших данных, способных заменить догадки, житейскую мудрость и ненадежные корреляции тем, что на самом деле работает правильно – причинно-следственной связью.
Часть III
Большие данные: обращаться с осторожностью
Глава 7
Большие данные-шманные: Чего они не могут?
«Сет, Лоуренс Саммерс хотел бы встретиться с вами», – получил я несколько загадочное письмо. Оно было от Лоуренса Каца, одного из моих ученых-советников. Кац не сказал, почему Саммерс заинтересовался моей работой, хотя позже я узнал, что ему это было известно.
Я сидел в приемной возле офиса Саммерса. После некоторой задержки бывший министр финансов США, бывший президент Гарвардского университета и лауреат крупнейших премий в области экономики предложил мне войти.
Саммерс начал встречу, зачитав мою статью о влиянии расизма на деятельность Обамы, которую распечатал для него его секретарь. Саммерс владеет методом скоростного чтения. В процессе он иногда высовывает кончик языка вправо, в то время как его глаза стремительно мечутся влево-вправо и вниз по странице. Саммерс, читающий текст научной работы, напоминает мне великого пианиста, исполняющего сонату. Он так сосредоточен, что, кажется, забывает обо всем остальном. Меньше чем за пять минут он прочел статью в 13 страниц.
«Вы говорите, что поисковые запросы в Google со словом «ниггер» предполагают расизм, – сказал Саммерс. – Это похоже на правду. Они предсказывают, где Обама получит меньшую поддержку, чем Керри. Это интересно. Мы действительно можем сказать, что Обама и Керри похожи?»
«Они были классифицированы политологами как имеющие подобные идеологии, – ответил я. – Кроме того, нет никакой связи между расизмом и изменениями в Белом доме. Результат остается неизменным, даже если мы добавляем элементы демографии, посещение церкви и владение оружием». Так говорим мы, экономисты. Я был весьма воодушевлен.