Книга Все лгут. Поисковики, Big Data и Интернет знают о вас всё, страница 44. Автор книги Сет Стивенс-Давидовиц

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Все лгут. Поисковики, Big Data и Интернет знают о вас всё»

Cтраница 44

Все лгут. Поисковики, Big Data и Интернет знают о вас всё

Чем выше точка, тем больше поклонников у команды. Ее популярность растет и падает, потом снова возрастает и опять падает. «Метс» были очень известны среди родившихся в 1962 и 1978 годах. Полагаю, поклонники бейсбола понимают, в чем тут дело. «Метс» выиграли всего две мировые серии – в 1969 и 1986 годах. В те годы мужчинам 1962 и 1978 г. р. было примерно по семь-восемь лет. Таким образом, важным прогностическим фактором симпатии к «Метс» – по крайней мере среди мальчиков – является тот факт, выиграла ли команда Мировую серию, когда им было около семи или восьми лет, или нет.

На самом деле мы можем расширить этот анализ. Я изучил информацию на Facebook, показывающую, сколько фанатов различных команд разного возраста поставили лайки любой из широкого выбора команд MLS [25] и обнаружил, что существует необычно большое количество мужчин 1962 года рождения, болеющих за «Балтимор Ориолс». И мужчин 1963 года рождения, поддерживающих «Питсбург Пайрэтс». Когда указанные команды были чемпионами, эти люди были восьмилетними мальчиками. Вычислив возрастной пик поклонников всех изученных мной команд, я составил следующий график:


Все лгут. Поисковики, Big Data и Интернет знают о вас всё

В очередной раз мы видим: самый важный год в жизни мужчины {116}, определяющий выбор его любимой бейсбольной команды во взрослом возрасте – плюс-минус восемь лет. В целом, возраст от 5 до 15 является ключевым периодом для покорения сердца мальчика. В 19 или 20 лет этот показатель сокращается до ⅛ от пикового значения. И как раз в это время вопрос решится окончательно: либо парень полюбит какую-то команду на всю жизнь, либо вообще не будет интересоваться этим видом спорта.

Вы можете спросить: а что насчет женщин – любительниц бейсбола? Здесь зависимость выражена намного менее ярко, а возрастной пик, похоже, приходится на возраст около 22 лет.

Это мое любимое исследование. Оно касается двух моих самых обожаемых тем – бейсбола и источников моей взрослой неудовлетворенности. Я прочно подсел на бейсбол в 1986 году и страдал в одиночестве, болея за «Метс» – и болею до сих пор. Ной родился четыре года спустя и был избавлен от этого.

Сегодня бейсбол – не самая важная тема в мире, по крайней мере так неоднократно говорил мне мой консультант, доктор философии. Но моя методика может помочь нам решить подобные вопросы – в том числе показать, как люди формируют свои политические или сексуальные предпочтения, музыкальные вкусы и финансовые привычки. (Мне было бы особенно интересно узнать о происхождении сумасшедших идей моего брата в области последних двух тем.) Полагаю, мы увидим, что многие из наших взрослых привычек и интересов (даже те, которые мы считаем основополагающими) могут быть объяснены произвольными фактами – датой нашего рождения или тем, что происходило в те несколько ключевых лет, пока мы были молоды.

Конечно, подобные работы уже проводились, они касались происхождения политических предпочтений. Яир Гитца, главный научный сотрудник компании «Catalist», занимающейся анализом данных, и Эндрю Гельман, политолог, статистик Колумбийского университета, пытались проверить расхожую мысль о том, что большинство людей начинают с либеральных идей, но с возрастом скатываются в консерватизм. Это мнение выражено известной цитатой, часто приписываемой Уинстону Черчиллю: «Если человеку еще нет 30 и он не либерал, значит, у него нет сердца; если человеку уже за 30 и он не консерватор, значит у него нет мозгов».

Гитца и Гельман потратили 60 лет на обработку данных исследований, включивших в себя более 300 тысяч наблюдений за предпочтениями избирателей. И обнаружили, вопреки утверждению Черчилля, что подростки иногда придерживаются либеральных взглядов, а иногда – консервативных. То же самое касается людей среднего возраста и пожилых.

Их работа явно продемонстрировала, что политические взгляды на самом деле формируются точно так же, как и спортивные предпочтения. Есть критический период, оказывающий решающее влияние на всю остальную жизнь. Между 14 и 24 годами множество американцев формируют свое мнение, основываясь на славе президента. Популярный республиканец или непопулярный демократ – и многие молодые люди станут республиканцами. Наоборот – и очередное поколение пополнит колонны демократов. И эти взгляды, обретенные в ключевой период, у большинства американцев останутся на всю жизнь.

Чтобы увидеть, как это работает, сравните предпочтения американцев, родившихся в 1941 году, и тех, кто родился десятилетие спустя.

Представители первой группы достигли совершеннолетия во время президентства популярного республиканца Дуайта Эйзенхауэра. В начале 1960-х, несмотря на то, что этим людям было под 30, они в основном голосовали за представителя Республиканской партии. И даже старея, представители этого поколения постоянно склонялись к поддержке республиканцев.

Американцы, родившиеся на 10 лет позже – беби-бумеры, – достигли совершеннолетия во время президентства Джона Ф. Кеннеди, чрезвычайно популярного демократа. Линдон Джонсон был изначально прославленным демократом. Ричард Никсон являлся республиканцем, который в конечном счете ушел в отставку с позором. Представители этого поколения всю свою жизнь склонялись к либеральному образу мыслей.

Имея все эти данные, исследователи смогли определить самый важный возраст для выработки политических взглядов – 18 лет.

Они обнаружили, что этот эффект импринтинга очень важен. Их модель предполагает, что в результате президентства Эйзенхауэра число республиканцев, родившихся в 1941 году, увеличилось на 10 %. Кеннеди, Джонсон и Никсон увеличили количество демократов среди американцев, родившихся в 1952 году, на 7 %.

Я дал понять, что скептически отношусь к данным исследования, но меня впечатляет количество рассмотренных откликов. В действительности подобная работа не могла быть сделана на основании одного небольшого опроса. Чтобы увидеть, как именно меняются предпочтения с возрастом, ученым нужны были сотни тысяч наблюдений и обобщения многих исследований.

Для моего анализа любви или нелюбви к бейсболу объем данных также имел решающее значение. Мне нужно было узнать не только количество болельщиков каждой команды, но и разбить их по возрасту. Для этого требуются миллионы наблюдений – и Facebook вместе с другими цифровыми источниками способны предоставить нам подобную информацию.

Здесь вступает в игру объем исследуемой статистики. Нужно иметь много пикселей в фотографии, чтобы можно было увеличить четкость изображения одной ее малой части. Аналогично, необходимо много наблюдений в общем массиве данных для того, чтобы иметь возможность увеличить четкость одного небольшого подмножества – например, сказать, насколько популярна команда «Метс» среди мужчин 1978 года рождения. Небольшой опрос пары тысяч человек не будет достаточно большой выборкой.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация