Книга Все лгут. Поисковики, Big Data и Интернет знают о вас всё, страница 52. Автор книги Сет Стивенс-Давидовиц

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Все лгут. Поисковики, Big Data и Интернет знают о вас всё»

Cтраница 52

Тут-то Сильвер и предсказал, как сложится карьера Ортиса – на основании судеб его двойников. Он обнаружил, что те восстановили свои силы. В отношении поклонниц Симмонс, возможно, был бы прав. Но что касается двойников Ортиса, то здесь все иначе – они сдали, но затем вернулись.

Поиск двойника – лучшая методика, когда-либо использовавшаяся для прогноза результативности бейсболиста. Согласно ей, «Сокс» должны были потерпеть. Клуб действительно не стал рубить сплеча. И в 2010 году средняя результативность Ортиса выросла до 270. Он совершил 32 хоумрана и вошел в сборную Всех звезд. А затем входил в нее еще четыре года подряд.

В 2013 году, играя на своей традиционной позиции назначенного отбивающего, в возрасте 37 Ортис набрал 0,688 очка, а Бостон победил Сент-Луис в Мировой серии – 4:2.

Ортис был признан MVP (наиболее ценным игроком) Мировой серии [29].

Едва дочитав статью о подходе Нейта Сильвера к оценке результативности игрока, я сразу же начал думать о том, может ли и у меня тоже быть двойник.

Поиск такового является перспективным во многих областях, а не только в спорте. Мог бы я найти человека, разделяющего мои интересы? Может быть, если бы я нашел кого-то, больше всего похожего на меня, мы могли бы проводить время вместе. Может быть, он бы знал рестораны, которые могли бы мне понравиться. Возможно, он мог бы познакомить меня с тем, чего я не знаю, и я бы заинтересовался этим.

Поиск двойников возможен даже по особенностям личности. И, как и любая детализация, сходство будет тем сильнее, чем больше у вас данных. Предположим, я буду искать двойника в наборе данных десяти человек. Я мог бы найти кого-то, кто разделяет мой интерес к книгам. Предположим, я буду искать двойника в наборе данных тысяч людей. Я мог бы найти кого-то, кому, как и мне, нравятся популярные книги о здоровье. Но предположим, что я буду искать двойника в наборе данных сотен миллионов людей. Тогда я мог бы найти кого-то, кто действительно похож на меня.

Однажды я провел поиск двойника в социальных сетях. Используя весь массив профилей Twitter, я искал людей, имеющих больше всего общих интересов со мной.

Вы, конечно, можете многое рассказать о моих интересах на основании информации в моем аккаунте в Twitter. В целом, я подписан примерно на 250 человек, разделяющих мою страсть к спорту, политике, комедиям, науке и мрачным еврейским певцам.

Так есть ли кто-нибудь во Вселенной, так же, как и я, подписанный на все эти 250 аккаунтов, мой твиттер-близнец? Конечно, нет. Двойники не идентичны нам, они лишь похожи на нас. И нет никого, кто подписан хотя бы на те же 200 аккаунтов. Или даже на 150.

Однако в конце концов я нашел аккаунт, подписанный на 100 пользователей из моих 250 – это Country Music Radio Today. Да неужели? Оказывается, Country Music Radio Today – это бот (его уже нет), который подписался на 750 тысяч профилей «Твиттера» в надежде, что они ответят ему тем же.

У меня есть бывшая подруга, которая, как я подозреваю, получила бы удовольствие от такого результата. Однажды она сказала, что я больше похож на робота, чем на человека.

Но шутки в сторону! Тот факт, что моим двойником стал бот, позволяет сделать важный вывод. Чтобы поиск двойников оказался по-настоящему точным, следует стремиться не просто найти кого-то, любящего то же, что и вы. Нужно искать того, кто не любит то же, что не любите вы.

Мои интересы становятся очевидными не только на основании тех аккаунтов, на которые я подписываюсь, но и тех, которые я не выбираю. Я интересуюсь спортом, политикой, комедиями и наукой, а не едой, модой или театром. Мои подписки показывают, что мне нравится Берни Сандерс, но не Элизабет Уоррен [30], Сара Сильверман, но не Эми Шумер [31], «New Yorker» но не «Atlantic» [32], мои друзья – Ной, Эмили Сэндс и Джош Готтлиб, но не Сэм Ашер. (Извини, Сэм, но твои посты в Twitter – это скукота.)

Из 200 миллионов аккаунтов в Twitter, у кого профиль похож на мой? Оказалось, мой двойник – пишущий для Vox [33] Дилан Мэтьюз. Это стало большим разочарованием с точки зрения улучшения использования социальных сетей, ведь я уже и так подписан на аккаунт Дилана в Twitter и Facebook и постоянно читаю его статьи в Vox. Поэтому знание о том, что именно он является моим двойником, ничего в моей жизни не изменило. Но это довольно круто – узнать о существовании человека, больше всех в мире похожего на вас. Особенно, если это кто-то, кем вы восхищаетесь. И когда я закончу эту книгу и перестану жить отшельником, может быть, мы с Мэтьюзом сможем общаться и обсуждать сочинения Джеймса Суровецки.

Поиск двойника Ортиса был важен для многих поклонников бейсбола, а поиск моего двойника был интересен только мне. Что еще могут показать такие исследования? Прежде всего, с помощью подобных данных многие крупнейшие интернет-компании стараются улучшить свои услуги и работу с пользователями. Amazon использует что-то вроде поиска двойников для вычисления книг, которые вы хотели бы купить. Там видят, что именно выбирают люди с вашими параметрами, и основывают на этом свои рекомендации.

Pandora делает то же самое, определяя, какие песни вы хотите слушать. Примерно так же Netflix узнает, какие фильмы вы хотели бы посмотреть. Результат получился просто ошеломляющим. Когда инженер Amazon Грег Линден в первый раз использовал поиск двойников для предсказания предпочтений читателей, и рекомендации оказались настолько точными, основатель Amazon Джефф Безос пал перед Линденом на колени с воплем: «Я тебя не достоин!»

Но самое интересное в поиске двойников не то, что он сейчас используется почти повсеместно, а то, что он часто не используется. Есть несколько крупных областей, работа которых может быть значительно улучшена путем персонализации. Возьмите, например, наше здоровье.

Исаак Коган, ученый и исследователь из Гарварда, пытается воплотить этот принцип в медицине. Он хочет собрать и организовать всю нашу медицинскую информацию так, чтобы вместо использования одинакового подхода ко всем, врачи подыскивали бы похожих на вас пациентов. Затем они могли бы использовать более персонализированную диагностику и более целенаправленное лечение.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация