Книга BIG DATA. Вся технология в одной книге, страница 80. Автор книги Андреас Вайгенд

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «BIG DATA. Вся технология в одной книге»

Cтраница 80

BIG DATA. Вся технология в одной книге

В МИРЕ ДАННЫХ

ОДНИМ ИЗ НАИБОЛЕЕ

ЗНАЧИТЕЛЬНЫХ

НЕПРОГНОЗИРУЕМЫХ

НЕГАТИВНЫХ РЕЗУЛЬТАТОВ

ЯВЛЯЕТСЯ ВЗЛОМ

BIG DATA. Вся технология в одной книге

Давайте посмотрим, какого рода данные накапливаются в Amazon. Компания регистрирует все ваши покупки и адреса доставки. Помимо истории просмотров и покупок для выработки рекомендаций можно было бы проанализировать, насколько далеко от вас живут другие люди, рассматривавшие этот же товар. Возможно, вам пригодятся рекомендации, сделанные на основе статистики о наиболее частых покупках в вашем городе или штате, особенно если вы ищете специфический для этой местности товар, например с пониженным потреблением воды, если живете в засушливой Калифорнии [419]. У Amazon есть и другие виды информации, с которыми интересно поэкспериментировать, в частности тип устройства, использованного при просмотрах. Если вы делаете это с помощью телефона, то сможете быстрее найти то, что вам нужно, если сделаете акцент на товарах, заказанных именно с мобильных устройств, а не с ПК. Для этого может потребоваться аутентификация устройства, например, чтобы учесть, что вы выходите в интернет через wi-fi в салоне самолета.

Инфопереработчики могут утверждать, что обнародование их внутренних настроек, в том числе по умолчанию, снизит их конкурентные преимущества. Разумеется, некоторые организации могут быть против предоставления пользователям возможности экспериментировать с регулировками, поскольку строят определенную часть бизнеса на информации, остающейся в их распоряжении. Несколько лет назад двадцатидвухлетний предприниматель Актарер Заман создал Skiplagged – веб-сайт, с помощью которого пользователи могли находить авиабилеты по более низкой стоимости, чем официальные тарифы авиакомпаний. Создатель сайта учел тот факт, что авиакомпании иногда делают скидку на сложные маршруты с пересадками в узлах, которые сами по себе являются популярными направлениями. Например, в определенный день мне нужно попасть из Сан-Франциско в Денвер, и самый дешевый тариф составляет 750 долларов. Та же авиакомпания может предлагать перелет из Сан-Франциско в Финикс через Денвер за 500 долларов, то есть первая часть маршрута как раз и является нужным мне рейсом. Получается, за то, что я пролечу на 600 миль меньше, с меня возьмут на 50 процентов больше, поскольку спрос на рейсы в Финикс ниже, чем на рейсы в Денвер. Заман назвал это продажей билетов в «невидимые города». Авиакомпания United Airlines подала на Skiplagged в суд, обвинив сайт в «недобросовестной конкуренции», хотя Заман всего лишь сообщил потребителям о существовании такого побочного продукта системы управления доходами авиакомпаний [420]. Наличие доступа к регулировкам, а не просто к информации, позволит нам изучать и находить схожие случаи, когда интересы поставщика услуг не совпадают с нашими собственными.

Самое важное, что, получая инструменты для экспериментов с настройками обработки информации и возможность видеть, как изменяются результаты, мы приобретаем знания о функционале личных предпочтений. Что мы чувствуем, изучая возможности различных вариантов, и как это сказывается на процессе выбора? Психологи Дэниел Канеман и покойный Амос Тверски в своих эпохальных научных работах о принятии решений в условиях неопределенности показали, что при решении задач с множеством неизвестных, не позволяющих оперативно получить оптимальный результат, люди часто руководствуются эвристиками или ментальными упрощениями. Дэнни и Амос выделяли три основных типа эвристики: эвристику доступности, то есть легкость, с которой появляется некая мысль; эвристику репрезентативности, то есть желание придавать большую значимость тому, что кажется более типичным; и эвристику закрепления – склонность судить о чем-либо, отталкиваясь от некой отправной точки [421]. Почти через полвека с момента публикации их основополагающего труда образовалась целая область знаний с сотнями вариаций на тему эвристики. Однако получить лучшее представление о том, насколько мы подвержены эвристикам, можно только экспериментальным путем. А с использованием регулировок современных методов обработки данных можно исследовать свои предположения относительно текущей ситуации и ожидания от будущего.

Вот конкретный пример. Консультировать человека по поводу объема накоплений, который позволит безбедно существовать после выхода на пенсию, трудно, поскольку такой расчет будет обусловлен многими неизвестными. В каком состоянии будет экономика через пять или через десять лет? Насколько вырастут цены на энергоносители и какие новые источники энергии появятся? Каковы будут потребности человека в услугах здравоохранения, если он непредсказуемо заболеет? Все эти факторы окажут непосредственное влияние на финансовое положение будущего пенсионера, но информации о них крайне мало. Человек не сможет существенно влиять на них, даже если получит ответы от некоего оракула. Но зато он может проиграть несколько сценариев и посмотреть, какие последствия могут повлечь решения, которые он способен принимать. Поэкспериментировав с параметрами модели, например с макроэкономическими условиями и структурой пенсионных накоплений, он может оценить вероятность различных вариантов и, возможно, сделать вывод о наиболее комфортном из них, который, возможно, будет далек от первоначального представления. Нам нужно поручить инфопереработчикам создать такие инструменты многовариантного анализа и дать нам доступ к ним.

Многовариантный анализ полезен во многих областях жизни. Вообразите себя выпускником школы, которого принимают и в Гарвард, и в Стэнфорд. Какой из университетов выбрать? И как принимать решение? В 2014 году социальная сеть LinkedIn запустила сервис University Pages, который анализирует огромный массив размещенных на сайте резюме, чтобы выяснить, где работают выпускники определенного университета и как складываются их карьеры. Такая «обогащенная» информация может помочь принять решение на основе многовариантного причинно-следственного анализа, сфокусированного как на изначальных допущениях (какой университет), так и на результатах (вероятная карьера). Если у будущего студента уже есть карьерный ориентир (например, пойти работать в Google, McKinsey, Monsanto или Всемирный фонд дикой природы), он может проверить, отличает ли выпускников данного университета необычно высокая вероятность устроиться на работу к определенному работодателю. Можно посмотреть, какие университеты являются главными поставщиками кадров для определенных профессий, включая такие увлекательные занятия, как консультант общественных организаций, сценарист телесериалов или инженер по керамике. Можно поэкспериментировать с фильтрами, чтобы выяснить, какие специальные курсы, помимо основных общеобразовательных, увеличивают шансы попасть на желаемую работу после выпуска [422].

Вход
Поиск по сайту
Ищем:
Календарь
Навигация