Книга Управление на основе данных. Как интерпретировать цифры и принимать качественные решения в бизнесе, страница 19. Автор книги Тим Филлипс

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Управление на основе данных. Как интерпретировать цифры и принимать качественные решения в бизнесе»

Cтраница 19

Статистика по сообщениям в твиттере и числу зрителей телевизионного шоу – более сложный случай. Между этими показателями может быть причинно-следственная связь, но при этом возможны три сценария.

• Эффект социального воздействия: когда пользователи пишут о телевизионном шоу в твиттер, это стимулирует других смотреть передачу.

• Сплетни о ТВ: когда зрители смотрят телешоу, им хочется написать об этом в твиттер.

• Высокое качество: у интересных телевизионных шоу большая зрительская аудитория, и они вызывают оживленное обсуждение.


Все это действительно важно, если вы работаете в телевизионной компании. Как вы используете социальные медиа? Велико искушение поверить в первый сценарий, инвестировать в то, чтобы побудить пользователей писать сообщения в твиттер, и ждать, что ваша аудитория вырастет. Многие компании примерно так же обосновывали выделение бюджета на продвижение в социальных сетях и обнаружили, что, когда они искусственно стимулировали количество сообщений в социальных сетях, ничего не происходило. Может быть, дело в том, что причинно-следственная связь здесь обратная: люди пишут сообщения о том, что они делают. В этом случае социальные медиа по-прежнему остаются полезным инструментом, но только для неформального аудита того, что собираются делать ваши потребители.

Третий сценарий также выглядит вполне достоверным. Он означает, что оптимальный способ потратить деньги – это вложить их не в социальные медиа, а в создание более качественного сценария и приглашение хороших актеров.

Между этими тремя сценариями может существовать взаимосвязь: А становится причиной В, В – причиной А или С (неизмеряемый показатель) становится причиной как А, так и В. Определением этих взаимосвязей занимается наука эконометрика. При наличии достаточного массива данных можно проверить две вещи: заметен ли эффект, когда А происходит до В, но не наоборот, когда В происходит до А (тогда можно предположить, что А становится причиной В); а также при прочих равных условиях (например, качестве) по-прежнему ли А вызывает В?

На основании доказательств, собранных на протяжении определенного периода и путем многочисленных наблюдений, можно с определенной долей уверенности утверждать наличие взаимосвязи между показателем индекса массы тела и вероятностью инфаркта. Мы можем быть уверены, что инфаркт не повышает индекс массы тела, так что В не является причиной А. Кроме того, этот эффект по-прежнему присутствует, когда все остальные переменные (генетический набор, стресс на работе и тому подобные) остаются постоянными. И эта взаимосвязь проявляется с течением времени во многих местах.

У вас вряд ли хватит времени, денег или массива данных, чтобы установить причинно-следственные отношения между абсолютно всеми аспектами и показателями вашего бизнеса. Но есть два неформальных теста, которые вы можете провести.

• Проверка практикой: если кто-то говорит вам, что А становится причиной В, может ли этот человек привести убедительные доказательства, что так оно и есть? Если никто не может дать достаточно достоверного объяснения, скорее всего, есть еще какой-то фактор.

• Проверка на повторяемость: если, как вам кажется, вы обнаружили закономерность, обратите внимание, повторится ли она в следующем месяце или в другом вашем офисе или с другими клиентами.


Некоторые причинно-следственные отношения интересны, но не важны. Если вы установили, что А становится причиной В, от этой информации мало пользы, так как вы не можете изменить фактор, вызывающий этот эффект. Поручив выполнение задачи лучшим сотрудникам, вы можете быть уверены по крайней мере в том, что она будет исполнена в срок, при этом вы не можете повысить уровень надежности, поручив им больше работы, так как ваши сотрудники и так загружены. Вам придется найти другую причинно-следственную связь, на которую вы можете как-то повлиять: нанять новых сотрудников, инвестировать в обучение персонала или более эффективно делегировать рабочие задачи.

На практике бывает довольно сложно отличить корреляцию от причинно-следственных отношений, но не нужно быть специалистом по эконометрике, чтобы принимать более качественные решения. Просто примените два описанных выше теста, а затем решите, можете ли вы что-то сделать. И если вы едите много сыра, постарайтесь не запутаться в простынях, когда отправляетесь ко сну (шутка!).

21. Когда информации слишком много

Как избежать ступора при анализе огромного количества данных?

В середине нулевых Netflix [20] объявила о призе в миллион долларов любому, кто повысит эффективность рекомендательного алгоритма компании на 10 %. Специалисты по работе с данными со всего мира принялись за работу. Через три года, 21 сентября 2009 года, приз получила команда под названием BellKor’s Pragmatic Chaos.

Как им это удалось? Вот что говорится в статье, опубликованной одним из членов команды Йехудой Кореном: «На основе архитектуры ограниченной машины Больцмана (RBM) мы применили новую модель RBM с повышенной точностью путем обусловливания видимых элементов…»

Однако давайте прежде всего обсудим, почему это стало такой проблемой. Компания Netflix предлагает несколько тысяч фильмов и телевизионных шоу, поэтому ей сложно прогнозировать, что конкретному пользователю понравится больше всего. Когда вы совершаете покупки в интернет-магазине Amazon или на похожих сайтах, у вас есть подсказка в виде рекомендаций: «Пользователи, купившие этот товар, также покупают…» Для компании Netflix этот способ слишком ненадежный, так как ее пользователи выбирают, как они проведут целый вечер. Когда вы заходите на сайт Netflix, компания должна предложить вам идеальный фильм именно для вас, основываясь на имеющихся о вас знаниях: как правило, это какие кинокартины вы смотрели до этого, как вы их оценили, насколько часто вы выбираете фильмы одной категории, а также некоторые общие факты, например где вы территориально находитесь и какое у вас время суток.

Научная сторона вопроса

Эта проблема не кажется особо сложной, пока ее не пытаются решить. Тогда вдруг выясняется, что количество разных сочетаний этих переменных исчисляется миллиардами. При этом компания Netflix не исключение. Большинство решений, которые нам приходится принимать в реальной жизни, очень похожи: например, на работе вы получаете задачу изменить что-то, при этом зачастую вы ставите перед собой конкретную цель, которой хотите добиться. Хотя, к сожалению, вряд ли вам предлагают миллион долларов за улучшение работы на 10 %. Мы изучили взаимосвязь, свойство двух переменных, на основании которого делается прогноз. Когда мы говорим: «чем больше этого, тем больше будет этого», в простейшем математическом виде это выглядит так:

y = a + bx.

Это уравнение наклонной прямой. Можно измерить (или наблюдать) значение х, умножить его на b, прибавить а и получить значение y (специалисты по прогнозированию также могут использовать логарифм х или квадрат х или применять другие приемы, но это приводит только к усложнению). Линия наилучшего соответствия, проходящая через все точки (речь об этом уже шла в части 2), показывает, насколько нужно увеличить значение х, чтобы добиться увеличения значения y. В 2010 году британское правительство использовало этот метод, чтобы рассчитать, что повышение пошлин на сигареты (х) на 1 % приведет к увеличению суммы налоговых сборов (у) на $33 млн.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация