Книга Наука о данных, страница 28. Автор книги Джон Келлехер, Брендан Тирни

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Наука о данных»

Cтраница 28

Поиск ассоциативных правил становится более эффективным, если корзины товаров связаны с демографическими данными клиента. По этой причине многие ритейлеры используют программы лояльности, которые позволяют связывать разные корзины не только с одним клиентом, но и с его демографическими данными. Например, ассоциативные правила, основанные на демографии, могут применяться к новым клиентам, о привычках и предпочтениях которых у компании нет информации. Вот пример ассоциативного правила, учитывающего демографические данные:

ЕСЛИ пол (мужской), возраст (<35) и {хот-доги, кетчуп} — ТО {пиво} [поддержка = 2 %, доверие = 90 %].

Привычная область поиска ассоциативных правил — содержимое покупательских корзин. Она охватывает товары, приобретенные за одно посещение магазина или сайта. Этот сценарий работает для большинства ритейлеров и аналогичных бизнесов, однако поиск ассоциативных правил полезен и в ряде других областей за пределами розничной торговли. К примеру, в индустрии телекоммуникаций применение ассоциативных правил в отношении клиента помогает компаниям проектировать различные сервисы и объединять их в пакеты. В страховании ассоциативные правила используются, чтобы обнаруживать связи между страховыми продуктами и требованиями клиентов. В области медицины с их помощью проверяют взаимосвязь между существующими и новыми методами лечения и лекарственными средствами. А в банковских и финансовых услугах используют ассоциативные правила для определения соответствия продуктов и конкретных клиентов, чтобы применить их к новым клиентам. Анализ ассоциативных правил также может быть использован для исследования поведения покупателей в течение определенного периода времени. Например, клиенты, как правило, одновременно покупают продукты X и Y, а через три месяца — продукт Z. Этот период времени можно рассматривать как одну корзину покупок, хотя он охватывает три месяца. Поиск ассоциативных правил в такой расширенной во времени корзине расширяет и области применения найденных правил, включая графики обслуживания и замены деталей, сервисные вызовы, предложение финансовых продуктов и прочее.

Уйдет иль не уйдет, вот в чем вопрос (Классификация)

Стандартной бизнес-задачей в сфере управления взаимоотношениями с клиентами является оценка вероятности того, что отдельный клиент предпримет какое-либо действие. Для описания этой задачи используют термин «моделирование склонности», поскольку цель состоит в том, чтобы смоделировать склонности человека. Это могут быть реакция на маркетинг, дефолт по кредиту или отказ от услуг. Возможность идентифицировать тех, кто может покинуть сервис, особенно важна для операторов мобильной связи, которым требуются значительные инвестиции для привлечения новых клиентов. Фактически привлечение нового клиента в этой области обычно обходится в пять-шесть раз дороже, чем удержание постоянного. В результате многие операторы готовы биться за сохранение своих нынешних клиентов, стараясь при этом минимизировать затраты. Поэтому удержание клиентов за счет снижения тарифов для всех и замены старых телефонов на новые — неподходящий вариант. Вместо этого компании нацеливают свои предложения на тех клиентов, которые могут уйти в ближайшем будущем. Если идентифицировать клиента, который собирается сменить оператора, и попытаться убедить его остаться, предлагая новый телефон взамен старого или выгодный тарифный план, то компания может даже сэкономить на разнице между щедрым предложением и стоимостью привлечения нового клиента.

Термин «отток клиентов» применяется для описания группы потребителей, которые покидают один сервис и присоединяются к другому. Соответственно, проблема выявления клиентов, которые могут уйти в ближайшем будущем, называется прогнозированием оттока. Как следует из названия, эта задача прогнозирования и состоит в том, чтобы классифицировать клиента, подпадает он под риск оттока или нет. Многие компании в телекоммуникационной, коммунальной, банковской, страховой и других отраслях используют этот вид анализа для прогнозирования оттока клиентов. Еще одна растущая сфера применения — прогнозирование текучести кадров или оттока персонала, т. е. того, какие сотрудники, скорее всего, покинут компанию в течение определенного периода времени.

Когда модель прогнозирования возвращает метку или категорию для входных данных, она называется моделью классификации. Обучение модели классификации требует исторических данных, где для каждого объекта указано, произошло целевое событие в его случае или нет. Процесс обучения модели классификации обычно описывают таким высказыванием:

«Мы учимся на прошлом, чтобы предсказывать будущее».


Классификация — это метод машинного обучения с учителем, в ходе которого берется набор данных с помеченными экземплярами и строится модель классификации с использованием одного или нескольких алгоритмов. Помеченный набор данных называется обучающим. Он состоит из объектов, целевой результат которых уже известен. Например, для анализа оттока клиентов требуется набор данных (по одной строке на каждого), в котором клиентам будут присвоены метки, указывающие на возможность смены ими поставщика услуг. Такой набор данных будет включать в себя целевой атрибут, который перечисляет эту метку для каждого клиента. В одних случаях назначить метку оттока для записи клиента несложно. Например, клиент сам связался с компанией и недвусмысленно отменил свою подписку или контракт. В других случаях вероятность оттока может быть неявной. К примеру, не все абоненты имеют ежемесячный контракт с оператором мобильной связи. Некоторые предпочитают договор предоплаты, который позволяет пополнять счет не регулярно, а только по необходимости. Определить, собирается ли клиент с таким типом контракта прекратить пользование услугами, бывает непросто, поскольку неясно, что считать признаком: отсутствие звонков в течение двух недель, нулевой баланс, прекращение активности на три недели или что-то еще. После того как факт оттока был установлен с точки зрения бизнеса, необходимо реализовать это определение в коде, чтобы назначить целевую метку клиенту в наборе данных.

Другим фактором, усложняющим прогнозирование оттока, является необходимость учета временных задержек. Цель прогнозирования оттока состоит в том, чтобы смоделировать склонность (или вероятность) клиента к уходу в определенный момент в будущем. Следовательно, этот тип модели имеет временное измерение, которое необходимо учитывать при создании набора данных. Атрибуты в наборе данных для модели склонности взяты из двух разных периодов времени — периода наблюдения и итогового периода. Период наблюдения — это период времени, на основе которого рассчитываются значения входных атрибутов. Итоговый период — период, на основе которого рассчитывается целевой атрибут. Цель создания модели оттока клиентов состоит в том, чтобы дать возможность бизнесу провести вмешательство до события оттока, чтобы побудить клиента остаться. Это означает, что прогноз относительно оттока клиентов должен быть сделан до того, как клиент фактически покинет сервис. Продолжительность периода, необходимого для попытки удержания клиента, равна продолжительности итогового периода, и прогноз, который возвращает модель оттока, по факту состоит в том, расстанется ли клиент с компанией в течение этого итогового периода. Например, модель может быть обучена предсказывать, что клиент уйдет в течение одного или двух месяцев, в зависимости от скорости предпринятых бизнесом мер по его удержанию.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация