Книга Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных, страница 36. Автор книги Дэвид Хэнд

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных»

Cтраница 36

Однако Директива ЕС по гендерным вопросам включала пункт о возможном отказе. Он допускал «различия в размере надбавок и выгод отдельных лиц, когда пол является определяющим фактором оценки риска на основе соответствующих и точных актуарных и статистических данных». Иначе говоря, мужчинам и женщинам, идентичным по всем другим характеристикам в статистической модели, разрешалось платить разные страховые взносы, если данные показывали, что они имеют разные риски.

Такова одна из точек зрения на понятие «справедливость», и все было бы хорошо, если бы в 2008 г. в Конституционный суд Бельгии не был подан иск, в котором утверждалось, что данный отказ несовместим с принципом равенства между мужчинами и женщинами. Судебный процесс растянулся на три года, в марте 2011 г. Европейский суд постановил, что отказ должен рассматриваться как недействительный начиная с 21 декабря 2012 г. С этого момента требовать различные страховые взносы от мужчин и от женщин с идентичными остальными показателями стало незаконным, даже если данные показывают, что их риски неравноценны. Половая идентичность в этой сфере окончательно перешла в темную зону.

Например, в случае автострахования размер взноса для женщин раньше был ниже, поскольку данные показывали, что они реже попадают в аварии. Но после внесения в закон поправок такие различия стали неприемлемы. Это влияние хорошо иллюстрируется таблицей, опубликованной в лондонской The Telegraph от 21 января 2013 г. [78] Средний страховой взнос для мужчин (с более высоким риском) до внесения поправки составлял £658, а после – £619. В отличие от этого, средний взнос для женщин составлял £488, а после принятия поправки увеличился до £529. В самой рискованной возрастной группе 17–18 лет размер взноса для мужчин сократился с £2298 до £2191, а для женщин увеличился с £1307 до £1965.

Но это еще не все. Новые страховые взносы означают, что более рискованной группе, мужчинам, будет проще покупать страховку, и поэтому они с большей вероятностью это сделают, в то время как менее рискованная группа, женщины, будет страховаться реже. А это вряд ли выгодно обществу! Как мы видим, все опять зависит от конкретной интерпретации «справедливости».

Как правило, размеры страховых взносов основаны на оценке риска наступления страхового события, когда человек попадает в автомобильную аварию или заболевает и может предъявить страховое требование. Прогнозирование таких рисков строится на анализе исторических данных. Например, в случае медицинской страховки людей можно разделить на группы на основе индивидуальных признаков (возраст, пол, индекс массы тела, история болезни и т. д.), и данные покажут, какой сегмент каждой группы с одинаковыми характеристиками составляют люди, имеющие конкретное заболевание. Эти данные могут быть использованы для оценки того, с какой вероятностью человек с характеристиками, аналогичными характеристикам каждой из групп, заболеет в будущем. А эта вероятность, в свою очередь, будет использована при определении размера взноса для каждого в группе, поскольку считается, что внутри группы вероятность заболеваемости у всех одинаковая. Производить подобные расчеты – обязанность актуария.

Но давайте посмотрим, что происходит в такой группе людей с течением времени. Члены группы будут меняться, и при этом меняться по-разному. Некоторые прибавят в весе, другие бросят курить, третьи перестанут платить страховые взносы, четвертые просто исчезнут из поля зрения и т. д. Риск заключается именно в том, что каждый меняется по-своему, а вместе с этим меняется и вероятность заболеваемости: кто-то станет менее восприимчив к болезни, а кто-то наоборот. Соответственно изменятся и вероятности предъявления страховых требований.

Те, у кого меньше шансов заболеть, поймут, что вполне могут снизить свои страховые взносы, заключив договор с другим страховщиком. Благодаря этому в страховом портфеле компании начнет расти доля людей с более высоким риском. Через некоторое время страховая компания увидит, что взносы оставшихся людей с высоким риском вряд ли покроют стоимость их требований. Поэтому она увеличит премии. Затем цикл повторится, образуя так называемую страховую спираль смерти, которая с каждым витком увеличивает затраты. Помните рынок «лимонов» Джорджа Акерлофа?

Фундаментальная проблема здесь состоит в том, что расчет страховщика основывается на среднем значении. Всем в начальной группе был присвоен одинаковый риск, хотя на деле риски разные. При таком усредняющем подходе любые отклонения от среднего значения можно рассматривать как темные данные (DD-тип 9: обобщение данных).

Агрегируя и обобщая данные, заменяя их средними значениями, мы сами создаем область тьмы, и это, увы, происходит не только в теории. Давайте рассмотрим Закон о доступном медицинском обслуживании, подписанный в 2010 г. президентом США и вошедший в историю как Obamacare.

Один из параграфов закона предусматривал так называемый индивидуальный мандат – требование к американцам покупать медицинскую страховку или же быть подвергнутыми штрафу, за исключением особых обстоятельств. Это означало, что в план были включены как здоровые люди с низким риском заболеваемости, так и те, кто нуждался в дорогостоящем медицинском лечении. В свою очередь, это означало, что в целом пул застрахованных людей имел меньший риск, поэтому размер взносов мог быть снижен. Однако в 2017 г. сенат США проголосовал за отмену этого мандата, иначе говоря, за то, чтобы медицинская страховка не являлась обязательной (эти законодательные изменения вступили в силу в 2019 г.). Как следствие, мы можем ожидать, что из программы страхования выпадет непропорционально больше людей с низким риском, чем с высоким, так что в среднем потребуется больше медицинских услуг и большие расходы. А это, в свою очередь, будет означать более высокие взносы. Бюджетное управление конгресса предсказало, что отмена индивидуального мандата заставит 13 млн человек отказаться от страхования здоровья до 2027 г., что приведет к увеличению размера взносов на 10 % в год. Оценки разнятся, например, Standard & Poor’s называет более низкую цифру, от 3 до 5 млн человек в течение 10-летнего периода, но в любом случае перспективы не самые радужные.

Существует и целый ряд других осложнений. Одним из них является тот факт, что страховщики США могут отказаться от участия в программе. Это еще один возможный источник неблагоприятного отбора, влияющий на качество данных и всю систему страхования в целом. На момент написания книги ситуация продолжает развиваться, и во что она выльется, пока не ясно, хотя и весьма любопытно.

В этой главе мы познакомились с тем, какие возможности дают неопределенности и упущения в правилах, как наблюдение может влиять на процесс генерации данных, как информационная асимметрия дает одним преимущества перед другими и как все эти аспекты темных данных воздействуют на алгоритмы. Проблема осложняется тем, что эти аспекты могут проявляться одновременно, как в случае со «спиралью смерти» в страховании. Но все-таки манипулирование правилами – это одно, а намеренная подделка данных – нечто совсем другое. И это именно то, что мы исследуем в следующей главе.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация