Книга Алгоритмы для жизни. Простые способы принимать верные решения, страница 17. Автор книги Брайан Кристиан, Том Гриффитс

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Алгоритмы для жизни. Простые способы принимать верные решения»

Cтраница 17

На первом этапе исследования Уора четверо из десяти детей, получивших традиционное лечение, умерли, а все девять из девяти, к кому было применено ЭКМО, выжили. Четырех смертей было достаточно, чтобы запустить вторую фазу исследования, в которой двадцати пациентам было сделано ЭКМО, и девятнадцать выжили. Уор и его коллеги были убеждены полученными результатами, заключив, что «сложно будет оправдать дальнейшую рандомизацию с этической точки зрения».

Но некоторые врачи на тот момент уже пришли к этому выводу самостоятельно и подняли шум. В число критиков входил и Дон Берри, один из ведущих мировых экспертов по проблеме многорукого бандита. В комментарии, который был опубликован параллельно с результатами исследования Уора в журнале Statistical Science, Берри писал, что «случайный выбор пациентов для получения не-ЭКМО-лечения в исследовании Уора был неэтичным. …С моей точки зрения, исследование Уора не должно было проводиться».

И все-таки исследование Уора убедило не все медицинское сообщество. В 1990-х в Великобритании было проведено еще одно исследование ЭКМО, в котором участвовали около двухсот младенцев. Вместо адаптивных алгоритмов в этом исследовании использовались традиционные методы, то есть младенцы были случайным образом разделены на две равные группы. Исследователи объяснили свой эксперимент тем, что польза ЭКМО «является спорной только из-за различной интерпретации имеющихся данных». Как выяснилось, разница между двумя способами лечения не была столь ярко выражена в Великобритании, в отличие от США, но результаты тем не менее были заявлены «в соответствии с ранее сделанными заключениями о том, что применение метода ЭКМО снижает риск смертности». Какова была цена этого знания? В группе с применением традиционных методов лечения умерло на 24 младенца больше, чем в группе, где проводилось ЭКМО.

Трудность в признании результатов адаптивных клинических исследований может на первый взгляд показаться непонятной. Но учтите, что вклад статистики в медицину в начале XX века заключался в том, чтобы превратить ее из той сферы, где доктора в отдельно взятых ситуациях должны были убеждать друг друга в пользе новых методов лечения, в такую, где у них были бы четкие указания, какого рода данные убедительны, а какого – нет. Изменения в общепринятой статистической практике имеют все шансы нарушить это хрупкое равновесие, по крайней мере временно.

После спора, возникшего по поводу ЭКМО, Дон Берри перешел из отдела статистики Университета Миннесоты в Онкологический центр М. Д. Андерсона в Хьюстоне, где он применил методы, полученные в ходе изучения проблемы многорукого бандита, в разработке клинических испытаний для различных способов лечения рака. И хотя он остается самым громогласным критиком рандомизированных клинических испытаний, он ни в коем случае не одинок. В последние годы идеи, за которые он боролся, наконец-то стали массовыми. В феврале 2010 года Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США выпустило «руководство» – документ под названием «Адаптивный дизайн клинических исследований лекарственных средств и биопрепаратов», свидетельствующий о том, что они наконец-то готовы изучить альтернативы (несмотря на то что медики всю жизнь цеплялись за вариант, которому доверяют).

Беспокойный мир

Стоит только познакомиться с многорукими бандитами, как вы начнете видеть их повсеместно. Редко когда мы принимаем «изолированное» решение, результаты которого не будем использовать позже. Поэтому логично будет поинтересоваться, насколько в целом люди настроены решать подобные задачи, – вопрос, который широко изучался психологами и поведенческими экономистами.

Представляется, что люди склонны к избыточным исследованиям: новому уделяется несоизмеримо больше внимания, чем лучшему. Наиболее ярко данный феномен был продемонстрирован в 1966 году в эксперименте Амоса Тверски и Варда Эдвардса, когда испытуемым показали ящик с двумя лампочками на нем и сказали, что каждая лампочка будет загораться на какой-то определенный (но неизвестно какой) отрезок времени. Затем им дали 1000 шансов либо наблюдать, какая из лампочек загорится, либо сделать ставку на тот или иной результат, не видя самих лампочек. (В отличие от более традиционной схемы с многоруким бандитом, здесь невозможно было выбрать вариант, который был бы одновременно и заключением пари, и наблюдением; участники только в самом конце могли узнать, победила их ставка или нет.) Это чистой воды поединок между исследованием и эксплуатацией, сбором информации и ее использованием. В основном люди выбирали разумную стратегию, наблюдая за лампочками некоторое время, а затем делая ставки на кажущийся им наиболее вероятным исход. Но они неизменно тратили на наблюдение больше времени, чем требовалось. Насколько же больше? В первом эксперименте одна лампочка горела 60 % времени, а другая 40 %; разница не слишком заметна. В этом случае люди предпочли 505 раз в среднем наблюдать, а в остальных 495 попытках делать ставки. Но математика говорит, что им следовало бы начинать спорить после 38 наблюдений, оставляя себе 962 шанса выиграть пари.

Другие исследования привели к аналогичным выводам. В 1990-х исследователи из Уортонской школы бизнеса Роберт Мейер и Янг Ши провели эксперимент, в котором людям предлагалось на выбор два варианта: один с верным шансом на успех, а другой с неизвестным, а именно две авиакомпании: перевозчик с именем, всегда прилетающий по расписанию, и совершенно новая авиакомпания, не имеющая пока репутации. С учетом цели максимизации количества прибывших вовремя рейсов за установленный период времени математически оптимальной стратегией было бы летать новой авиакомпанией при условии, что преимущества перевозчика с именем не столь очевидны. Если в какой-то момент станет ясно, что известная авиакомпания лучше (то есть если индекс Гиттинса у новичка падает ниже показателей «ветерана»), тогда вы немедленно переключаетесь на авиакомпанию с именем и больше никогда не изменяете своему выбору. (Если в этой ситуации вы не сможете получить больше информации о компании-новичке, как только перестанете с ней летать, у нее не будет шансов реабилитироваться.) Но в процессе эксперимента люди предпочитали летать неизвестной авиакомпанией слишком редко, когда все было хорошо, и слишком часто, когда все было плохо. Они также не ставили на ней крест, продолжая периодически выбирать ее, особенно в ситуациях, когда ни один перевозчик не прибывал вовремя по расписанию. Все это лишний раз подтверждает тенденцию к чрезмерному исследованию.

И наконец, психологи Марк Стейверс, Майкл Ли и Э.-Я. Вагенмакерс провели эксперимент с четырехруким бандитом, предложив группе людей выбрать, за какой рычаг дергать, предоставив для этого 15 попыток. Затем они классифицировали стратегии, которые, как им показалось, использовали участники. Итоги показали, что 30 % участников были наиболее близки к оптимальной стратегии, 47 % предпочитали принцип «победи – закрепи успех, проиграл – переключись» и 22 % хаотично выбирали между выбором нового рычага и рычагом лучшего до сих пор автомата. Это опять-таки согласуется со склонностью к чрезмерным исследованиям, так как и принцип «закрепи победу», и случайный выбор рычага заставляют людей пробовать нечто отличное от того, что привело к успеху в последней игре, хотя вместо этого они могли бы, наоборот, наслаждаться результатами. Таким образом, в то время как мы склонны нанять нового секретаря слишком быстро, мы, как правило, прекращаем летать новой авиакомпанией слишком поздно. Но так же как работа без секретаря имеет свои издержки, так же есть свои издержки у слишком быстрого привыкания к новой авиакомпании: мир может измениться.

Вернуться к просмотру книги Перейти к Оглавлению Перейти к Примечанию

Вход

Регистрация | Забыли пароль?

Поиск по сайту

Календарь

Навигация