К этому моменту, я уверен, многие читатели гадают, насколько этот вымышленный сценарий близок к реальности. Неужели жаркий спор о курении и раке разрешился благодаря одной работе на основе наблюдений и одной каузальной диаграмме? Если мы предположим, что рис. 41 точно отражает причинностный механизм возникновения рака, ответом будет абсолютное «да». Однако то, насколько наши допущения справедливы для реального мира, требует дополнительного обсуждения.
Дэвид Фридман, мой старый друг, занимающийся статистикой в Калифорнийском университете в Беркли, серьезно раскритиковал меня по этому вопросу. Он утверждает, что модель на рис. 41 нереалистична по трем причинам. Во-первых, если ген курильщика» существует, он должен влиять и на то, как тело избавляется от чужеродных веществ в легких, и, таким образом, люди с этим геном будут более склонны к возникновению отложений смол, а люди, лишенные его, — более устойчивы к нему. Поэтому он бы нарисовал стрелку от гена курильщика к смоле, и в этом случае формула парадного входа окажется непригодной. Фридман считает также маловероятным, чтобы курение влияло на возникновение рака только через отложения смол. С уверенностью можно предположить и другие механизмы: не исключено, что курение ведет к хроническому воспалению, которое, в свою очередь, способствует развитию рака. Наконец, говорит он, отложения смол в легких живого человека все равно нельзя измерить со сколь-либо приемлемой точностью, поэтому предложенную мной работу на основе наблюдений не провести в реальном мире.
Я не возражаю против критики Фридмана в этом конкретном примере. Я не специалист по раку, и мне всегда придется оставлять на усмотрение эксперта в данном вопросе, насколько подобная диаграмма адекватно отражает процессы, происходящие в реальном мире. На самом деле одно из самых значительных достижений метода каузальных диаграмм в том, что они делают допущения прозрачными и открытыми для обсуждения экспертами и политиками.
Тем не менее цель моего примера была не в том, чтобы предложить новый механизм для воздействия курения на организм, а в том, чтобы продемонстрировать, как математика в определенной ситуации способна устранить воздействие конфаундеров, даже если данных по самому конфаундеру нет. Подобную ситуацию легко распознать. В ситуациях, когда каузальное воздействие X на Y осложняется одним набором переменных (С) и опосредуется другим (М) (рис. 42) и, более того, опосредующие переменные защищены, как щитом, от воздействий C, вы всегда можете оценить воздействие X, пользуясь наблюдаемыми данными. Узнав об этом факте, ученым было бы разумно, столкнувшись с неустранимыми конфаундерами, искать защищенные медиаторы. Как говорил Луи Пастер, «удача сопутствует подготовленному уму».
К счастью, достоинства поправок парадного входа не остались не оцененными. В 2014 году Адам Глинн и Константин Кашин, оба политологи из Гарварда (Глинн впоследствии перешел в Университет Эмори), написали получившую премию работу, которую следовало бы сделать обязательным чтением для всех ученых, занимающихся исчислениями в области общественных наук. Они применили новый метод к массиву данных, ранее тщательно изученных представителями общественных наук, — исследованию по Закону о партнерстве в области профессиональной подготовки (Job Training Partnership Act; JTPA), которое проводилось с 1987 по 1989 год. По результатам JTPA 1982 года, Департамент труда создал программу профессиональной подготовки, которая, помимо других целей, снабжала участников профессиональными навыками, навыками поиска работы и опытом работы. Она собирала данные о людях, подававших заявки для участия в этой программе, тех, кто реально пользовались ее услугами, и об их доходах за последующие 18 месяцев. Следует обратить внимание, что в исследование входили и РКИ, и данные, полученные в результате наблюдений, в которых люди делали выбор самостоятельно.
Рис. 42. Базовые условия для применения критерия парадного входа
Глинн и Кашин не рисовали каузальных диаграмм, но, судя по описанию их исследования, я бы нарисовал ее так, как на рис. 43. Переменная записавшиеся сообщает, зарегистрировался ли испытуемый для участия в программе или нет; переменная посещавшие сообщает, посещали ли записавшиеся занятия на самом деле. Очевидно, что программа могла повлиять на доходы только в том случае, если пользователь действительно посещал занятия, поэтому отсутствие прямой стрелки от записавшихся к доходам легко понять.
Глинн и Кашин не стали вдаваться в природу осложнителей, но я просуммировал их в переменной мотивация. Ясно, что человек, испытывающий сильную мотивацию увеличить свои доходы, с большей вероятностью запишется на курсы. Этот же человек с большей вероятностью увеличит свой заработок через 18 месяцев, вне зависимости от того, посещал ли он курсы. Цель исследования, конечно, — отделить влияние этого осложняющего фактора и найти, насколько велика помощь непосредственно от курсов.
Рис. 43. Каузальная диаграмма для исследования JTPA
Сравнивая рис. 42 и 43, мы увидим, что критерий парадного входа был бы здесь применим, если бы не было стрелки от мотивации к посещавшим — щита, упомянутого выше. Во многих случаях мы оправдываем отсутствие такой стрелки. Например, если бы услуги программы осуществлялись только в назначенное время и люди не укладывались в него только по уважительным причинам, не связанным с мотивацией (скажем, забастовка водителей общественного транспорта или сломанная нога), мы могли бы стереть эту стрелку и воспользоваться критерием парадного входа.
В реальных условиях исследования, когда услуги программы доступны в любое время, подобный аргумент не годится. Тем не менее — и это особенно интересно — Глинн и Кашин протестировали критерий парадного входа. Отнесемся к этому как к тесту на сенситивность. Если мы подозреваем, что средняя стрелка обозначает очень слабое воздействие, искажение, возникающее, если считать ее отсутствующей, совсем незначительно. Судя по их результатам, именно так дело и обстояло. Приняв определенные разумные допущения, Глинн и Кашин получили неравенства, по которым определили, была ли поправка чрезмерной или недостаточной и насколько. Наконец, они сравнили предсказания черного хода и парадного входа с результатами рандомизированного контролируемого исследования, которое проводилось в то же самое время. Результаты впечатлили. Оценки с помощью критерия черного хода (с поправками по таким известным конфаундерам, как возраст, раса и регион) оказались совершенно неверны, они отличались от экспериментальных результатов на сотни тысяч долларов. Это именно та картина, которая наблюдается, если имеется нераспознанный конфаундер. Критерий черного хода не способен внести по нему поправки. Тем не менее оценки парадного входа убрали почти все воздействия со стороны переменной мотивация. Для мужчин оценки по критерию парадного входа оказались в пределах экспериментальной ошибки РКИ, даже с небольшой положительной ошибкой, предсказанной Глинном и Кашиным. Для женщин результаты былиь еще точнее. Оценки парадного входа совпали с экспериментальными данными почти идеально, без сколько-нибудь заметной ошибки. Работа Глинна и Кашина подтверждает как эмпирически, так и экспериментально, что, если только воздействие С на М (на рис. 42) незначительно, поправки парадного входа могут дать разумно точную оценку воздействия X на Y. Результат при этом значительно лучше, чем если вовсе не вводить поправок по С.