Хотя мы имеем полное право порицать Фишера за его закоснелость, а табачные компании — за сознательный обман, мы должны также признать, что научное сообщество тогда функционировало в смирительной рубашке. Фишер был прав, пропагандируя рандомизированные контролируемые эксперименты как высокоэффективной способ выяснения причинно-следственных связей. Однако он и его последователи не смогли осознать, что мы в состоянии многое узнать также и из чисто наблюдательных исследований. В этом преимущество каузальной модели: она мобилизует научные познания экспериментатора. Методы Фишера предполагают, что экспериментатор начинает работу без предварительного знания или мнения по поводу проверяемой гипотезы. Они навязывают ученому невежество, и этой ситуацией с радостью воспользовались отрицатели.
Поскольку у ученых не было прямого определения понятия «причина» и способа подтвердить каузальное воздействие без РКИ, они оказались не готовы к спору о том, вызывает ли курение рак. Им пришлось вслепую пробиваться к этому определению в течение долгого периода, который протянулся через все 1950-е и драматически завершился только в 1964 году.
Комиссия начальника здравоохранения и критерии Хилла
Статья Корнфилда и Лилиенфельда открыла дорогу для уверенных заявлений о вреде курения со стороны органов власти, занимающихся здоровьем. Королевский колледж врачей в Великобритании возглавил эту волну, издав в 1962 году отчет с выводом о том, что курение является причиной рака легких. Вскоре после этого министр здравоохранения Соединенных Штатов Америки Лютер Терри (вполне вероятно, что по поручению президента Джона Ф. Кеннеди) объявил о намерении создать специальную экспертную комиссию по изучению этого вопроса.
Комиссия была тщательно уравновешена, в нее входили пятеро курящих и пятеро некурящих членов, два человека от табачной индустрии и никого из тех, кто ранее участвовал в дебатах о курении, как с той, так и с другой стороны. Поэтому такие люди, как Лилиенфельд и Корнфилд, туда не вошли. Члены комиссии были признанными экспертами в области медицины, химии или биологии. Один из них, Уильям Кохран из Гарвардского университета, был статистиком. На самом деле репутация Кохрана в статистике была лучшей из возможных: он был учеником ученика Карла Пирсона.
Комиссия работала над отчетом больше года, и одной из самых больших проблем для нее оказалось слово «причина». Членам комиссии пришлось отказаться от детерминистских концепций причинности родом из XIX века, а также отложить в сторону статистику. Как они (вероятно, Кохран) писали в отчете, «статистические методы не могут доказать существование причинно-следственных отношений в ассоциации. Каузальное значение ассоциации — это вопрос суждения, которое выходит за рамки любой оценки статистической вероятности. Чтобы судить о каузальной значимости ассоциации между признаком, или агентом, и заболеванием, или воздействием на здоровье, нужно использовать целый ряд критериев, ни один из которых не является необходимым и достаточным основанием для такого суждения». Комиссия использовала пять таких критериев: согласованность (многие исследования в различных популяциях показывают похожие результаты); сила ассоциации (включая эффект «доза — ответ»: большее потребление табака ведет к большему риску); специфичность ассоциации (конкретный агент должен производить конкретный эффект, а не длинный список разных эффектов); временные отношения (эффект должен следовать за причиной); непротиворечивость (биологическая правдоподобность и согласованность с другими типами доказательств, такими как лабораторные эксперименты и временные ряды).
В 1965 году Остин Бредфорд Хилл, не состоявший в комиссии, попытался просуммировать эти аргументы таким образом, чтобы их можно было применять к другим проблемам общественного здоровья, и добавил к списку еще четыре критерия: в результате весь список из девяти критериев стал известен как «критерии Хилла». На самом деле Хилл называл их позициями, не требованиями, и подчеркивал, что каждая из них может отсутствовать в конкретном случае: «Ни одна из девяти моих позиций не может дать неопровержимого доказательства или опровержения гипотезы причинно-следственной связи, и ни одна не является обязательным условием», — писал он.
Действительно, несложно найти аргументы против каждого из критериев как из списка Хилла, так и из более короткого списка экспертной комиссии. Согласованность сама по себе ничего не доказывает: если 30 исследований игнорируют один и тот же конфаундер, все они легко могут оказаться со смещенной оценкой. Сила ассоциации уязвима по той же причине; как упоминалось ранее, размер обуви детей сильно коррелирует с их умением читать, но не связан с ним каузально. Специфичность всегда была особенно противоречивым критерием. Она имеет четкий смысл в контексте инфекционных болезней, когда один возбудитель, как правило, вызывает одно заболевание, но уже сильно размыта в случае средовых влияний. Курение повышает риск целого ряда других недугов, таких как эмфизема и сердечно-сосудистые заболевания. Снижает ли это надежность данных, что оно вызывает рак? Временная связь тоже не лишена исключений, например, рассвет наступает не из-за пения петуха, хотя петух поет всегда перед рассветом.
Наконец, согласованность с известными теориями и фактами, конечно, желательна, но в истории науки масса опровергнутых теорий и ошибочных лабораторных открытий.
Положения Хилла все еще полезны в качестве описания того, как научная дисциплина подходит к принятию каузальной гипотезы, используя различные типы подтверждений, но методология, которая позволила бы их применять, отсутствует. Так, биологическое правдоподобие и согласованность с экспериментальными данными, вероятно, хорошие, нужные вещи. Но как именно нам следует определять вес подобных подтверждений? Как именно мы вставим имевшиеся ранее знания в новую картину? Очевидно, на эти вопросы каждый ученый должен отвечать самостоятельно. Однако интуитивные решения могут быть ошибочными, особенно если в игру вступают политическое давление, финансовые выгоды или же если исследователь находится в зависимости от вещества, которое изучает.
Конечно, ни один из этих комментариев не предполагал хоть в чем-то принизить работу комиссии. Ее состав сделал все возможное в условиях отсутствия механизмов для обсуждения причинности. Их вывод о том, что нужны и нестатистические критерии, был огромным шагом вперед, а сложные личные решения, принятые курящими членами комитета, подтвердили серьезность их заключений. Лютер Терри, куривший сигареты, перешел на трубку. Леонард Шуман объявил, что бросает курить. Уильям Кохран признал, что, бросив курить, снизил бы риск заболеть раком, но чувствует, что ощущение комфорта, которое доставляют сигареты, оправдывает риск. Печальнее всего было то, что у Луиса Физера, выкуривавшего четыре пачки в день, обнаружили рак легких меньше чем через год после отчета. Он писал комиссии: «Вы, вероятно, помните, что, хотя меня и полностью убедили приведенные доказательства, я продолжал много курить во время всей работы комиссии, находя обычные оправдания… Мой собственный случай кажется мне убедительней любой статистики». Потеряв одно легкое, он все-таки бросил курить.
С позиций общественного здравоохранения отчет экспертной комиссии был эпохальным явлением. В течение двух лет конгресс ввел требование к производителям табака поместить на сигаретные пачки предупреждения об угрозе здоровью. В 1971 году рекламу сигарет запретили на радио и телевидении. Процент курящих среди взрослого населения США снизился с исторического максимума в 45,0 % в 1965 году до 19,3 % в 2010 году. Кампания против курения была одним из крупнейших и самым успешным, пусть и мучительно медленным и незавершенным достижением общественного здравоохранения в истории. Комиссия также выработала ценный протокол для достижения научного консенсуса и послужила моделью для будущих отчетов начальника здравоохранения по теме курения и многим другим в последующие годы (включая пассивное курение, которое стало большой проблемой в 80-х годах ХХ века).