Конечно, Хилл понимал, что РКИ в этом случае провести невозможно, но он знал о преимуществах сравнения опытной группы с контрольной группой. Поэтому он предложил сравнить пациентов, у которых уже диагностировали рак, с контрольной группой здоровых волонтеров. В каждой группе участников опрашивали, выясняя их привычки в прошлом и истории болезней. Чтобы не создавать системной ошибки, проводящим опрос не говорили, у кого из испытуемых есть рак, а у кого нет.
Результаты исследования были шокирующими: из 649 опрошенных пациентов с раком легких все, кроме двоих, курили. Случайность этого была настолько статистически невероятна, что Долл и Хилл не смогли удержаться от того, чтобы ее не подсчитать; 1,5 миллиона к одному. Кроме этого, пациенты с раком легких в среднем были более заядлыми курильщиками, чем входящие в контрольную группу, но (противоречие, которое впоследствии очень педалировал Фишер) меньший процент из них при этом вдыхал дым.
Этот тип исследования сегодня называется «случай — контроль», потому что в нем сравниваются «случай» (люди с заболеванием) и контрольная группа. Это явный прогресс по сравнению с серийными данными за определенное время, потому что специалисты могут вносить поправки по конфаундерам, таким как возраст, пол и испытанное воздействие загрязнений окружающей среды. Тем не менее в дизайне «случай — контроль» есть некоторые очевидные недостатки. Он ретроспективен, это значит, что мы изучаем людей, о которых известно, что у них рак, и обращаем взгляд в прошлое, пытаясь понять, почему он возник. Логика вероятностей также направлена в противоположную сторону. Данные сообщают нам вероятность того, что больные раком в прошлом курили, хотя нас интересует вероятность того, что курящий заболеет раком. Именно эта последняя вероятность имеет значение для человека, которому решать, курить ему или нет.
Кроме этого, в исследованиях типа «случай — контроль» возможно еще несколько источников искажений. Один из них — «ошибка памяти». Хотя Долл и Хилл позаботились о том, чтобы опрашивающие ничего не знали о диагнозах испытуемых, сами пациенты знали наверняка, есть у них рак или нет. Это так или иначе влияло на их воспоминания. Другая проблема — ошибка отбора. Госпитализированные пациенты, больные раком, никоим образом не должны считаться репрезентативной выборкой всей популяции или даже курящей ее части.
Короче говоря, результаты Долла и Хилла были очень наглядны, но все же не могли считаться строгим доказательством того, что курение вызывает рак. Двое исследователей вначале осторожно называли корреляцию связью. Устранив несколько конфаундеров, они осмелились на более уверенное утверждение: курение является фактором, и важным фактором в развитии карциномы легкого.
За несколько последующих лет 19 исследований «случай — контроль», проведенных в различных странах, пришли практически к тому же заключению. Однако, как злорадно указал Р. Э. Фишер, эксперименты с искаженной оценкой ничего не доказывают, даже если повторить их 19 раз, — оценка остается искаженной. В 1957 году Фишер писал, что эти исследования «лишь повторяли свидетельства одного и того же типа, и необходимо попытаться выяснить, достаточно ли свидетельств этого типа для научного заключения».
Долл и Хилл понимали, что, если в испытаниях «случай — контроль» есть скрытая системная ошибка, одно только повторение исследований ее не устранит. Поэтому в 1951 году они начали эксперимент на перспективу, для которого разослали опросники 60 тысячам британских врачей с просьбой рассказать об их отношении к курению и стали наблюдать за ними в дальнейшем (Американское общество по борьбе с раком начало похожее и более масштабное исследование примерно в то же время). Всего за пять лет обнаружились драматические различия. Смертность курильщиков от рака легких в 24 раза превышала таковую у некурящих. В эксперименте Американского общества по борьбе с раком результаты были еще страшнее: курильщики умирали от рака легких в 29 раз чаще, чем некурящие, а те, кто курил много, — даже в 90 раз. В свою очередь, люди, которые бросили курить, снизили для себя риск заболевания вдвое. Согласованность всех этих результатов (большее потребление табака ведет к большему риску — прекращение курения снижает риск) была еще одним сильным аргументом в пользу причинно-следственной связи. Врачи называют это эффектом «доза — ответ»: если вещество А вызывает биологический эффект В, то бóльшая доза А (как правило, хоть и не всегда) вызывает более сильный ответ В.
Тем не менее скептиков, таких как Фишер и Ерушалми, это не убедило. Исследования все-таки не способны были сравнить две во всем остальном идентичные группы, различающиеся только привычками по отношению к курению. На самом деле неясно, возможно ли такое исследование вообще. Группа курильщиков назначает себя сама. Курильщики могут генетически или «конституционально» отличаться от некурящих по ряду параметров — быть более склонными к риску, к злоупотреблению алкоголем. Некоторые из этих особенностей поведения способны оказывать негативное воздействие на здоровье, которое ошибочно приписывается курению. Для скептиков это был особенно удобный аргумент, потому что конституциональная гипотеза была практически непроверяемой. Только после секвенирования полного человеческого генома в 2000 году стало возможно пытаться найти гены, связанные с раком легких (по иронии судьбы Фишер оказался прав, хотя и в очень ограниченном смысле: такие гены существуют). Несмотря на это, в 1959 году Джером Корнфилд в соавторстве с Эйбом Лилиенфельдом опубликовал работу, пункт за пунктом опровергающую аргументы Фишера, которая в глазах многих врачей окончательно решила вопрос. Корнфилд, который работал в Национальном институте здоровья, был необычным участником спора о курении и раке. Далекий и от статистики, и от биологии по первому образованию, он специализировался на истории и изучил статистику в Департаменте сельского хозяйства США. Когда-то он выкуривал две с половиной пачки в день, но бросил курить, когда увидел данные по раку легких. (Интересно, насколько личным был спор о вреде курения для участвовавших в нем ученых. Фишер так никогда и не расстался со своей трубкой, а Ерушалми не отказался от сигарет.)
Корнфилд прямо нацелился на конституциональную гипотезу Фишера и выбрал для этого вотчину самого Фишера — математику. Предположим, спорил он, что имеется некий конфаундер, например ген курильщика, который полностью отвечает за риск возникновения рака у курильщиков. Если у курящих риск заболеть раком легких в девять раз выше, фактор-осложнитель должен по крайней мере в девять раз чаще встречаться именно у курильщиков, чтобы разницу в риске возможно было им объяснить. Подумаем, что это значит. Если ген курильщика есть у 11 % некурящих, тогда он должен быть у 99 % курильщиков. Если ген рака легких встречается хотя бы у 12 % некурящих, тогда становится математически невозможно, чтобы исключительно ген рака легких определял ассоциацию между заболеванием и курением. Для биологов этот аргумент, названный неравенством Корнфилда, превратил конституциональную гипотезу Фишера в дымящиеся руины. Нельзя было себе представить, чтобы генетическая изменчивость была так жестко привязана к такому сложному и непредсказуемому предмету, как выбор человека, курить ему или нет.