Если все это кажется вам нирваной спутанных связей, то ваши инстинкты точны.
Давайте рассмотрим конкретный пример.
Не забывайте, что весь смысл исследования состоял в том, чтобы проверить, действительно ли люди, которые едят больше ультраобработанных пищевых продуктов, чаще болеют раком. В результате выяснилось, что у «Химиков» риск развития опухоли был на 23 % выше, чем у «Энтузиастов киноа». Но если вы посмотрите на число случаев рака в обеих группах, то вы очень удивитесь. Среди «Химиков» было зарегистрировано 368 случаев злокачественных образований, а среди «Энтузиастов киноа»… 712. Как так вышло, что люди, которые ели в четыре раза больше ультраобработанных продуктов, в два раза реже болели раком??? Что за бред? Неужели ультраобработанная пища предотвращает онкологические заболевания?!?!
Нет.
Как оказалось, главной переменной, приводящей к таким результатам, является возраст. «Энтузиасты киноа» были в среднем на 10 лет старше «Химиков». Опять же, нет никакого способа физически развести эти различия: если вы выделяете большую группу людей на основе одной переменной, то другие показатели в любом случае будут отличаться. И некоторые из них, например возраст, могут оказать огромное влияние на результат, который вас интересует. В данном случае это риск развития рака.
Итак, на вопрос, с которого мы начали, можно ответить «да». Если вы проводите обсервационное исследование и математически разделяете людей на основании одной переменной, то также делаете это и на основании других факторов, и это наверняка приведет как минимум к одной спутанной связи.
Теоретически можно «подстроиться» под все эти переменные, то есть провести кучу математических расчетов и попытаться изолировать влияние интересующего вас показателя, например потребления ультраобработанных пищевых продуктов. Вот как авторы этого исследования получили из необработанных данных (среди «Химиков» было на 48 % меньше случаев онкологических заболеваний, чем среди «Энтузиастов киноа») финальный результат (среди «Химиков» было на 23 % больше случаев рака, чем среди «Энтузиастов киноа»). К сожалению, есть две проблемы: во-первых, чтобы подстроиться под переменные, необходимо их измерить, однако практически невозможно сделать это для каждого значимого фактора. Во-вторых, подстраиваться под переменные сложно, и вы никогда не будете уверены, что сделали все правильно. Это грозит разными ошибками: вы можете либо переоценить, либо недооценить настоящий риск.
Итак, выбоина № 6, спутанные связи, является камнем преткновения между подлинной и причинно-следственной связью. В данном конкретном случае корреляция между ультраобработанными продуктами и раком может быть подлинной, но не причинно-следственной. Она может быть вызвана переменной, которую исследователи не измерили (посещение церкви или личностные качества), или неудачной попыткой подстроиться под те, которые удалось определить (возраст или курение).
* * *
Последняя проблема, которую мы обсудим, выбоина № 7, является самой незаметной… если они такими бывают. Итак, давайте вернемся к кофе, потому что гораздо больше исследований было посвящено этому напитку, чем ультра-обработанным пищевым продуктам.
В 2017 году ученые опубликовали статью о масштабном метаанализе, посвященном кофе. Это действительно было исследование исследований. Иными словами, ученые сделали обзор, в котором анализировались результаты более ранних исследований кофе. По сути, это было начало в изучении этого напитка.
Короче говоря, авторы математически проанализировали результаты сотен исследований, в которых приняли участие миллионы людей.
Это большой объем информации.
Давайте посмотрим на то, что, по моему мнению, является самым важным в данных о кофе: у людей, выпивающих три чашки в день, риск умереть по любой причине примерно на 17 % ниже, чем у тех, которые вообще его не пьют. Три чашки были активной точкой, хотя у испытуемых, которым каким-то образом удается выпивать семь чашек в сутки, на 10 % более низкий риск смерти по любой причине, чем у тех, кто не употребляет этот напиток. В обоих случаях эти сравнения достигли статистического оргазма, также известного как «значимость», и Р-значения были очень низкими.
Давайте относиться к этой связи так, словно нам рассказала о ней Неопалимая купина: предположим, что употребление кофе действительно связано с более низким риском смерти. Но, конечно, факт связи напитка и снижения риска умереть вовсе не означает, что кофе уменьшает риск смерти.
Чтобы понять, почему это разные вещи и чем они отличаются, я попрошу вас извлечь из памяти один «аромат» – типично летний запах общественного бассейна. Если вы когда-либо проводили время в крытом общественном бассейне, то знаете, какой запах я имею в виду. Он резкий, пьянящий, с легкими нотками лизола
[130]. Это как если бы Джада де Лаурентис испекла лимонный пирог в морге больницы.
Чем обусловлен этот запах?
Давайте подумаем. Запах бассейна довольно необычный. Вы не чувствуете его, когда принимаете душ, кипятите воду, гуляете под дождем или купаетесь в озере. Вы ощущаете его только тогда, когда находитесь рядом с бассейном, причем он гораздо сильнее в крытых, чем у открытых. Вы знаете, что их дезинфицируют хлором. Вы также знаете, что озера, реки и дождевая вода не подвергаются такой обработке. Итак, давайте повторим то, что вам уже известно о хлоре и запахе бассейна.
Приведенная таблица по существу является результатом обсервационного исследования: подобно ученым, которые взяли у людей кучу анализов и заметили связь между употреблением кофе и снижением риска смерти, вы взяли пробы воды (носом) и заметили, что запах бассейна присутствует практически везде, где вода обработана хлором. Иными словами, между хлором и запахом бассейна есть связь, как между кофе и снижением риска смерти. Обратите внимание, что она неидеальна: водопроводная вода тоже дезинфицируется хлором, но у вас дома нет запаха бассейна. Тем не менее можно сказать, что между хлором и запахом бассейна есть крепкая связь.
Всякий раз, когда вы читаете о корреляции между двумя вещами, ваш разум совершает интуитивный прыжок. Это касается не только вашего мозга: разум большинства людей делает это так часто и так естественно, что это трудно заметить. Вы же берете данные из приведенной выше таблицы и беспрепятственно приходите к выводу, что одна из двух вещей вызывает другую. В конце концов, запахи обычно вызваны чем-то, а не вызывают что-то. Итак, разум незаметно делает вывод, что запах бассейна связан с хлором. Интуитивно это кажется правильным. Более того, вы привыкли думать, что так пахнет хлор.