Почему это так важно? Помните тот революционный эксперимент по первичной профилактике сердечно-сосудистых заболеваний 1970-х гг., который показал, что снижение уровня холестерина может уменьшить риск развития сердечно-сосудистых заболеваний?
[205] Так вот, его Р-значение еле-еле втиснулось под эту планку в 0,05. Кроме того, исследователи применили еще одну статистическую уловку: они провели односторонний t-тест вместо принятого двустороннего теста, тем самым уменьшив число степеней свободы и сократив Р-значение до минимально возможного. При этом оно все равно оказалось так близко к 0,05, что авторы эксперимента даже не стали указывать его в результатах – просто написали, что оно меньше, чем 0,05.
Если бы Р-значение в том исследовании оказалось 0,05 и больше, это бы отбросило кардиологию назад почти на десять лет. Сейчас мы знаем, что связь между уровнем холестерина ЛПНП и сердечно-сосудистыми заболеваниями абсолютно достоверна – это показали десятки исследований и множество собранных с тех пор данных, но, чтобы снизить для них Р-значение так, чтобы их признали значимыми, потребовались некоторые статистические ухищрения.
Однако Р-значение постепенно обрело в сфере медицинских исследований такой колоссальный вес, что в последние несколько десятилетий мы наблюдаем просто-таки эпидемию статистической значимости. И эта тенденция ведет к переоценке результатов кардиологических исследований чаще, чем какие-либо мошеннические или недобросовестные действия.
Именно из-за Р-значения многие ученые решили, а многие миллионы других людей поверили, что статины вызывают деменцию. Из-за него же многие подумали, будто статины снижают риск развития рака. Последующие опыты показали, что статины не делают ни того, ни другого – авторы тех нашумевших исследований позволили себе прийти к таким выводам по одной-единственной причине: когда они проводили свои наблюдения, Р-значение для упомянутых соотношений оказалось меньше, чем 0,05. Но результаты исследования хороши лишь настолько, насколько хорошо проведено это самое исследование. И ученые, университеты, журналы и журналисты, которые поднимают шумиху вокруг пустых новостей, – вот виновники тех неоднозначных сообщений, которые поступают сейчас от научного сообщества и, в частности, дезинформируют людей, сообщая нелепые сенсации о сердечно-сосудистых заболеваниях
[206].
Никто не любит Р-значение так, как редакторы журналов, а любят они его потому, что его любят читатели. И авторам, в том числе и мне, приходится соответствовать. Если вы, как исследователь, не снабдите свой текст Р-значениями, редактор, скорее всего, попросит вас их указать. А если ваше исследование не дало особых статистически значимых различий, оно, скорее всего, вообще никогда не увидит свет, потому что вам будет трудно найти журнал, который согласится его опубликовать. Каждый раз, когда я пишу статью и анализирую свои результаты, я тайно молюсь, чтобы там были нужные Р-значения, поскольку знаю, что зачастую именно они решают, напечатают ли статью или она полетит в мусорную корзину. Р-значение, в сущности, стало мерилом истинности в науке. Однако это огромное заблуждение.
Р-значение не раз заводило нас в тупик – в первую очередь потому, что за счет него можно попытаться «срезать» дорогу к общественному признанию ваших результатов. Но, честно говоря, я скорее поверю результатам рандомизированного контролируемого клинического исследования с Р-значением 0,06, чем результатам обсервационного исследования с Р-значением <0,0001. Если вы стремитесь отыскать истину и не приемлете случайности, Р-значение может послужить вам лишь маленькой деталькой пазла, который вы пытаетесь сложить, – однако большинство воспринимают его совершенно иначе, и актуальные перемены в медицине и информационных технологиях грозят только усугубить это помешательство на Р-значениях.
У нас никогда не было столько данных обо всех аспектах нашей жизни, как сейчас. Более того, бесконечное множество цифр привело к возникновению так называемого синдрома обилия данных, но нехватки информации (DRIP – Data Rich, Information Poor). Я сам помогал проводить исследования, в которых участвовали порой сотни тысяч пациентов. Практически все отношения между двумя разными группами пациентов из этих баз данных могут оказаться статистически значимыми, но абсолютно бесполезными в реальной жизни. Почему? С такими огромными объемами данных, какими мы располагаем в наши дни, даже у самых маленьких различий может быть очень низкое Р-значение – несмотря на то, что реальная разница между двумя результатами крошечна и бессмысленна.
В последнее время дошло до того, что ряд ведущих статистиков мира порекомендовали снизить планку значимости с 0,05 до 0,005, тем самым в десять раз сократив для результатов шансы быть признанными «значимыми»
[207]. Но, придавая еще больший вес Р-значению, мы не решаем его основную проблему: оно никак не объясняет нам, почему два разных пераметра связаны друг с другом и связаны ли они вообще.
Как и все прочее в нашей жизни, медицинская наука – это крысиные бега. А в кардиологии крысы еще более шустрые. Это самое привлекательное из всех медицинских направлений, которые специализируются на внутренних болезнях, и потому здесь за небездонный горшочек научных грантов борется множество невероятно талантливых людей. Чтобы получать гранты, нужно публиковать результаты своих исследований, а больше всего шансов на публикацию у тех исследований, которые будут сверкать и поигрывать своими Р-значениями, как профессиональный рестлер – намасленными мускулами. И если вы умная крыса, у которой есть шанс найти выход из этого лабиринта (чтобы попасть в другой лабиринт), вы сделаете все возможное, чтобы подчеркнуть статистическую значимость своего исследования. А поскольку многих ученых, особенно на ранних этапах их карьеры, поощряют за количество, а не за качество публикаций, то можно догадаться, почему медицинская литература полнится ложными данными.
Р-значения и культура массового производства научных исследований потрясли самые основы науки. Многие из громких исследований прошлого – особенно в области лабораторных и психологических исследований – не удается воспроизвести, сколько бы другие ученые ни пытались это сделать
[208]. Даже если некоторые эксперименты удается повторить, полученный эффект оказывается менее впечатляющим, чем заявлялось изначально
[209]. В кардиологии так случилось с использованием медикаментов для снижения риска поражения почек после катетеризации сердца, а также с исследованиями, которые показали, будто установка крошечного баллона в узкое место в коронарной артерии помогает пациентам со стабильной стенокардией больше, чем лекарства.