Как мы видели в предыдущей главе (где познакомились с медианой, обсуждая способы предотвратить ложные срабатывания сигнала тревоги), распределение доходов домохозяйств – это еще один статистический показатель, медианное значение которого сильно отличается от среднестатистического. Распределение доходов домохозяйств в Великобритании, показанное на рис. 4, также асимметрично; та кривая очень напоминает изломанную и зеркально отображенную версию кривой на рис. 11. Большинство домохозяйств Великобритании имеют низкий располагаемый доход, но есть небольшое, но статистически значимое число богатых, которое искажает симметрию распределения. В 2014 году недельные доходы двух третей британцев были ниже «среднего» уровня.
Поначалу еще более удивительным примером кажется старая загадка: «Каков шанс на то, что у следующего человека, которого вы встретите на улице, ног будет больше, чем в среднем у людей?» Ответ: «Почти наверняка». Соль в том, что одноногих или вовсе безногих калек очень немного, но они и обеспечивают некоторое снижение среднего количества ног в пересчете на все население. Так что каждый, у кого две ноги, имеет больше ног, чем все население в среднем. Этот пример показывает, насколько смехотворны попытки оценивать индивидуальные качества, исходя из усредненных показателей по всей популяции.
Очевидно, что использование некорректного усреднения для описания популяции может привести к экологическим ошибкам. Еще один тип экологической ошибки, известный как парадокс Симпсона, возникает, когда мы пытаемся взять среднее значение из двух и более разнородных групп данных. Парадокс Симпсона проявляется в самых разных областях – от оценки состояния экономики
[94] до интерпретации социально-демографических электоральных профилей
[95] и, что, возможно, наиболее важно, в разработке лекарств
[96]. Представьте себе, например, что мы отвечаем за контролируемое испытание нового препарата для снижения давления «Фантастикол». На исследование записалось 2000 добровольцев обоих полов, причем количество мужчин и женщин получилось равным. В целях контроля мы разделили их на две группы по 1000 человек. Пациенты в группе А получат «Фантастикол», а пациенты в группе Б – плацебо. В конце исследования выяснилось, что у 56 % (560 из 1000) человек, получавших препарат, артериальное давление снизилось, а в группе получавших плацебо этот эффект наблюдался только у 35 % (350 из 1000) добровольцев (см. таблицу 5). Похоже, что «Фантастикол» действительно работает.
Табл. 5. «Фантастикол», похоже, оказывает в целом более существенный благоприятный эффект, чем плацебо
Для правильной адресации препарата важно знать особенности его воздействия с учетом половой принадлежности пациента. Следовательно, нам нужно понять, как наш препарат действует на мужчин и женщин по отдельности, поэтому мы перераспределяем наши статистические данные соответственно. Эта более подробная разбивка приведена в табл. 6. Анализ результатов оказывается несколько неожиданным. У мужчин из группы Б, принимавших плацебо, артериальное давление понизилось у 25 % (200 из 800 в группе Б), а вот у мужчин из группы А, принимавших «Фантастикол», такой же благотворный эффект наблюдался лишь в 20 % случаев (40 из 200). Среди женщин очевидна та же тенденция: в группе Б давление понизилось в 75 % случаях (150 из 200), а в группе А – только в 65 % случаев (520 из 800). Для обоих полов доля тех, на ком плацебо сказался благотворнее, чем «Фантастикол», оказывается выше. В этом свете новый препарат уже кажется менее эффективным, чем плацебо. Как может быть, что при разбиении данных на группы и их стратификации исследование рассказывает одну историю, а при объединении групп – противоположную, и какая из этих историй правдива?
Табл. 6. При распределении испытуемых по половой принадлежности выясняется, что вне зависимости от пола эффект от приема плацебо выше, чем от приема «Фантастикола»
Отвечает за эту путаницу так называемая смешанная переменная, она же – искажающий фактор. В нашем случае такой переменной величиной является пол. Оказывается, что пол очень важен для результата. В ходе исследования давление у женщин улучшалось по естественным причинам чаще, чем у мужчин. Поскольку разделение по половому признаку в группах было разным (800 женщин и 200 мужчин в группе А и 200 женщин и 800 мужчин в группе Б), на общий результат группы А значительное положительное влияние оказало естественное улучшение давления у женщин, в результате чего «Фантастикол» показался более эффективным, чем плацебо. Несмотря на то что в исследовании принимало участие равное количество мужчин и женщин, неравномерность их распределения по группам привела к тому, что первоначальный высокий результат применения «Фантастикола» в 56 %, взятый по среднему значению в группе А и отраженный в таб. 5, при сопоставлении с результатом его применения с учетом пола (20 % улучшений для мужчин и 65 % для женщин) не подтвердился. Нельзя просто брать и выводить среднеарифметическое из разнородных средних значений
[97].
Табл. 7. При равномерном распределении мужчин и женщин по группам пропорции благотворного воздействия различных препаратов на мужчин и женщин остаются теми же, что и в табл. 6
Выведение среднеарифметического из средних значений допустимо только в том случае, если мы уверены, что учли все возможное влияние смешанных переменных. Знай мы заранее, что пол является одной из таких переменных, то мы понимали бы, что результаты необходимо разделять по половой принадлежности, чтобы получить истинную картину эффективности «Фантастикола». Мы могли пойти и другим путем – собрав в группах равное количество мужчин и женщин, как показано в табл. 7. Показатели улучшения для мужчин и женщин, принимающих «Фантастикол» или плацебо, остаются такими же, как и в табл. 6. Однако, когда результаты объединены в табл. 8 и мы смотрим на показатели улучшения для «Фантастикола» (42,5 % улучшения), становится ясно, что препарат не лучше, а хуже, чем плацебо (50 % улучшения). Конечно, в нашем случае на результат могут влиять и другие смешанные переменные, которые мы не учли, – возраст, например, или иные социально-демографические факторы.