Книга Думай «почему?». Причина и следствие как ключ к мышлению, страница 58. Автор книги Джудиа Перл, Дана Маккензи

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Думай «почему?». Причина и следствие как ключ к мышлению»

Cтраница 58

Родственник парадокса Симпсона десятилетиями мелькал в литературе по статистике, и его легко интерпретировать визуальными средствами. Фредерик Лорд изначально сформулировал этот парадокс в 1967 году. И снова он вымышленный, но вымышленные примеры (вроде мысленных парадоксов Эйнштейна) всегда обеспечивают хороший способ нащупать границы нашего понимания.

Лорд наблюдает за университетом, администрация которого хочет понять, как питание, предлагаемое студентам в столовых, влияет на их вес — в частности, оказывает ли оно разный эффект на юношей и девушек. С этой целью студенты сначала взвешиваются в сентябре, а потом в следующем июне. На рис. 45 результаты представлены на графике, где эллипсы снова отражают диаграммы рассеяния данных. Потом университет приглашает двух статистиков, они рассматривают полученные данные и приходят к противоположным выводам.

Первый статистик смотрит на распределение веса у девушек в целом, и отмечает, что их средний вес в июне остался таким же, как в сентябре. (Это показывает симметрия диаграммы рассеяния вдоль линии WF = WI, то есть, конечный вес = исходный вес). Естественно, отдельные девушки могут набирать или терять вес, но в целом прибавка равна нулю. То же справедливо и для юношей. Из этого статистик делает вывод, что рацион не влияет на два пола по-разному.


Думай «почему?». Причина и следствие как ключ к мышлению

Рис 45. Парадокс Лорда. (Эллипсы представляют диаграммы рассеяния). В целом, ни девушки, ни юноши не прибавляют в весе в течение года, но в каждой страте с одинаковым исходным весом юноши имеют тенденцию поправляться больше девушек.


Второй статистик, со своей стороны, утверждает, что, поскольку на конечный вес студентов сильно влияет исходный вес, необходимо стратифицировать их по исходному весу. Если сделать вертикальный срез, пройдя через оба эллипса, что позволит посмотреть только на юношей и девушек с определенным исходным весом (например, W0 на рис. 45), вы заметите, что вертикальная линия пересекает эллипс «Юноши», выше, чем эллипс «Девушки», хотя есть некоторое наложение. Это значит, что у юношей, которые начали с веса W0, конечный вес (WF) в среднем будет выше, чем у девушек которые начали с веса W0. Соответственно, пишет Лорд, «второй статистик приходит к выводу, как это обычно бывает в таких случаях, что юноши демонстрируют существенно большую прибавку, чем девушки, если соответствующим образом учесть разницу в исходном весе между полами».

Что же делать университетскому диетологу? Лорд пишет: «Выводы обоих статистиков с виду верны». То есть, не нужно заниматься подсчетами, чтобы увидеть: два веских аргумента ведут к двум разным выводам. Достаточно посмотреть на рисунок: на рис. 45 мы видим, что юноши в каждой страте (в любом вертикальном сечении) поправляются больше, чем девушки. В то же время, очевидно, что ни юноши, ни девушки в итоге не прибавили ничего. Как это возможно? Разве общая прибавка веса — не средний показатель для прибавки в каждой группе?

Теперь, когда мы прекрасно разбираемся в тонкостях парадокса Симпсона и принципа «верного дела», мы знаем, что не так с этим аргументом. Принцип «верного дела» работает только в случаях, когда относительная доля любой подгруппы (группы с одинаковым весом) остается неизменной. Да, в случае Лорда «воздействие» (пол) сильно влияет на процент студентов в каждой группе с одним весом.

То есть, мы не можем полагаться на принцип «верного дела», и это возвращает нас к началу. Кто же прав? Существует ли разница между средней прибавкой в весе между девушками и юношами, если соответствующим образом учесть разницу в исходном весе между полами? Вывод Лорда весьма пессимистичен: «Обычные исследование такого типа пытается ответить на вопрос, на который просто невозможно дать точный ответ на основе имеющихся данных». Пессимизм Лорда вышел за пределы статистики и привел к изобилию довольно пессимистичных работ по эпидемиологии и биостатистике о том, как сравнивать группы с разной исходной статистикой.

Сейчас я покажу вам, почему пессимизм Лорда не обоснован. На вопрос диетолога можно ответить точно, и, как обычно, надо начать с диаграммы причинности, как на рис. 46. На этой диаграмме мы видим, что Пол (S) становится причиной исходного веса (WI) и конечного веса (WF). Кроме того, WI влияет на WF независимо от гендера, потому что студент любого гендера, который весит больше в начале года, чаще весит больше и в конце года, что показано на диаграммах рассеяния на рис. 45. Все эти допущения о причинности основаны на здравом смысле; я не думаю, что Лорд не согласился бы с ними.

Интересующая Лорда переменная — прибавка в весе, которая показана на этой диаграмме как Y. Заметьте, что Y относится к WI и WF чисто математически, детерминированным образом: Y = WF — WI. Это значит, что корреляции между Y и WI (или Y и WF) равна –1 (или 1), и я показал эту информауию на диаграмме с коэффициентами –1 и +1.


Думай «почему?». Причина и следствие как ключ к мышлению

Рис 46. Диаграмма причинности для парадокса Лорда.


Первый статистик просто сравнивает разницу в прибавке веса между юношами и девушками. Между S и Y не нужно блокировать «черные ходы», а значит, наблюдаемые обобщенные данные дают ответ: эффекта нет, и таков вывод первого статистика.

В то же время, вопрос, на который пытается ответить второй статистик (то есть, «верно сформулированный запрос», описанный во Вступлении) трудно даже сформулировать. Он хочет убедиться, что «разница в исходном весе между полами соответствующим образом учтена» — такие формулировки обычно используют, если хотят сделать поправку по осложнителю. Но WI не выступает осложнителем для S и Y. На самом деле это переменная-медиатор, если считать Пол «воздействием». Таким образом, запрос, на который отвечают, вводя ограничение по WI, нельзя интерпретировать с точки зрения обычной причинности. Такое ограничение в лучшем случае позволит увидеть «прямой эффект» гендера на вес, что мы обсудим в Главе 9. Тем не менее, представляется маловероятным, что второй статистик имел это в виду; скорее всего, он действовал по привычке. И в то же время, этот аргумент позволяет очень легко попасть в ловушку: «Разве общая прибавка — не среднее между прибавками во всех группах»? Нет, если сами группы меняются в зависимости от воздействия! Не забывайте, что воздействием здесь служит Пол, а не Рацион, и Пол определенно меняет соотношение студентов в каждой страте WI.

Этот последний комментарий затрагивает еще одну любопытную деталь о парадоксе Лорда в его изначальной формулировке. Хотя изначальным намерением университетского диетолога было «определить эффект рациона» Лорд в своей изначальной статье нигде не говорит о контрольном рационе. Соответственно, мы ничего не можем сказать об эффекте от рациона. Говард Вайнер и Лиза Браун пытаются исправить этот недостаток в статье, вышедшей в 2006 году. Они меняют историю таким образом, что интересующем показателем является влияние рациона (а не пола) на прибавку в весе, в то время как разница между юношами и девушками не учитывается. В их варианте студенты едят в одной из двух столовых с разными рационами. Соответственно, два эллипса на рис. 45 представляют две столовые, в которых предлагают разное питание, что обозначено на рисунке 47 (a). Обратите внимание на то, что студенты, которые в начале весят больше, чаще предпочитают столовую B, в то время как те, кто весит меньше, едят в столовой A.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация