Книга Думай «почему?». Причина и следствие как ключ к мышлению, страница 36. Автор книги Джудиа Перл, Дана Маккензи

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Думай «почему?». Причина и следствие как ключ к мышлению»

Cтраница 36

Теперь мы переходим ко второму, возможно, более важному эффекту байесовских сетей на причинный вывод. Открытые нами отношения между графической структурой диаграммы и данными, которые она представляет, теперь помогают нам моделировать шевеления, не делая этого физически. В частности, последовательно используя обусловливание, мы предскажем эффект действий или интервенций, не проводя собственно эксперимент. Чтобы это продемонстрировать, снова рассмотрим причинную вилку A ← B → C, для которой мы сочли корреляцию A и C ложной. Это реально подтвердить экспериментом, в котором мы шевелим A и не находим корреляции A и C. Но можно все сделать лучше. Для этого нужно попросить диаграмму эмулировать эксперимент и сказать нам, способно ли ограничение по определенному параметру воспроизвести корреляцию, которая будет преобладать в эксперименте. Ответ последует положительный: «Корреляция между А и С, измеренная после ограничения по В, окажется равной корреляции, которую мы увидим в эксперименте». Эту корреляцию можно оценить, использовав данные, и в приведенном случае она будет нулевой, что адекватно подтверждает наш интуитивный вывод: пошевелив А, мы не окажем никакого воздействия на C.

Эта способность эмулировать интервенции с помощью умных наблюдений не была бы достигнута, если бы не статистические свойства байесовских сетей, которые были обнаружены между 1980 и 1988 годами. Теперь мы решаем, какой набор переменных необходимо измерить, дабы предсказать эффект интервенций на базе наблюдений. Также мы в состоянии ответить на вопрос «Почему?». Например, кто-то спросит: почему воздействие на А заставляет С меняться? Действительно ли это прямой эффект А или это эффект медиации от переменной В? Если это и то и другое, можем ли мы оценить, какая доля этого эффекта обусловлена В?

Чтобы ответить на такие вопросы о медиации, надо предвидеть две одновременные интервенции: когда мы изменяем А и сохраняем В постоянным (чтобы отличить от обусловливания по В). Если нам удастся осуществить эту интервенцию физически, то мы получим ответ на наш вопрос. Но, будучи зависимыми от наблюдательных исследований, мы должны имитировать два эти действия с помощью ряда осознанных наблюдений. И вновь графическая структура диаграммы подскажет нам, возможно ли это.

Все это еще не было открыто в 1988 году, когда я начал размышлять, как объединить причинность с диаграммами. Я знал только, что байесовские сети в существовавшей тогда форме не могли ответить на вопросы, которые я задавал. Осознание того, что на основании одних лишь данных нельзя даже отличить A ← B → C от A → B → C, было источником боли и фрустрации.

Я знаю, что вам, читатель, уже не терпится узнать, как диаграммы причинности позволяют нам делать вычисления вроде тех, которые я только что описал. И мы туда доберемся — в главах с седьмой по девятую. Но пока мы не готовы, потому, начиная говорить о наблюдательных и экспериментальных исследованиях, мы тут же покидаем мирные воды — сферу искусственного интеллекта — и сразу погружаемся в бурные воды статистики, которые вспенились после несчастливого расставания с причинностью. В ретроспективе оказалось, что борьба за принятие байесовских сетей в сфере ИИ была приятной прогулкой — да нет, роскошным круизом! — по сравнению с боем за диаграммы причинности, который мне пришлось вынести потом. И эта битва идет до сих пор — еще остались островки сопротивления.

Чтобы ориентироваться в этих новых водах, нужно будет понять способы, которыми традиционные статистики научились справляться с причинно-следственные связями, и ограничения этих способов. Поднятые выше вопросы о результатах интервенции, включая прямые и косвенные эффекты, не рассматриваются в традиционной статистике прежде всего потому, что отцы-основатели этой науки очистили ее от языка причин и следствий. Но статистики тем не менее считают допустимым говорить о причинах и следствиях в ситуации рандомизированного контролируемого исследования, в котором препарат A случайным образом назначается одним людям, а не другим, а затем сравниваются наблюдаемые изменения в B. Здесь и традиционная статистика, и наука о причинном выводе воспринимают предложение «А вызывает В» в одном и том же смысле.

Прежде чем мы обратимся к новой науке причин и следствий, проиллюстрированной каузальными моделями, сначала надо попытаться понять сильные стороны и ограничения старой, слепой к моделям науке. Чтобы прийти к выводу «А является причиной В», необходима рандомизация, и РКИ важны для нейтрализации «осложнителей» — вмешивающихся факторов (причины этого и природу обозначенной угрозы мы рассмотрим в следующей главе). По моему опыту, для большинста статистиков, а также для современных специалистов по анализу данных это не самые удобные вопросы, потому что их нельзя сформулировать, используя ориентированный на данные словарь. Более того, они часто не соглашаются по поводу того, что такое осложнение.

Исследовав эти вопросы в свете диаграмм причинности, мы можем поместить РКИ в соответствующий контекст. Целесообразно или рассматривать их как особый случай причинного вывода, или считать причинный вывод сильным расширением РКИ. Любой подход из этих двух имеет право на существование, и не исключено, что люди, которых приучили видеть в РКИ способ определить причинность, найдут второй более подходящим.

Глава 4. Осложнители и наоборот: как убить прячущуюся переменную

Если бы наша концепция каузальных факторов хоть как-то была связана с рандомизированными исследованиями, последние были бы изобретены за пятьсот лет до Фишера.

Автор, 2016

Однажды у Асфеназа, придворного при царе Навуходоносоре, возникла большая проблема. В 597 году до н. э. вавилонский царь разорил Иудейское царство и привел с собой тысячи пленных, среди них и иерусалимскую знать. По обычаю своего царства, он возжелал, чтобы некоторые из них служили ему при дворе, и он приказал Асфеназу сыскать среди них «отроков, у которых нет никакого телесного недостатка, красивых видом и понятливых для всякой науки, и разумеющих науки и смышленых и годных служить в чертогах царских». Этим счастливцам предстояло изучить язык и культуру Вавилона и служить в администрации великой империи, раскинувшейся от Персидского залива до Средиземного моря. На время обучения царь назначил им пищу с царского стола и вино, которое сам пил.

Тут-то и возникла проблема. Один из любимцев вельможи, юноша по имени Даниил, отказался притрагиваться к пище. По религиозным мотивам он не мог есть мясо, приготовленное не по иудейским обычаям, и он попросил, чтобы ему и его товарищам взамен позволили питаться растительной пищей.

Асфеназ рад был бы удовлетворить его просьбу, но боялся, что это заметит царь: «… Если он увидит лица ваши худощавее, нежели у отроков, сверстников ваших, то вы сделаете голову мою виновною пред царем».

Даниил постарался убедить Асфеназа, что диета из воды и овощей не уменьшит их способность служить царю. Как и подобает «разумеющему науки и смышленому», он предложил эксперимент: «Сделай опыт над рабами твоими, — предложил он, — в течение десяти дней пусть дают нам в пищу овощи и воду для питья. И потом пусть явятся пред тобою лица наши и лица тех отроков, которые питаются царской пищею…» И сказал Даниил: «… Поступай с рабами твоими, как увидишь».

Вход
Поиск по сайту
Ищем:
Календарь
Навигация