Книга Думай «почему?». Причина и следствие как ключ к мышлению, страница 65. Автор книги Джудиа Перл, Дана Маккензи

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Думай «почему?». Причина и следствие как ключ к мышлению»

Cтраница 65

Однако признаюсь, что я как раз ждал этого решения, затаив дыхание. Оно сообщает нам, что если мы не в состоянии найти способ оценить вероятность P (Y | do (X)) с помощью правил 1–3, то решения не существует. В этом случае мы знаем, что без рандомизированного контролируемого исследования не обойтись. Оно также говорит нам, какие дополнительные допущения или эксперименты нужны для того, чтобы каузальное воздействие стало возможно оценить.

Перед тем как объявить окончательную победу, нам нужно обсудить одну проблему с do-исчислением. Как и любые вычислительные методы, оно помогает нам выстроить доказательство, но не найти решение. С ним замечательно легко проверить истинность решения, но для поиска решений оно не так хорошо. Если вы знаете правильную последовательность преобразований, легко продемонстрировать другим (знакомым с правилами 1–3), что do-оператор можно сократить. Однако, если правильная последовательность вам неизвестна, не так-то легко обнаружить ее или даже определить, что она вообще существует. Используя аналогию с геометрическими доказательствами, нам надо решить, какие дополнительные построения потребуются нам на следующем шаге. Окружность с центром в точке А? Прямая, параллельная АВ? Число возможностей безгранично, а аксиомы сами по себе не дают намека, что делать дальше. Мой школьный учитель геометрии говорил, что нужно посмотреть на ситуацию через «математические очки».

В математической логике это называется проблемой принятия решений. Многие логические системы страдают от неустранимой проблемы принятия решений. Например, если у нас есть кучка костяшек домино различных размеров, у нас нет определенного способа решить, возможно ли сложить из них квадрат заданного размера. Но когда расклад уже заявлен, очень просто подтвердить, является ли он решением.

К счастью (опять) для do-исчисления, с проблемой принятия решений удалось справиться. Илья Шпицер, основываясь на более ранней работе другого моего студента по имени Цзинь Тянь, нашел алгоритм, который определяет, существует ли решение в «полиномиальном времени». Это до некоторой степени технический термин, но, продолжая нашу аналогию с поиском выхода из лабиринта, это означает, что у нас появляется намного более эффективный способ поиска выхода, чем случайное блуждание по всем доступным путям.

Алгоритм Шпицера для поиска всех каузальных воздействий не устраняет потребности в do-исчислении. На самом деле мы нуждаемся в нем даже больше, и по нескольким независимым причинам. В первую очередь, оно нужно нам для того, чтобы продвинуться дальше исследований, использующих только наблюдения. Допустим, что все складывается наихудшим образом и наша каузальная модель не допускает оценки каузального воздействия P (Y | do (X)) исключительно из данных, полученных в результате наблюдений. Предположим, что мы также не в состоянии провести рандомизированное контролируемое исследование со случайно назначаемыми X. Сообразительный исследователь спросит, удастся ли нам тогда оценить P (Y | do (X)), рандомизируя какую-либо другую переменную, скажем Z, которая лучше поддается контролю, чем X.

Например, если мы хотим узнать воздействие уровня холестерина (X) на сердечно-сосудистые заболевания (Y), мы можем манипулировать диетой испытуемых (Z) вместо того, чтобы пытаться прямо контролировать уровень холестерина у них в крови. Таким образом, мы задаемся вопросом, реально ли найти такую суррогатную переменную Z, которая позволит получить ответ на вопрос о причинах. На языке do-исчисления вопрос звучит так: возможно ли найти такое Z, чтобы преобразовать P (Y | do (X)) в выражение, в котором Z, а не X подвергается do-оператору. Это совершенно отдельная задача, не подпадающая под алгоритм Шпицера. К счастью, для нее тоже есть полный ответ — новый алгоритм, открытый Элиасом Баренбоймом в моей лаборатории в 2012 году.

Еще больше подобных задач возникает, когда мы рассматриваем проблемы транспортабельности или внешней валидности данных, выясняя, будет ли экспериментальный результат сохранять валидность в других условиях, отличающихся от изученных по нескольким ключевым параметрам. Этот более амбициозный набор вопросов бьет уже в самое сердце научной методологии, потому что наука не существует без обобщений. Однако вопрос обобщения не двигался с места по крайней мере два столетия. Инструментов для нахождения решения попросту не было.

В 2015 году Баренбойм и я представили в Национальную академию наук публикацию, в которой проблема решается в случае, если вы можете выразить свои допущения относительно двух сред с помощью каузальных диаграмм. В этих случаях правила do-исчисления обеспечивают систематический подход к определению того, насколько каузальные воздействия, определенные в опытных условиях, помогут нам оценить воздействия в интересующих нас целевых условиях.

Еще одна причина, по которой do-исчисление остается необходимым, — это прозрачность. Когда я писал эту главу, Баренбойм (ныне профессор в Университете Пердью) прислал мне новую головоломку — диаграмму, в которой всего четыре наблюдаемые переменные: X, Y, Z и W — и две ненаблюдаемые: U1 и U2 (рис. 45). Он предложил мне определить, возможно ли оценить воздействие X на Y в этом случае. Здесь невозможно заблокировать пути черного хода и не выполняются условия для парадного входа. Я испробовал все свои любимые подходы и ранее выручавшие меня интуитивные аргументы, как за, так и против, и все же я не мог понять, как это сделать. Я не мог найти выхода из лабиринта. Но как только Баренбойм шепнул мне: «Попробуй do-исчисление!», ответ немедленно засиял во всей непосредственной простоте. Каждый шаг стал ясен и наполнен смыслом. Теперь это самая простая из известных нам моделей, в котором каузальное воздействие приходится оценивать методом, выходящим за рамки поправок черного хода и парадного входа.

Чтобы не оставлять читателя под впечатлением, что do-исчисление хорошо только для теории и для решения головоломок на досуге, я закончу эту секцию практической задачей, которую поставили недавно два ведущих статистика Нэнни Вермут и Дэвид Кокс. Она показывает, как дружеская подсказка «Попробуй do-исчисление» может помочь экспертам в области статистики решать сложнейшие практические задачи.

Приблизительно в 2005 году Вермут и Кокс заинтересовались так называемой проблемой последовательных решений, или курса лечения, меняющегося во времени, с которой часто приходится сталкиваться, например, при лечении СПИДа. В этом случае типично, что лечение проводится продолжительное время, и в каждый период времени врачи изменяют силу и дозировку медикаментозных средств в последующих назначениях, исходя из состояния здоровья пациента. В свою очередь, на состояние здоровья пациента влияет лечение, назначенное ему в прошлом.


Думай «почему?». Причина и следствие как ключ к мышлению

Рис. 45. Новая «задача на салфетке»?

Вход
Поиск по сайту
Ищем:
Календарь
Навигация