М. Ф.: Вы верите, что ИИ окажет позитивное влияние на человечество?
Г. М.: Я на это надеюсь. Наибольшую пользу он мог бы принести здравоохранению. Но современные исследования и внедрение ИИ в основном связаны с рекламой.
Мне кажется, что огромному положительному потенциалу, которым обладает ИИ, уделяется недостаточно внимания, несмотря на то что внедрение ИИ будет сопровождаться исчезновением рабочих мест и социальными потрясениями. Сейчас мне не нравится, как используется ИИ и как мы его внедряем.
Барбара Грош
“Я в восторге от того, что ИИ появился и начал менять наш мир, потому что не думала его застать, ведь преграды на пути к нему казались слишком сложными".
Профессор естественных наук в Школе инженерных и прикладных наук Гарварда, внештатный преподаватель Независимого института теоретических исследований в Санта-Фе
Благодаря Барбаре Грош сформировались основополагающие принципы обработки диалогов, необходимые для функционирования личных помощников, таких как Siri и Alexa. В 1993 г. она стала первой женщиной-президентом AAAI. Ее новаторские исследования в области обработки естественного языка и теории многоагентного взаимодействия внесли большой вклад в развитие ИИ. В настоящее время применяет разработанные модели для улучшения координации в сферах здравоохранения и образования.
Получила степень бакалавра математики в Корнеллском университете, а степень магистра и доктора computer science – в Калифорнийском университете в Беркли. Она является членом Национальной инженерной академии, Американского философского общества, Американской академии искусств и наук, а также AAAI и ACM. Обладательница премий ACM/AAAI Allen Newell Award, Award for Research Excellence от IJCAI и Lifetime Achievement Award от Ассоциации компьютерной лингвистики. Известна своим вкладом в развитие междисциплинарных учреждений и улучшение положения женщин в науке.
Мартин Форд: Как возник ваш интерес к ИИ?
Барбара Грош: Мой путь к ИИ – результат серии счастливых случайностей. В 18 лет я мечтала стать учителем математики. Потому что наш учитель в колледже верил в женщин-математиков и хвалил меня. Я поступила в колледж Корнеллского университета, где только что появился факультет computer science.
В то время в США получить степень бакалавра в области computer science было невозможно, но в Корнелле читали лекции по этой специальности. Я начала изучать методы численного анализа, затем поступила в магистратуру, а затем и в аспирантуру в Беркли.
Я работала в области, которая затем превратилась в computational science, а позже стала заниматься теоретической информатикой. Когда пришло время выбирать тему диссертации, Алан Кей предложил написать программу, которая будет читать детскую историю и пересказывать ее от лица одного из персонажей. Именно это вызвало у меня интерес к обработке естественного языка и привело в сферу ИИ.
М. Ф.: Алан Кей? Человек, который, работая в научно-исследовательском центре Xerox PARC, изобрел графический интерфейс пользователя? Именно его идеи Стив Джобс использовал при разработке компьютеров Macintosh.
Б. Г.: Да, верно, Алан был ключевым игроком в работе над Xerox PARC. На самом деле я работала с ним над созданием объектно-ориентированного языка программирования Smalltalk. Целью было создание системы, подходящей для обучения в детских садах и школах. Моя детская сказочная программа должна была быть написана на Smalltalk. Однако до того, как система Smalltalk была закончена, я поняла, что детские истории – это не просто истории, которые нужно читать и понимать. Они призваны прививать культуру, и задачу Алана мне будет очень тяжело выполнить.
В то время первая группа систем понимания речи также разрабатывалась в рамках проектов DARPA (Управления перспективных исследовательских проектов Министерства обороны США), и сотрудники SRI International, работающие над одной из них, сказали мне: “Если вы готовы рискнуть, работая над детскими историями, почему бы вам не поработать с нами над более предметным языком, направленным на диалог, но использующим речь, а не текст”. В результате я включилась в работу над системами, которые помогали людям в выполнении задач, и именно тогда начала проводить исследования в области искусственного интеллекта. Именно эта работа привела меня к открытию того, что диалог между людьми, работающими вместе над задачей, имеет структуру, которая зависит от структуры задачи, и что диалог – это гораздо больше, чем просто пары вопросов-ответов. Исходя из этого, я поняла, что как люди мы вообще никогда не говорим обособленными высказываниями, расставленными в нужной последовательности. Всегда существует структура, как, например, в журнальной или газетной статье, учебнике, и что мы можем смоделировать эту структуру. Это был мой первый крупный вклад в обработку естественного языка и искусственного интеллекта.
М. Ф.: Идея представить математически структуру диалога была прорывом в области естественного языка. Каким образом вы к ней пришли?
Б. Г.: Изначально перед нами стояла задача построить систему, умеющую вести естественный беглый диалог с человеком. Алана Кея тоже интересовало создание систем, которые будут адаптироваться к людям, а не наоборот.
В то время в лингвистике велись работы над синтаксисом и формальной семантикой, а в computer science – над алгоритмами синтаксического анализа. Уже была известна огромная роль контекста, но не было инструментов, математического описания и вычислительных конструкций для учета контекста в речевых системах.
Нам нужно было получить образцы реальных диалогов, которые ведут люди, совместно решающие некую задачу. Для этого двух человек, играющих роли эксперта и ученика, посадили в разные комнаты, чтобы исключить невербальную передачу информации, и попросили эксперта объяснить ученику, как выполнить некие действия. Проанализировав полученные диалоги, мы смогли понять их структуру и то, как она зависит от структуры задачи.
Позднее совместно с Кенди Сиднер мы написали статью Attention, Intentions, and the Structure of Discourse («Внимание, намерения и структура дискурса»), в которой рассказали, что диалоги имеют структуру, которая обусловлена самим языком, причинами вступления в диалог и целями каждого участника. Эта интенциональная структура представляет собой обобщение структуры задачи. Всеми этими аспектами управляет модель состояния внимания.
М. Ф.: Если сравнивать разработки «тогда» и «сейчас», что сильнее всего изменилось?
Б. Г.: Мы перешли от практически глухих речевых систем к системам, которые потрясающе обрабатывают речь. Улучшился анализ предложений и вычленение значений из них.
Но диалоговые системы, по сути, не работают. Они отлично справляются со всем, что попадает в рамки заданных сценариев, но реальные люди редко так разговаривают. Иногда ошибки, которые совершает система, создают серьезную этическую проблему.