История Watson
До появления Siri, Alexa и подобных программ самой знаменитой вопросно-ответной системой в сфере ИИ был разработанный IBM суперкомпьютер Watson. Возможно, вы помните, как в 2011 году Watson одержал сенсационную победу над двумя чемпионами телеигры Jeopardy!
[285]. Вскоре после победы Deep Blue над чемпионом мира по шахматам Гарри Каспаровым топ-менеджеры IBM решили начать работу над новым крупным проектом, который в отличие от Deep Blue мог привести к созданию действительно полезного продукта для клиентов. Вопросно-ответная система – частично вдохновленная компьютером из “Звездного пути” – была идеальным выбором. Как гласит легенда, один из вице-президентов IBM Чарльз Ликел ужинал в ресторане и вдруг заметил, что другие клиенты притихли. Все смотрели телевизор, где шла игра Jeopardy! с участием рекордсмена Кена Дженнингса. Это подарило Ликелу идею о создании компьютерной программы, которая сможет играть в Jeopardy! и побеждать чемпионов. Затем IBM могла бы представить программу на популярной телеигре
[286]. С этой идеи началась работа над многолетним проектом под руководством специалиста по обработке естественного языка Дэвида Ферруччи. В итоге появился компьютер Watson – система ИИ, названная в честь первого президента IBM Томаса Уотсона.
Невероятно популярная телеигра Jeopardy! впервые вышла на экраны в 1964 году. В игре три участника по очереди выбирают категории из списка (например, “История США” или “В кино”). Затем ведущий зачитывает вопрос из выбранной категории, и участники, знающие ответ, нажимают кнопки на игровых столах. Тот участник, который первым нажмет на кнопку, получает право озвучить свой ответ, сформулированный в форме вопроса. Например, звучит вопрос: “Этот фильм вышел на экраны в 2011 году и единственный получил и премию «Оскар», и французскую премию «Сезар» как лучший фильм года”. Верный ответ: “Что такое «Артист»?” Для победы в Jeopardy! необходимы обширные знания во множестве областей, от истории древнего мира до поп-культуры, быстрая реакция и способность понимать каламбуры, сленг и другие обиходные словечки, которые часто встречаются в вопросах и названиях категорий. Вот еще один пример: “В 2002 году Эминем подписал с этим рэпером контракт на семизначную сумму, значительно превышающую ту, что указана в его имени”. Верный ответ: “Кто такой 50 Cent?”
Получая вопрос из Jeopardy!, Watson генерировал ответ, комбинируя целый ряд методов ИИ. Так, Watson использовал несколько различных методов обработки естественного языка, чтобы проанализировать вопрос, выделить в нем ключевые слова и определить, ответ какого типа нужно дать (например, имя человека, название места, число, название фильма). Программа работала на специальных параллельных компьютерах, позволяющих быстро проводить поиск в огромных базах знаний. В статье The New York Times Magazine писали:
Команда Ферруччи загрузила в Watson миллионы документов, которые легли в основу его базы знаний. Среди них, по словам [Ферруччи], были “книги, справочники, всевозможные словари, тезаурусы, фолксономии, таксономии, энциклопедии – все справочные материалы, какие только можно достать… Романы, религиозные тексты, пьесы”
[287].
Для каждого вопроса программа генерировала множество возможных ответов и затем с помощью специальных алгоритмов определяла свою уверенность в каждом из них. Если уверенность в одном из ответов превышала пороговое значение, программа нажимала на кнопку, чтобы дать этот ответ.
К счастью для разработчиков Watson, поклонники Jeopardy! с давних пор вели полный архив категорий, вопросов и верных ответов из всех выпусков телеигры, выходивших на экраны. Этот архив стал для Watson даром судьбы – бесценным источником примеров для разных методов обучения с учителем, которые использовались при тренировке многих компонентов системы.
В феврале 2011 года Watson принял участие в матче из трех игр, который транслировался на весь мир. Его противниками стали бывшие чемпионы Jeopardy! Кен Дженнингс и Брэд Раттер. Мы смотрели эти игры всей семьей и не могли оторваться от экрана. К концу последней игры стало очевидно, что победа останется за Watson. Последний вопрос в последней игре звучал так: “Составленная Уильямом Уилкинсоном «Перепись княжеств Валахии и Молдавии» вдохновила этого писателя на создание своего самого знаменитого романа”. На последний вопрос Jeopardy! в письменной форме отвечают все три участника. Все они ответили верно: “Кто такой Брэм Стокер?” Кен Дженнингс, который славится своим остроумием, отметил неизбежную победу Watson, дописав: “Лично я приветствую наших новых компьютерных владык”
[288]. По иронии судьбы Watson не понял шутку. “Как ни удивительно, проигрыш дьявольскому суперкомпьютеру в викторине стал для меня удачным карьерным ходом, – отметил Дженнингс впоследствии. – Все хотели знать, что это было, а Watson не давал интервью, поэтому именно мне пришлось писать аналитические заметки и выступать на TED… Подобно Каспарову, я теперь неплохо зарабатываю на жизнь, превратив свой проигрыш в профессию”
[289].
Когда Watson участвовал в Jeopardy!, у зрителей, включая меня, сложилось впечатление, что он может без труда понимать и использовать язык, в мгновение ока анализируя хитрые вопросы в большинстве категорий и давая ответы на них.
Вопрос: Even a broken one of these on your wall is right twice a day.
Watson: What is a clock?
Вопрос: Они висят у вас на стене и даже в сломанном состоянии дважды в день оказываются правы.
Watson: Что такое часы?
Вопрос: To push one of these paper products is to stretch established limits.
Watson: What is an envelope?
Вопрос: Толкнуть один из этих бумажных продуктов – значит выйти за рамки.
Watson: Что такое конверт?
[290]