Осенью 2011 года компания Apple представила смартфон iPhone 4S с функцией Siri, своеобразного персонального ассистента, интерфейс которого был основан на обычной человеческой речи. Иными словами, люди говорили со своим смартфоном точно так же, как могли бы разговаривать с другим человеком. Программа, лежащая в основе Siri, была разработана в калифорнийском исследовательском институте SRI International, а затем куплена Apple в 2010 году. Она слушала все, что говорят пользователи iPhone своему гаджету, пыталась понять, чего они хотят, затем предпринимала определенное действие и отвечала пользователям синтезированным голосом.
Примерно через восемь месяцев после появления Siri на рынке Кайл Вагнер, один из авторов технологического блога Gizmodo, перечислил некоторые из ее самых полезных возможностей:
Вы можете узнать счет текущих спортивных соревнований – «Сколько очков сейчас у команды „Джайентс“?» – или получить статистику по индивидуальным игрокам. Вы также можете заказать столик в ресторане через программу OpenTable, найти поставщиков тех или иных услуг в своем округе с помощью системы Yelp, узнать о том, какие фильмы идут в кинотеатре по соседству, а затем посмотреть интересующий вас трейлер. Если вы заняты и не можете принять звонок, то вы можете попросить Siri напомнить вам о том, чтобы перезвонить звонящему попозже. Голосовые команды могут оказаться невероятно полезными для решения подобных повседневных задач.
[26]
Однако его сообщение в блоге Gizmodo завершалось предостережением: «Все это звучит довольно круто. Однако в случае Siri нужно помнить одно важное слово – „если“ это работает как надо».
[27] После выпуска этой программы многие пользователи обнаружили, что этот вроде бы разумный личный ассистент работал недостаточно хорошо. Он не понимал, что они говорят, постоянно просил уточнений, давал странные или неточные ответы или отделывался фразами вроде: «Прошу прощения, но прямо сейчас я не могу обрабатывать новые запросы. Попробуйте связаться со мной чуть позже». Аналитик Джин Мюнстер смог составить целый список вопросов, с ответами на которые у Siri возникали проблемы:
• На вопрос «Где Элвис похоронен? (Where is Elvis buried?)» программа отвечала: «Я не могу ответить на этот вопрос», поскольку посчитала, что речь идет о человеке с именем Элвис Похоронен (Elvis Buried).
• «Когда вышел фильм „Белоснежка“?» Вместо ответа программа предложила осуществить поиск кинотеатров через Yelp.
• «Когда в следующий раз комета Галлея? (When is the next Halley’s Comet?)» Программа ответила: «У вас нет встреч с человеком по имени Галлей» (You have no meetings matching Halley’s).
• «Я хочу отправиться на озеро Супериор (Lake Superior)». Программа выдала инструкции по проезду к офису компании Lake Superior X-ray.
[28]
О странных и неудовлетворительных ответах Siri стало известно довольно быстро, однако сила технологий все же неоспорима. Технологии приходят вам на помощь именно тогда, когда нужно. Мы убедились в этом на своем собственном примере во время поездки на беспилотном автомобиле Google. После встречи в Сан-Франциско мы сели в арендованный автомобиль, чтобы доехать до штаб-квартиры Google в городе Маунтин-Вью. У нас был с собой портативный GPS-навигатор, однако мы его не включили, поскольку посчитали, что и так знаем, как добраться до следующей точки путешествия.
На самом деле мы, конечно, не знали. Столкнувшись с эшеровским лабиринтом шоссе, съездов и улиц, мы начали плутать, раздражаясь все больше и больше от неспособности найти нужную дорогу. В тот момент, когда наша встреча в Google, весь проект по созданию этой книги и наши профессиональные отношения были уже на грани краха, Эрик достал свой телефон и попросил Siri показать, как добраться до шоссе 101 в направлении на юг. Телефон ответил моментально и безошибочно: экран превратился в карту, на которой были показаны наше местоположение и стрелки, направлявшие на нужную нам развилку.
Конечно, мы могли бы включить наш портативный GPS-навигатор и подождать, пока он создаст план нашего маршрута, но нам не хотелось обмениваться информацией таким образом. Мы хотели задать вопрос, а затем услышать и увидеть ответ (в форме карты). Siri смогла пообщаться с нами именно на том языке, на котором мы хотели. Созданный в 2004 году обзор всех исследований в области автоматического распознавания речи (важнейшей части обработки естественного языка) за последнюю половину столетия начинался с признания о том, что «распознавание машинами речи на том же уровне, на котором это делают люди, представляется нам труднодостижимой целью», однако менее чем через 10 лет все основные элементы этой цели уже были достигнуты. Apple и другие компании сделали технологию обработки естественного языка доступной для сотен миллионов людей через их мобильные телефоны.
[29] По замечанию Тома Митчелла, возглавляющего кафедру машинного обучения в университете Карнеги – Меллон, «мы находимся в начале десятилетнего периода, в течение которого перейдем от компьютеров, которые неспособны понимать наш язык, к компьютерам, которые понимают его почти на том же уровне, что и мы».
[30]
Цифровая беглость: за дело берется Вавилонская рыбка
Программы по обработке естественного языка еще далеки от совершенства, а компьютеры не так хороши в сложной коммуникации, как люди, однако дело стабильно идет на лад. А в таких областях, как перевод с одного языка на другой, уже были достигнуты серьезные достижения: хотя коммуникационные способности компьютеров не настолько глубоки, как у обычного человека, они намного шире.
Человек, говорящий более чем на одном языке, обычно способен перевести фразу с одного на другой с достаточно высокой точностью. С другой стороны, автоматические сервисы, хотя и производят некоторое впечатление, редко делают свою работу без ошибок. Даже если вы плохо владеете французским языком, то не исключено, что вы можете лучше справиться с переводом фразы Monty Python’s „Dirty Hungarian Phrasebook“ sketch is one of their funniest ones (Скетч „Монти Пайтон“ под названием „Сборник венгерских ругательств“ – один из самых смешных), чем Google Translate. Программа предложила вариант Sketch des Monty Python ‘Phrasebook sale hongrois’ est l’un desplus drôles les leurs. Хотя эта фраза и передает общий смысл, в ней имеются серьезные проблемы с грамматикой.