Таковы строительные блоки искусственного интеллекта, и в течение многих лет Microsoft вкладывалась в развитие всех этих уровней: в инструменты статистического машинного обучения для осмысления данных и распознавания образов; в компьютеры, которые умеют видеть, слышать, двигаться и даже немного учить и понимать человеческий язык.
Под руководством нашего главного эксперта по речевым технологиям Сюэдонга Хуанга и его команды Microsoft установила рекорд точности: наша компьютерная система выполнила расшифровку телефонного разговора лучше опытного профессионала-расшифровщика. Что касается машинного зрения и обучения, то в конце 2015 года наша команда по разработке искусственного интеллекта получила первый приз по выполнению пяти задач, хотя мы обучали нашу систему только одной из них. По направлению «Общие объекты в контексте» система искусственного интеллекта пытается решить несколько задач по визуальному распознаванию. Мы обучили систему решать первую из них – просто смотреть на фото и давать обозначение увиденному. Но на основе самых ранних версий технологии взаимопроникающего обучения
[59] построенная нами нейронная сеть сумела обучиться и затем выполнить другие задачи самостоятельно. Теперь она не только могла объяснить, что изображено на фото, но и обводила кружком каждый отчетливо изображенный на нем объект и выдавала предложение на английском языке, которое описывало увиденное на фото действие.
Я уверен, что через десять лет искусственный интеллект будет распознавать речь и образы лучше человека. Но то, что машина умеет видеть и слышать, еще не значит, что она по-настоящему умеет учиться и понимать. Следующий рубеж – это восприятие естественного языка, взаимодействие между компьютерами и людьми.
Так как же искусственный интеллект сумеет оправдать созданную вокруг него шумиху? Как он дорастет до такого уровня, когда сможет быть полезным каждому? Ответ, как и вопрос, состоит из нескольких уровней.
Штучный продукт. Сегодня мы только-только вступили на первый этаж огромного здания под названием «Искусственный интеллект». Он делается на заказ, под клиента. IT-компании с их привилегированным доступом к данным, компьютерным мощностям и алгоритмам вручную создают продукты на основе ИИ и выпускают их в мир. Мало кто умеет производить искусственный интеллект для многих – вот на какой ступеньке он стоит сегодня.
Демократизация. Демократизация – это следующий уровень. Мы как платформенная компания всегда производили фундаментальные технологии и инструменты, при помощи которых другие создавали инновационные продукты. Поэтому наш подход состоит в том, чтобы передать инструменты для создания искусственного интеллекта всем желающим. Демократизация ИИ означает, что каждый человек и каждая организация должны иметь возможность давать волю воображению и создавать потрясающие решения в сфере искусственного интеллекта, чтобы удовлетворять собственные специфические нужды. Это аналог той демократизации, которую сотворили наборный шрифт и печатный пресс. К середине XV века во всей Европе, по разным оценкам, имелось около 30 тысяч книг, и каждая из них была создана вручную монастырскими писцами. Библия Гутенберга стала первой книгой, напечатанной при помощи наборного шрифта. Уже через 50 лет количество книг выросло примерно до 12 миллионов, и это стало предпосылкой для эпохи Ренессанса в образовании, науке и искусстве.
Тем же путем должен следовать искусственный интеллект. А для этого нужно быть демократичными и открытыми для всех. Поэтому наше видение заключается в том, чтобы создавать инструменты, которые наполняют искусственным разумом виртуальных помощников, приложения, сервисы и инфраструктуру.
• Мы используем искусственный интеллект, чтобы фундаментальным образом изменить природу взаимодействия людей с виртуальными помощниками, такими как Cortana. Это должно стать частью повседневной жизни.
• Приложения, такие как Office 365 и Dynamics 365, будут иметь встроенный искусственный интеллект. Благодаря этому они помогут нам концентрироваться на самых важных вещах и выжимать по максимуму из каждого момента жизни.
• Мы наделим наши сервисы базовыми «умными» функциями – распознаванием образов, восприятием и когнитивными способностями, – которые станут доступны каждому разработчику приложений на планете.
• И наконец, мы уже строим самый мощный в мире суперкомпьютер с искусственным интеллектом и делаем эту инфраструктуру доступной для всех.
Перечисленные инструменты искусственного интеллекта используются в самых разных областях. McDonald’s создает систему на основе ИИ, которая будет помогать сотрудникам принимать заказы в окошках «Мак-Авто» и делать этот процесс более точным, простым и эффективным. Uber при помощи наших когнитивных сервисных средств предотвращает случаи мошенничества и повышает безопасность пассажиров, проверяя фото водителя, чтобы убедиться, что за рулем – именно ваш таксист. Volvo применяет наши средства ИИ, чтобы распознавать случаи, когда водители отвлекаются, и предупреждать их об опасности, снижая таким образом риск аварии.
Если вы владеете или управляете бизнесом, представьте, что у вас есть система ИИ, способная в буквальном смысле видеть весь цикл операций, осмыслять, что происходит, и уведомлять вас о том, что именно требует повышенного внимания. Prism Skylabs на основе наших когнитивных сервисов внедрила инновацию: теперь компьютеры контролируют камеры видеонаблюдения и анализируют происходящее. Если вы владелец строительной компании, система уведомит вас о том, что она заметила, как на одну из площадок прибывает цистерна с цементом. В розничных сетях система может вести учет складских запасов или находить нужного менеджера в магазине. Когда-нибудь в больнице искусственный интеллект будет наблюдать за действиями хирурга и его ассистентов, чтобы заблаговременно предупредить о возможности врачебной ошибки, пока еще не поздно.
Научить учиться. Высший уровень технологии – это когда компьютеры учатся обучаться и самостоятельно писать программы. Подобно людям, компьютеры развиваются и уже не просто подражают своим создателям, но изобретают новые, лучшие решения проблем. Глубинные нейронные сети и взаимопроникающее обучение предопределяют сегодняшние технологические прорывы; но искусственный интеллект подобен лестнице, и мы стоим лишь на первой ее ступеньке. А на самой вершине нас ждут сильный искусственный интеллект и полное понимание человеческого языка машинами. Этот момент наступит, когда компьютер обретет разум, равный человеческому или неотличимый от него.
Один из наших ведущих исследователей искусственного интеллекта решил в качестве эксперимента продемонстрировать, как компьютер умеет самообучаться. Эрик Хорвиц, авторитетный специалист в области вычислительных систем и доктор медицины, руководит нашей исследовательской лабораторией в Редмонде. Его уже давно занимают машины, способные к восприятию, обучению и мышлению.
Эксперимент заключался в том, чтобы помочь посетителям легко находить Хорвица и при этом освободить его ассистента для более важных дел, чем без конца провожать визитеров. Чтобы попасть в офис ученого, вы заходите в холл на первом этаже, где камера и компьютер немедленно вас замечают, рассчитывают направление, маршрут и расстояние, а потом прогнозируют время так, что вас уже поджидает лифт. Когда вы входите в него, робот приветствует вас и спрашивает, не нужно ли помочь отыскать кабинет Эрика в лабиринте коридоров и офисов. Виртуальный ассистент, уже осведомленный о вашем приходе, знает, что Эрик как раз заканчивает говорить по телефону, и спрашивает, не хотите ли вы присесть и подождать, пока он освободится.