Книга Сердце машины. Наше будущее в эру эмоционального искусственного интеллекта, страница 20. Автор книги Ричард Йонк

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Сердце машины. Наше будущее в эру эмоционального искусственного интеллекта»

Cтраница 20

Прошедшие пятьдесят лет эпохи цифровых технологий предоставили такую возможность. Компьютеры, искусственный интеллект, интернет и технология Web Х.О прошли практически через закономерность взлетов и падений на стадии разработки и инвестирования. Все они дали начало инфраструктуре, необходимой для появления новой эмоциональной экономики. У компаний появляется возможность использовать и распространять давшиеся им с огромным трудом технологии самыми различными способами. Прикладные программные интерфейсы (API) и пакеты средств разработки программного обеспечения (SDK) предоставляют компаниям, отдельным людям и даже конкурентам средства, позволяющие объединить новые технологии с собственными процессами. В то же время программное обеспечение как услуга (SaaS) доступно всем, от владельцев лицензий и подписчиков до поддерживаемых за счет рекламы интернет-сайтов и приложений. Благодаря всему этому (и многому другому) создаются новые функции и предложения, удовлетворяющие потребности рынка. Затем развивается новая инфраструктура и создаются инновации, которые были невозможны, пока не появилась поддерживающая их технология.

Мировой рынок продуктов эмоционального программирования будет стремительно расти с 9,3 миллиарда долларов в 2015 году до 42,5 миллиарда долларов в 2020 году.

Интересно, что подобная конъюнктура рынка создает спрос на еще большее количество продуктов и услуг там, где прежде спроса не было. Эта полоса везения продолжается некоторое время для каждого поколения новой технологии. Насколько масштабным и быстрым будет рост? Согласно отчету об исследовании рынка 2015 года, мировой рынок продуктов эмоционального программирования будет стремительно расти с 9,3 миллиарда долларов в 2015 году до 42,5 миллиарда долларов в 2020 году. Доля США на рынке составит 22,65 миллиарда. Не так уж и скромно для рынка, которого еще десять лет назад просто не существовало.2

Компания AfFectiva, которую Пикард и эль Калиуби основали в апреле 2009 года, стала первой компанией, применившей технологии эмоционального программирования в коммерческих целях. Первоначально они планировали сосредоточиться на создании ряда продуктов, основанных на эмоциональном программировании. В частности, на вспомогательных технологиях для людей, испытывающих трудности с восприятием и переживанием эмоций, страдающих расстройствами аутического спектра. В течение года они подписали соглашение с первым сторонним инвестором – Благотворительным фондом Петера Сагера Валленберга – на сумму в 2 миллиона долларов. Последующие инвестиции принесли им еще 18 миллионов. Отношения и связи, оставшиеся со времени работы в Междисциплинарной исследовательской лаборатории, означали, что AfFectiva стартовала с уже имеющейся клиентской базой. Среди их первых продуктов были AfFdex, технология по оценке и анализу эмоций на основе FaceSense, и Q Sensor, усовершенствованная версия браслета iCalm.

Когда компания начала работу, у них был список из двадцати четырех крупных компаний, в основном входивших в рейтинг Fortune Global 500, которым нужна была их технология. Пикард отмечает: «К сожалению, все они хотели воспользоваться технологией в своих целях. Нельзя начинать работу с двадцатью четырьмя разными продуктами. Одно дело – заставить алгоритмы работать, и совсем другое – создать специальный продукт и интерфейс для совершенно разных людей, когда ты только начинаешь собственный бизнес. Так что потребовалось много времени, чтобы решить, каким именно из двадцати четырех продуктов заняться. Угодить всем просто невозможно».

Для начала Affectiva полностью обновила код приложения FaceSense, которое впоследствии стало коммерческим приложением Affdex. Дело в том, что технология распознавания образов и другие области искусственного интеллекта слишком изменились с момента создания. Например, искусственные нейронные сети (ИНС) с 1990-х годов были не в чести. Однако в 2006 году вышли две важные статьи Джеффри Хинтона и Руслана Салахутдинова. Авторы предложили ряд серьезных улучшений, после чего ИНС стала одной из передовых технологий в исследовании искусственного интеллекта3. Исследователи представили новые методы создания и обучения многоуровневых нейронных сетей, которые со временем изменят облик многих отраслей промышленности. Новые методы, от распознавания голоса и перевода до поиска изображений и обнаружения мошенничества, стали использоваться практически повсеместно.

Нейросети – моделируемые по образцу человеческого мозга4 – строятся как соединения программных и аппаратных узлов (представляющих синапсы и нейроны) по слоям, которые постепенно улучшают решение для входной информации, например изображения. Некоторые слои скрыты, это значит, что они принимают входную информацию и производят расчеты, а решение передают на следующий слой, где процесс повторяется. В случае распознавания изображений это означает, что каждый последующий слой нейросети считывает признаки более высокого уровня. Наконец результат передается на выходной слой. Слои называются скрытыми, поскольку точно не известно, как происходят вычисления, ведь нейросети постепенно умнеют, используя методы машинного обучения с учителем и без. Определение оптимального количества нейронов, слоев, информации на входе и методов обучения составляет часть проблемы отладки сетей.

В общем, при большем количестве скрытых слоев сеть способна функционировать с большей точностью. (Хотя есть момент, при достижении которого точность начинает падать.) Дилемма стремления к большей точности состоит в том, что чем больше используется нейронов и слоев, тем больше требуется времени для вычислений. К счастью, практически в то же время, когда вышли статьи 2006 года, стали более доступными и дешевыми графические процессоры. С ними удалось на порядок ускорить обучение нейросетей, поскольку сжатие изображений, на которое раньше уходили недели, теперь можно было выполнить за несколько дней или даже часов. Различные подходы улучшили техники глубинного обучения, в том числе ограниченную машину Больцмана и рекуррентную нейронную сеть. Улучшенные алгоритмы глубинного обучения использовались во многих разновидностях распознавания образов. Прогресс в скорости расчетов привел к значительным успехам искусственного интеллекта в течение последнего десятилетия. Например, технология DeepFace, используемая в социальной сети Facebook, способна распознавать человеческие лица с точностью до 97 %. В 2012 году команда ученых Торонтского университета по исследованию искусственного интеллекта, в которую входили Хинтон и двое его студентов, победила в соревновании между исследовательскими группами по широкомасштабному распознаванию образов в базе данных. Их нейросеть на основе глубинного обучения не оставила соперникам ни одного шанса на победу5. Совсем недавно компания Google DeepMind использовала техники глубинного обучения для разработки ИИ, играющего в го, под названием AlphaGo. Программа AlphaGo обучалась самостоятельно при помощи базы данных, в которую были занесены тридцать миллионов записанных ходов из игр уровня эксперта. В марте 2016 года AlphaGo выиграл у гроссмейстера по го мирового уровня Ли Седоля четыре партии из пяти. Игра в го считается более сложной для искусственного интеллекта, чем игра в шахматы. Разработчики ИИ не ожидали игры на таком уровне еще по крайней мере в течение десятилетия.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация