Искусственный интеллект – страница 37 | Мередит Бруссард

«Смелее, я прямо за тобой», – отозвался тот.

Лонг скатился вниз. Спустя 10 секунд Тейер перенес вторую ногу за поручни, собираясь прыгать. Он был в трех метрах над водой. Оттолкнувшись изо всех сил, он прыгнул так далеко, как только мог.

Из двух способов покинуть судно сработал вариант Тейера.

Он выжил, доплыв до ближайшей перевернутой шлюпки и ухватившись за нее вместе с 40 другими пассажирами. Он наблюдал за тем, как «Титаник» переломился пополам, как нос и задняя часть ушли под воду среди обломков. Тейер слышал крики людей. «Похоже на цикад», – подумал он. Наконец, шлюпка № 12 подобрала Тейера и других из ледяной воды. Помощь прибыла спустя несколько часов. До 8:30 утра, пока их не спасла «Карпатия», Тейер дрожал от холода в шлюпке.

Тейер и Лонг были молодыми людьми, одного возраста, со схожими физическими данными, примерно одинакового социального статуса и абсолютно равной возможностью выжить. Разница сказалась в момент прыжка. Тейер прыгнул так далеко от судна, как только мог; Лонг нырнул прямо рядом с кораблем. Лонга затянуло в водоворот, Тейера – нет. Меня смущает другое: что бы ни прогнозировал компьютер относительно будущего Тейера и Лонга, он все равно ошибется. Его прогноз основывается на данных о классе пассажиров, возрасте и поле – но значение имело не это, а разница в прыжках. Компьютер просто в принципе не думает. Случайная смерть Лонга показывает, что прогнозы относительно выживших на «Титанике» никогда не окажутся точными на 100 % и ни один статистический прогноз не будет точен на 100 %, потому что человеческие существа никогда не станут статистикой.

Это подтверждает принцип неоправданной эффективности данных. Пока вас не беспокоит потенциальная дискриминация и беспорядок, кажется, что ИИ работает превосходно. Одной из моих любимых работ, посвященных объяснению мира с точки зрения информатики, является статья исследователей Google Алона Халеви, Питера Норвига и Фернандо Перейра. Они пишут:

В статье «Неоправданная эффективность математики в естественных науках» Юджин Вагнер объясняет, почему многие физические явления можно легко объяснить математическими формулами f = ma или e = mc^-62. Тем временем направления науки, так или иначе подразумевающие взаимодействие с человеческими существами, а не с элементарными частицами, считаются менее ясными с точки зрения математики. Экономисты завидуют физикам, поскольку не могут с легкостью моделировать человеческое поведение. Неформальная, неполная грамматика английского языка занимает примерно 1700 страниц. Возможно, в случае с обработкой естественных языков и смежными областями знаний мы вынуждены мириться со сложными теориями и никогда не сможем приблизиться к простоте физических формул. И в таком случае нам нужно перестать поступать так, будто мы действительно собираемся разработать исключительно точные теории, и вместо этого стоит признать сложность мира и воспользоваться тем, что у нас есть: неоправданной эффективностью данных^[101].

Данные неоправданно эффективны – звучит интригующе и точно. Это объясняет, почему мы можем создать классификатор, способный с точностью 97 % предсказать смерть пассажиров «Титаника», и почему компьютер может обыграть чемпиона по го. Это также объясняет, почему, когда мы обращаем внимание на то, что именно происходит в момент обучения компьютера, мы понимаем, что машина не учитывает множества случайностей, которые происходят в случае реальных катастроф. Данные действительно эффективны. Однако подход, основанный на данных, не учитывает множества факторов, которые – по мнению людей – оказываются значительными.

Закон и общество пытаются вместить все, что люди узнали о материальном мире. Решения, основанные на данных, редко вписываются в эту сложную систему правил. Бессмысленность данных мы можем наблюдать в случае машинного перевода, голосовых помощников и распознавания рукописей. Слова и их комбинации компьютер не понимает так, как их понимает человек. Поэтому статистические методы распознавания речи и машинного перевода полагаются на вероятности и огромные массивы данных коротких последовательностей слов, или N-граммы. Десятилетиями лучшие умы компании Google работали над этим, им удалось собрать больше данных, чем кому-либо. Архив Google, архив The New York Times, все поисковые запросы, когда-либо заданные системе: в итоге получается, что, когда все это соединяется воедино и вырабатывается зависимость частоты появления тех или иных слов в комбинации, мы имеем дело с неоправданной эффективностью данных. Рассмотрим что-нибудь простое. В N-граммах слово «лодка», скорее всего, появится рядом со словом «вода», а не с электрокаром или лесным клопом, поэтому поисковик соединяет термины и файлы, связанные с лодками и водой, а не с водой и клопами. Люди обычно говорят об одних и тех же вещах, ищут одно и то же, в конце концов, общие знания на то и общие. Машина не учится на самом деле; процесс поисковой обработки попросту вдохновлен человеческим обучением. Если вы когда-нибудь решали математические задачки, вы видели, что это не магия, а всего лишь математика. Компьютеру удастся что-то «понять» достаточно правильно только тогда, когда мы сможем признать, что он в целом «прав», то есть он «поймет», что что-то правильно, на совершенно другом основании.

Принятие социальных решений связано не только с вычислениями, и проблемы будут возникать всегда, когда мы будем использовать только данные там, где нужно обращаться к общественным и ценностным суждениям. Действительно, путешествие 1-м классом на «Титанике» могло повысить шанс на выживание, но неразумно на основе этого развивать модель, согласно которой пассажиры 1-го класса заслуживают получить шанс на выживание в крушении больше тех, кто путешествует 2-м или 3-м классом. На основе этой модели не стоит строить какие-либо предположения. Наша прогностическая модель могла бы пригодиться для того, чтобы объяснить, почему для пассажиров 1-го класса можно было предложить более дешевую страховку, но это абсурд: нельзя наказывать тех, кто недостаточно богат, чтобы путешествовать 1-м классом. Но важнее всего то, что мы должны понимать, что есть вещи, которые машины никогда не смогут понять о людях, поэтому будут всегда востребованы человеческие: суждение, подтверждение и интерпретация.

8
Эта машина сама не поедет

Массивы неоправданно эффективных данных хорошо работают применительно к электронному поиску, простому переводу и навигации. И при достаточном объеме обучающих данных алгоритмы действительно могут неплохо справляться с разными повседневными задачами, в то время как человеческая смекалка помогает заполнить «пробелы» ИИ. Благодаря поисковикам мы научились использовать как сложные комплексные запросы, так и конкретные термины (или их синонимы), что позволяет нам при помощи строки поиска находить определенные веб-страницы. Машинный перевод между языками сегодня развит лучше, чем когда-либо. Он, конечно, не так хорош, как человеческий, однако человеческий мозг превосходно справляется с интерпретациями значений и искаженных сентенций. Обычного пользователя вполне удовлетворяет высокопарный, неуклюжий машинный перевод веб-страниц. Системы GPS, помогающие добраться из пункта А в пункт Б, невероятно удобны. Если спросить любого профессионального таксиста или водителя-попутчика, они скажут, что GPS не предлагают наилучший путь в аэропорт, но способны довести вас в нужное место и проинформировать о загруженности на дорогах.

Книга Искусственный интеллект, страница 37 – Мередит Бруссард

Онлайн книга «Искусственный интеллект»