Книга Когнитивная психология, страница 183. Автор книги Роберт Солсо

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Когнитивная психология»

Cтраница 183

Когнитивная психология

Рис. 16.8. Программа NETtalk читает вслух: она переводит буквы в фонемы. Каждая единица-буква посылает сигналы через имеющий определенный вес связи ко всем «скрытым» единицам; если общий сигнал, достигающий скрытой единицы, превышает некоторый порог, единица генерирует разряд, посылая сигналы к единицам-фонемам. Информация на выходе — фонема, которая получает самый сильный общий сигнал. Когда «преподаватель» говорит программе NETtalk, что она допустила ошибку — здесь она только что прочитала m вместо n, — она исправляет ошибку, регулируя все веса связей согласно определенному алгоритму научения. Источник: Heppenheimer, 1988


После нескольких попыток NETtalk заметно улучшает свою работу. Седжновски сообщает:


Мы оставили ее работать на всю ночь. Сначала она выдавала непрерывный поток бессмысленных звуков. Это были лишь предположения; она еще не научилась связывать фонемы с буквами. Со временем она стала распознавать согласные и гласные. Затем она обнаружила, что между словами были пробелы. Теперь поток звука разбивался на короткие порывы, разделенные этими пробелами. На исходе ночи она читала довольно понятно, правильно произнося приблизительно 92% букв (цит. по: Heppenheimer, 1988).

Практическое значение этих систем очевидно; менее очевиден, но в конечном счете более важен концептуальный прорыв, обеспеченный моделями нейронных сетей.


Когнитивная психология

Терри Седжновски. Разработанные им нейронные сети содержали скрытый слой, который соответствует промежуточным нейронам

Как признают Седжновски и другие исследователи, в разговоре между машиной и человеком большое значение имеет контекст. Теперь мы рассмотрим другую важную проблему — проблему значения и искусственного интеллекта.

Значение и искусственный интеллект

Несмотря на то что некоторые из фраз этого компьютера достаточно хороши, чтобы обманывать кого-то некоторое время, он не способен обманывать всех и постоянно. Компьютеры терпят неудачу не из-за недостатка памяти на слова — она почти неограниченна, и не из-за недостаточной способности генерировать значимые предложения — она весьма обширна, и не из-за плохого произношения букв — оно вполне приемлемо, а из-за того, что они недостаточно понимают используемый язык.

На ранних этапах развития ИИ многие думали, что компьютеры смогут оказать значительную помощь при переводе с языка на язык. Просто загрузить в компьютер словарные эквиваленты (например, necklace = «ожерелье», cloth = «сукно», pocketbook = «записная книжка», pink = «розовый» и т. д.), ввести один язык и получить на выходе другой. Однако, даже если делать перевод один к одному в контексте синтаксической информации, результаты получаются довольно странные. Например, когда пассаж из Библии (возможно, апокрифический) The spirit is willing, but the flesh is weak («Стремится дух, да плоть слаба») перевели на русский язык, а затем обратно на английский, то получилось следующее: «Вино было приятным, но мясо протухло».

Опыт использования подобных примитивных программ перевода и развитие психолингвистики изменили наше представление о языке. В предыдущем примере русские и английские слова были эквивалентны и синтаксис в обоих языках правилен. Но смысл двух предложений получился разным. Любой язык ограничен различными правилами, определяющими последовательность грамматических компонентов и значение всей последовательности. Сложные отношения внутри языка требуют тщательного анализа. Компьютерный анализ процессов естественного языка выражается в разработке систем, способных «понимать» язык. Были созданы довольно сложные «понимающие» программы, основанные на концептуальной базе языка. Эти программы могли анализировать как контекст рассуждения, так и значение слов, а в некоторых случаях и «знания о мире» (Т. Виноград). Анализатор синтаксиса определяет наиболее вероятный синтаксический разбор и интерпретацию предложения.

Способность первых языковых систем подражать человеческому разговору была ограничена в связи с недостатком знаний о мире и неспособностью делать выводы. В речи людей то, что не говорится, столь же важно для эффективного сообщения, как и то, что произносится вслух. В разумной человеческой деятельности присутствуют все виды умозаключений — и не только при обработке языка, но и при других видах деятельности, таких как зрительное восприятие. Нам не обязательно видеть частично скрытый объект полностью, чтобы заключить, что он существует целиком. Даже частичных и вторичных признаков достаточно для запуска целой серии ответных реакций: если я иду через лес, зная, что в нем водятся ядовитые змеи, то звука шуршащих листьев достаточно, чтобы я замер на месте.

Еще один аспект понимания привлек внимание исследователей ИИ — это понятие об «убеждениях». Рассмотрим следующий пример:


Вчера я вернулся домой после 2 часов ночи.

Ну, приятель, и задала же мне жена!

Будет справедливо заключить, что большинство людей понимают — то, что задала эта жена своему мужу, вовсе не было задачкой на вычитание. Ничего, что этот вывод может быть абсолютно неверен. (Например, муж мог работать допоздна в своей лаборатории и только что открыть средство от рака, которое принесло бы его семье славу и деньги; или он мог прийти домой слишком рано!) Мы говорим о том, что большинство людей понимают из этой простой истории и чего не понимают компьютерные программы. Чтобы программа поняла эту историю, нужна не только обширная память на идиомы (а иначе как понять выражение «задала мне»), но также некоторое представление о приходах и уходах мужей и о том, каковы убеждения и отношения жен к таким выходкам.

Непрерывное распознавание речи

Системы непрерывного распознавания речи (НРР) — это программы, которые распознают и регистрируют естественную речь. Внешне система НРР кажется достаточно простой для конструирования. В конце концов, большинство людей и некоторые животные распознают и регистрируют определенный тип речи. Однако эта задача крайне сложна по упомянутым выше причинам. Рассмотрим хотя бы проблему, связанную с омофонами, — словами, которые звучат одинаково, но имеют различное значение, например arm («рука») — конечность, прикрепленная к торсу, и arm («оружие») — то, что вы производите, чтобы защитить себя от полуночного злоумышленника. В предложении: Jeff armed himself in the event of an emergency («Джеф вооружился на крайний случай») слово armed означает, что Джеф обзавелся определенным видом оружия. Однако, если вы знаете Джефа, а также то, что в результате несчастного случая он потерял обе руки и теперь пользуется протезами, которые он надевает в крайнем случае, например при пожаре, вы так же знаете, что armed означает, что он надел свою искусственную руку. Как бы система НРР разобралась с этим паттерном речи? Большинство программ работает на основе статистической вероятности и ограниченного синтаксического контекста и, таким образом, неверно истолковали бы смысл предложения. Однако постепенно создаются все более сложные программы, которые учитывают контекст и задействуют «знания о мире».

Вход
Поиск по сайту
Ищем:
Календарь
Навигация